📢 转载信息
原文作者:Nivedita Kumari
在本文中,您将了解到增强的 BigQuery ML UI 如何直接在 BigQuery 控制台中简化端到端模型创建、管理和预测流程。
我们将涵盖的主题包括:
- 使用引导式、可保存的 SQL 流程简化模型创建。
- 在 SQL 中准备可复现的训练/评估/预测划分。
- 使用
ML.PREDICT运行预测并理解输出。
让我们不要再浪费时间了。
彻底改变 MLOps:增强的 BigQuery ML UI,实现无缝的模型创建和管理
引言
对于 BigQuery ML (BQML) 用户来说,有个令人兴奋的消息。BigQuery ML UI 得到了显著增强,旨在直接在 BigQuery 控制台中简化您的机器学习工作流程。这些增强使得用户无需离开控制台就能更轻松地创建、管理和理解 BigQuery ML 模型。
简化的模型创建流程
更新后的 UI 显着改进了模型创建过程。现在,您可以直接在模型创建流程中保存 SQL 查询(请注意:保存查询时必须包含一个区域)。
为了说明这一点,让我们来看一下增强的 BigQuery ML UI 如何帮助您使用美国人口普查人口统计数据,快速创建一个预测收入等级($<=50K 或 $>50K)的逻辑回归模型。
您可以通过运行以下查询来探索人口普查数据集:
SELECT age, workclass, marital_status, education_num, occupation, hours_per_week, income_bracket, functional_weight FROM `bigquery-public-data.ml_datasets.census_adult_income` LIMIT 100;
作者供图
查询结果显示,census_adult_income 表中的 income_bracket 列包含两个值之一:<=50K 或 >50K。functional_weight 列是人口普查组织认为某一行所代表的人数。该列的值似乎与特定行的 income_bracket 值无关。
让我们准备一个用于模型训练的样本数据集。我们将通过从 functional_weight 派生一个新列来将数据分成训练集、评估集和预测集。分配 80% 的数据用于训练,剩下的 20% 用于评估和预测。
CREATE OR REPLACE VIEW `census.input_data` AS SELECT age, workclass, marital_status, education_num, occupation, hours_per_week, income_bracket, CASE WHEN MOD(functional_weight, 10) < 8 THEN 'training' WHEN MOD(functional_weight, 10) = 8 THEN 'evaluation' WHEN MOD(functional_weight, 10) = 9 THEN 'prediction' END AS dataframe FROM `bigquery-public-data.ml_datasets.census_adult_income`
在 BigQuery UI 中创建 ML 模型
从 BigQuery 主屏幕,您可以点击“ML 模型”开始模型创建过程。
作者供图
这将打开“创建新的 ML 模型”页面,您可以在其中选择数据集并提供模型名称。在本例中,选择 census 数据集并将模型命名为 logistic_reg。
作者供图
接下来,在“创建方法和建模目标”页面上,选择“在 BigQuery 中训练模型”,并将建模目标选择为“分类”。在“模型选项”下,选择“逻辑回归”作为模型类型。然后,通过选择 census 作为数据集和 input_data 作为表/视图来设置训练数据。
作者供图
在继续进行下一步时,您可以调整模型选项并确认训练数据。对于模型选项,选择逻辑回归;对于训练数据,选择 census 作为数据集和 input_data 作为 table_view。
作者供图
最后,选择 income_bracket 作为 input_label_cols 并点击“创建模型”。模型创建后,“查询结果”部分会出现四个选项卡:作业信息、结果、执行详情和执行图。执行详情和执行图选项卡提供了关于模型创建作业的全面信息,包括损失和学习率详情。
作者供图
作者供图
使用模型进行预测
现在,在 BigQuery Studio 查询编辑器中使用 ML.PREDICT 函数来使用已创建的模型进行预测。此函数接受训练好的模型(本例中为 census.logistic_reg)以及 input_data 视图中 dataframe 列值为 'prediction' 的行。
SELECT * FROM ML.PREDICT (MODEL `census.census_model`, ( SELECT * FROM `census.input_data` WHERE dataframe = 'prediction' ) )
作者供图
此查询生成 income_bracket 的预测结果,包括预测的等级、预测概率以及原始输入数据。
总结
这些 UI 增强为 BigQuery ML 用户提供了更直观、更高效的体验——从模型创建到部署和监控。立即探索新的 BigQuery ML UI,体验简化的 MLOps 工作流程。要了解有关 BigQuery ML 及其功能的更多信息,请查看 BQML UI 用户指南。
立即开始吧!
🚀 想要体验更好更全面的AI调用?
欢迎使用青云聚合API,约为官网价格的十分之一,支持300+全球最新模型,以及全球各种生图生视频模型,无需翻墙高速稳定,文档丰富,小白也可以简单操作。
评论区