📢 转载信息
原文作者:Nivedita Kumari
在本文中,您将学习增强的 BigQuery ML UI 如何直接在 BigQuery 控制台中简化端到端的模型创建、管理和预测。
我们将涵盖的主题包括:
- 使用引导式、可保存的 SQL 流程简化模型创建。
- 在 SQL 中准备可重现的训练/评估/预测拆分。
- 使用
ML.PREDICT
运行预测并理解输出。
让我们不要再浪费时间了。

彻底改变 MLOps:增强的 BigQuery ML UI 可实现无缝的模型创建和管理
引言
对于 BigQuery ML (BQML) 用户来说,有个令人振奋的消息。BigQuery ML UI 得到了显著增强,旨在直接在 BigQuery 控制台中简化您的机器学习工作流程。这些增强功能使得在不离开控制台的情况下创建、管理和理解 BigQuery ML 模型变得更加容易。
简化的模型创建流程
更新后的 UI 显著改进了模型创建过程。您现在可以直接在模型创建流程中保存 SQL 查询(请注意:保存查询时必须包含一个区域)。
为了说明这一点,让我们来了解一下增强的 BigQuery ML UI 如何帮助您快速使用美国人口普查人口统计数据创建一个逻辑回归模型,以预测收入阶层($<=50K 或 $>50K)。
您可以通过运行以下查询来探索人口普查数据集:
SELECT age, workclass, marital_status, education_num, occupation, hours_per_week, income_bracket, functional_weight FROM `bigquery-public-data.ml_datasets.census_adult_income` LIMIT 100;

作者供图
查询结果显示,census_adult_income
表中的 income_bracket
列包含两个值之一:<=50K 或 >50K。functional_weight
列是人口普查组织认为某一行代表的个人数量。该列的值似乎与特定行的 income_bracket
值无关。
让我们准备一个用于模型训练的样本数据集。我们将通过派生一个基于 functional_weight
的新列来将数据分为训练集、评估集和预测集。为训练分配 80% 的数据,其余 20% 留作评估和预测。
CREATE OR REPLACE VIEW `census.input_data` AS SELECT age, workclass, marital_status, education_num, occupation, hours_per_week, income_bracket, CASE WHEN MOD(functional_weight, 10) < 8 THEN 'training' WHEN MOD(functional_weight, 10) = 8 THEN 'evaluation' WHEN MOD(functional_weight, 10) = 9 THEN 'prediction' END AS dataframe FROM `bigquery-public-data.ml_datasets.census_adult_income`
在 BigQuery UI 中创建 ML 模型
从 BigQuery 主屏幕,您可以点击“ML 模型”开始模型创建过程。

作者供图
这将打开“创建新的 ML 模型”页面,您可以在其中选择数据集并提供模型名称。对于此示例,选择 census
数据集并将模型命名为 logistic_reg
。

作者供图
接下来,在“创建方法和建模目标”页面上,选择“在 BigQuery 中训练模型”,并将建模目标选择为“分类”。对于“模型选项”,选择“逻辑回归”作为模型类型。然后通过选择 census
作为数据集和 input_data
作为表/视图来设置训练数据。

作者供图
继续进行下一步,您可以调整模型选项并确认训练数据。对于模型选项,选择逻辑回归,对于训练数据,选择 census
作为数据集,input_data
作为 table_view
。

作者供图
最后,选择 income_bracket
作为 input_label_cols
并点击“创建模型”。模型创建后,“查询结果”部分会出现四个选项卡:作业信息、结果、执行详细信息和执行图表。执行详细信息和执行图表选项卡提供了有关模型创建作业的全面信息,包括损失和学习率详细信息。

作者供图

作者供图
使用模型进行预测
现在,在 BigQuery Studio 查询编辑器中使用 ML.PREDICT
函数来使用创建的模型进行预测。此函数需要经过训练的模型(此示例中为 census.logistic_reg
)以及 input_data
视图中 dataframe
列值为 'prediction'
的行。
SELECT * FROM ML.PREDICT (MODEL `census.census_model`, ( SELECT * FROM `census.input_data` WHERE dataframe = 'prediction' ) )

作者供图
此查询将生成 income_bracket
的预测结果,包括预测的阶层、预测概率以及原始输入数据。
总结
这些 UI 增强功能为 BigQuery ML 用户提供了更直观、更高效的体验——从模型创建到部署和监控。请探索新的 BigQuery ML UI,体验简化的 MLOps 工作流程。要了解有关 BigQuery ML 及其功能的更多信息,请查看 BQML UI 用户指南。
今天就开始吧!
🚀 想要体验更好更全面的AI调用?
欢迎使用青云聚合API,约为官网价格的十分之一,支持300+全球最新模型,以及全球各种生图生视频模型,无需翻墙高速稳定,文档丰富,小白也可以简单操作。
评论区