AzureDeveloper

无需代码经验的机器学习入门第一天 - 训练AutoML 分类模型

分类: Azure机器学习 ◆ 标签: #Azure #人工智能 #机器学习 #AutoML #Azure Machine Learning Studio #设计器 ◆ 发布于: 2023-06-11 22:15:20

真正的大杀器来了！ - Azure Machine Learning Studio!!

我们前面学习过了通过Python AutoML SDK配合Jupyter的来训练回归模型，如果大家没有什么印象，可以通过文章结尾的文章列表重温一下：在这些实例中我们使用了Python代码进行数据预处理，然后使用SDK进行AutoML的模型训练，我们写了很多代码，今天我们来给大家演示如果通过Azure提供的工具无需写任何一行代码仅仅只需要几个小小的配置就能完整一个分类AutoML模型的训练。

那么我们就开始吧。

开始之前，请点击这里下载我们需要的实例数据：https://automlsamplenotebookdata.blob.core.windows.net/automl-sample-notebook-data/bankmarketing_train.csv

使用Studio进行AutoML分类模型训练

在本章所有的训练都无需写任何的代码，这对于非程序是非常友好的，即便是程序员也能使用Studio提供的便利功能大大介绍项目的开发成本，我们在本节中即将做如下的事情：

创建一个Azure Machine Learning的workspace
运行一个Auto ML的experiment
查看experiment运行细节。
部署模型

在开始之前，你至少需要有一个Azure订阅，以及从这里下载一个预先准备好的数据文件https://automlsamplenotebookdata.blob.core.windows.net/automl-sample-notebook-data/bankmarketing_train.csv

创建`Azure Machine Learning`的workspace

创建Azure Machine Learning的workspace非常直观，只需要登录到Azure的portal, 然后在marketplace里搜索Machine Lerning, 然后按照提示一步一步操作就可以了。

关于如何创建一个workspace, 你可以参考文档https://docs.azure.cn/zh-cn/machine-learning/how-to-manage-workspace?tabs=python

创建完成后，进入到Azure Machine Learning的概要页面，点击Launch Studio启动Azure Machine Learning Studio工具，

启动后，studio的全貌如下图：

下面我们将使用Studio工具进行Auto ML 分类模型训练

创建数据集(DataSet)

在之前的文章中我们已经学习过了Azure ML基本的数据处理概念和工具，在Azure ML中使用Store和DataSet来表示数据处理概念和工具。在我们使用Python SDK的时候，可以使用代码来创建数据存储(store)和数据集(dataset),然后将dataset 挂载(mount)到用于训练的机器上，代码可以像使用本地文件系统一样来使用存储在Azure Storage Blob里的数据，关于这个部分，您可以从这篇文章来复习一下。本章中我们使用Studio来可视化的创建store和dataset，并应用于Auto ML。

启动Studio之后，选择左侧的菜单数据集,如下图: