在AI Gallery
数据准备
- 获取样例数据集,“Flowers-Data-Set”数据集中包含了花卉图片及其标注信息。由于数据集中数据较多,推荐使用OBS Browser+工具上传文件,因为需要收费,上传前建议可以去购买obs桶套餐。
- 登录ModelArts管理控制台,在左侧菜单栏中选择“数据管理 > 数据集”。
- 在数据集管理页面,单击“创建数据集”,创建一个“图像分类”类型的数据集。
- 参数填写完成后,单击右下角的“创建”,完成数据集的创建。此时页面将自动跳转至数据集列表中。
- 在数据集列表页面,单击数据集名称,进入数据集概览页,然后单击右上角的“开始标注”,进入数据集详情页。
- 在数据集详情页面中,等待数据同步至ModelArts中。由于数据集已完成标注,无需重新标注,只需等待数据同步即可。由于数据集中数据较多,数据同步需要一些时间,请耐心等待。当“已标注”页签下呈现所有上传数据时,表示数据已完成同步。
- 单击左上角“返回数据集概览”,然后在数据集概览页中,单击右上角的“发布”。
- 在弹出的对话框中,填写“版本名称”,可使用默认值。“训练验证比例”建议设置为“0.8”。然后单击“确定”完成发布。
验证集不参与训练,用于训练过程中评估模型的好坏,验证集比例太大,会导致训练集变少,影响训练效果。验证集太少,可能导致验证的精度不准确。针对此示例,推荐使用0.8比例进行切分。
图2 发布数据集版本
- 在数据集列表页面,等待数据集发布完成。发布过程中的数据集,其名称前面有个运行标记。当数据集发布结束后,其操作列的发布按钮将呈现为蓝色可点击状态。等数据集发布成功后,执行下一步训练模型的操作。
订阅算法
目前“ResNet_v1_50”算法发布在AI Gallery中。在AI Gallery,订阅此模型,然后同步至ModelArts中。
之后单击详情页的“前往控制台”,此时弹出“选择云服务区域”对话框,选择ModelArts对应的区域,然后再单击“确定”,页面将自动跳转至ModelArts的“算法管理>我的订阅”中同步对应的算法。
图3 前往控制台
图4 选择云服务区域
使用订阅算法创建训练作业
算法订阅成功后,算法将呈现在“算法管理>我的订阅”中,之后使用订阅的“ResNet_v1_50”算法创建训练作业,获得模型。
- 进入“算法管理>我的订阅”页面,选择订阅的“ResNet_v1_50”算法,单击左侧的小三角展开算法,在版本列表中,单击“创建训练作业”。
图6 创建训练作业
- 在创建训练作业页面,参考教程填写关键参数。
图7 训练作业参数
图8 资源池设置
- 参数填写完成后,单击“下一步”,根据界面提示完成训练作业创建。
- 进入“训练管理>训练作业”页面,等待训练作业完成。
训练作业运行需要几分钟时间,等待一会,直到状态显示“运行成功”完成。