LOGO

管雷鸣

技术总监 | Java

文章关键词提取, 阿里云,机器学习PAI,开通及建立实验步骤

阿里云机器学习控制台   https://data.aliyun.com/console/learn


1504172206121071146.png

左侧菜单-大数据(数加)-机器学习-创建项目

机器学习需要(大)数据的支撑、调试或训练


1504172442190054010.png

自动过进入 大数据开发套件 中,点击又上的“创建项目”按钮


1504172642820089230.png

填写完毕后,确定,创建项目


导入数据

1504173029939052373.png

创建完毕后,找到创建的项目,点击右侧“进入工作区”


1504173369694021942.png

再通过上方菜单,进入“数据集成”,来导入数据,进行实验


1504173574957064870.png

需要注意的是,右上方的项目的名字,确认好是当前创建的项目

将自己的Mysql数据库同步到云端 MaxCompute ,以此数据用来创建实验


1504173829185083782.png

测试联通性成功后,确定,添加数据源


1504174177803039754.png

添加完毕后,找到刚添加完毕的数据元,点击“整库迁移”,将我们自己Mysql上的数据,迁移到MaxCompute


1504184979243022803.png

选中要同步到云端的文章表 跟 文章内容分表,提交任务


1504185113914051999.png

执行成功!数据导入云端完毕。


机器学习

回到阿里云控制台

1504185813400099502.png

找到左侧菜单的机器学习-找到建立的项目,“进入机器学习”


1504226247399079431.png

首页-新建空白实验


1504226366393028240.png

建立成功后,会自动进入这个实验的控制台,进行实验。


1504436549206094652.png

读数据表news_data,将之前导入MaxCompute 的某个表的数据读出来


QQ截图20170903193930.png



运行后,查看关键词抽取组件的结果:

1504438782915011460.png





2017-08-31