简介
场景将应用机器学习PAI平台,领导您搭建一个基于协同过滤算法的商品举荐零碎。
背景常识
数据挖掘的一个经典案例就是尿布与啤酒的例子。尿布与啤酒看似息息相关的两种产品,然而当超市将两种产品放到相邻货架销售的时候,会大大提高两者销量。很多时候看似不相干的两种产品,却会存在这某种神秘的隐含关系,获取这种关系将会对进步销售额起到推动作用,然而有时这种关联是很难通过教训剖析失去的。这时候咱们须要借助数据挖掘中的常见算法-协同过滤来实现。这种算法能够帮忙咱们开掘人与人以及商品与商品的关联关系。
协同过滤算法是一种基于关联规定的算法。以购物行为为例,如果用户甲和用户乙都购买了商品A和商品B,则能够假设用户甲和用户乙的购物品尝类似。当用户甲购买了商品C,而用户乙未购买时,能够将商品C举荐给用户乙,这就是经典的User-Based,即以User的个性为关联。
开明机器学习PAI服务
1, 应用阿里云账号登录阿里云官网。
- 在顶部的导航栏,顺次将鼠标悬停到产品>人工智能处,而后单击机器学习平台PAI。
3.在机器学习PAI控制台首页,单击立刻开明。
创立PAI Studio我的项目
1.在控制台左侧导航栏,单击可视化建模(Studio)。
2.在PAI Studio页面单击创立我的项目。
- 在右侧弹出的创立我的项目页面,MaxCompute抉择按量付费,填入项目名称,而后单击确定。
PAI Studio底层计算依赖MaxCompute,如果您未开通过以后区域的MaxCompute,请依照页面提醒去购买。
创立试验
1.单击左侧导航栏的首页。
2.在模板列表找到【举荐算法】商品举荐,而后单击从模板创立。
查看试验数据
1.右键单击cf_训练_data节点,而后单击查看数据。
源数据的字段解释如下:
user_id 用户编号 STRING 购物的用户ID。
item_id 物品编号 STRING 被购买物品的编号。
active_type 购物行为 STRING 0:示意点击。1:示意购买。2:示意珍藏。3:示意退出购物车。
active_date 购物工夫 STRING 购物产生的工夫。
能够看到训练数据为7月份以前的用户购买行为数据。
2.右键单击cf_后果_data,而后单击查看数据。
能够看到后果数据为7月份当前的用户购买行为数据。
运行试验
1.单击左上角运行。
- 请急躁等到3~5分钟,试验运行实现如下所示。
查看试验后果
1.右键单击join-1节点,而后单击查看数据。
表中similar_item字段为通过协同过滤算法计算得出的该用户购买可能性最大的商品。
- 单击全表统计-1节点,而后单击查看数据。
表1统计了依据协同过滤算法举荐的商品数量,共有18065个商品可举荐。
3.单击全表统计-2节点,而后单击查看数据。
表2统计了7月份实在购买行为数据中与通过协同过滤算法所举荐的商品的命中数量,能够看到有60个举荐的商品被购买。