乐趣区

关于算法:推荐系统入门之使用协同过滤实现商品推荐

简介

场景将应用机器学习 PAI 平台,领导您搭建一个基于协同过滤算法的商品举荐零碎。

背景常识

数据挖掘的一个经典案例就是尿布与啤酒的例子。尿布与啤酒看似息息相关的两种产品,然而当超市将两种产品放到相邻货架销售的时候,会大大提高两者销量。很多时候看似不相干的两种产品,却会存在这某种神秘的隐含关系,获取这种关系将会对进步销售额起到推动作用,然而有时这种关联是很难通过教训剖析失去的。这时候咱们须要借助数据挖掘中的常见算法 - 协同过滤来实现。这种算法能够帮忙咱们开掘人与人以及商品与商品的关联关系。

协同过滤算法是一种基于关联规定的算法。以购物行为为例,如果用户甲和用户乙都购买了商品 A 和商品 B,则能够假设用户甲和用户乙的购物品尝类似。当用户甲购买了商品 C,而用户乙未购买时,能够将商品 C 举荐给用户乙,这就是经典的 User-Based,即以 User 的个性为关联。

开明机器学习 PAI 服务

1,应用阿里云账号登录阿里云官网。

  1. 在顶部的导航栏,顺次将鼠标悬停到产品 > 人工智能处,而后单击机器学习平台 PAI。

3. 在机器学习 PAI 控制台首页,单击立刻开明。

创立 PAI Studio 我的项目

1. 在控制台左侧导航栏,单击可视化建模(Studio)。

2. 在 PAI Studio 页面单击创立我的项目。

  1. 在右侧弹出的创立我的项目页面,MaxCompute 抉择按量付费,填入项目名称,而后单击确定。

PAI Studio 底层计算依赖 MaxCompute,如果您未开通过以后区域的 MaxCompute,请依照页面提醒去购买。

创立试验

1. 单击左侧导航栏的首页。

2. 在模板列表找到【举荐算法】商品举荐,而后单击从模板创立。

查看试验数据

1. 右键单击 cf_训练_data 节点,而后单击查看数据。


源数据的字段解释如下:
user_id 用户编号 STRING 购物的用户 ID。
item_id 物品编号 STRING 被购买物品的编号。
active_type 购物行为 STRING 0:示意点击。1:示意购买。2:示意珍藏。3:示意退出购物车。
active_date 购物工夫 STRING 购物产生的工夫。
能够看到训练数据为 7 月份以前的用户购买行为数据。

2. 右键单击 cf_后果_data,而后单击查看数据。

能够看到后果数据为 7 月份当前的用户购买行为数据。

运行试验

1. 单击左上角运行。

  1. 请急躁等到 3~5 分钟,试验运行实现如下所示。

查看试验后果

1. 右键单击 join- 1 节点,而后单击查看数据。

表中 similar_item 字段为通过协同过滤算法计算得出的该用户购买可能性最大的商品。

  1. 单击全表统计 - 1 节点,而后单击查看数据。


表 1 统计了依据协同过滤算法举荐的商品数量,共有 18065 个商品可举荐。

3. 单击全表统计 - 2 节点,而后单击查看数据。

表 2 统计了 7 月份实在购买行为数据中与通过协同过滤算法所举荐的商品的命中数量,能够看到有 60 个举荐的商品被购买。

退出移动版