共计 2593 个字符,预计需要花费 7 分钟才能阅读完成。
在上周写了一篇“[基于机器学习的银行电话营销客户购买可能性预测剖析]”,那是作为对客户购买可能性预测剖析的第一次验证案例的尝试。明天是基于机器学习的客户购买可能性预测剖析的第二次验证案例:举荐零碎。
举荐零碎
基于热度举荐:由专家或者肯定期间产品销售状况或者主推产品,制作一个排行榜,在没有用户数据的状况下依据排行榜举荐
基于用户特色举荐:通过历史数据,由算法 (机器学习) 依据用户特色进行举荐,在用户数据可能填写一些根本数据的状况下
基于常识举荐:通过用户要求,比如果须要高收益,须要低危险的产品,在数据库对产品进行筛选,而后举荐
基于内容举荐:通过用户曾经购买的产品,举荐内容类似的物品,这里的内容类似是由业余人员提供
协同过滤举荐:通过算法间接计算物品相识度,留神这里的物品类似度不是 2 个物品内容,而是有购买状况来确定的,比如说购买 A(手机)的用户,大多数都购买了 B(手机套),算法计算出 A 与 B 是类似的
一些机器学习举荐:通过以一些机器学习算法,比如说 FM(因式分解机),深度学习,deepfm 等
其中对于新用户通常三选一
对于老用户,通常是应用多种算法,而后加权得出最优的举荐列表
3 种办法验证
在这里次要 3 种办法验证,协同过滤,FM(因式分解机),deepFM。
协同过滤算法
计算所有物品的类似度(留神不是内容类似)
举荐办法:
对用户够买 (或者评估过) 的物品查问相识度,而后加权举荐
简略例子
最终举荐(从左到右)
基于协同过滤展现 对 user=‘1’
Python 打印后果 这里看过的电影只打印前 5 举荐电影只举荐加权后前 10
——WATCHED MOVIES——–
1193 “One Flew Over the Cuckoo’s Nest (1975)” ‘Drama’
2355 “Bug’s Life, A (1998)” “Animation|Children’s|Comedy”
1287 ‘Ben-Hur (1959)’ ‘Action|Adventure|Drama’
2804 ‘Christmas Story, A (1983)’ ‘Comedy|Drama’
595 ‘Beauty and the Beast (1991)’ “Animation|Children’s|Musical”
——RECOMMEND MOVIES——–
1196 ‘Star Wars: Episode V – The Empire Strikes Back (1980)’ ‘Action|Adventure|Drama|Sci-Fi|War’]]
1265 ‘Groundhog Day (1993)’ ‘Comedy|Romance’
364 ‘Lion King, The (1994)’ “Animation|Children’s|Musical”
260 ‘Star Wars: Episode IV – A New Hope (1977)’ ‘Action|Adventure|Fantasy|Sci-Fi’
2571 ‘Matrix, The (1999)’ ‘Action|Sci-Fi|Thriller’
2716 ‘Ghostbusters (1984)’ ‘Comedy|Horror’
1022 ‘Cinderella (1950)’ “Animation|Children’s|Musical”
318 ‘Shawshank Redemption, The (1994)’ ‘Drama’
1282 ‘Fantasia (1940)’ “Animation|Children’s|Musical”
1580 ‘Men in Black (1997)’ ‘Action|Adventure|Comedy|Sci-Fi’
因式分解机算法
评分矩阵是一种反映用户对物品喜爱的矩阵,如下图
因式分解机一种补全评分矩阵的的算法(红色为算法补全),而后依据评分举荐(对用户 1 举荐为物品 3 > 物品 6 > 物品 1 > 物品 4 > 物品 5)
算法解释:通过已知的评分去找到 P 和 Q,K 为暗藏的特色,能够设置不同值
因式分解机算法的成果如下
——RECOMMEND MOVIES——–
318 ‘Shawshank Redemption, The (1994)’
858 ‘Godfather, The (1972)’
1198 ‘Raiders of the Lost Ark (1981)’
50 ‘Usual Suspects, The (1995)’
2858 ‘American Beauty (1999)’
912 ‘Casablanca (1942)’
593 ‘Silence of the Lambs, The (1991)’
750 ‘Dr. Strangelove or: How I Learned to Stop Worrying and Love the Bomb (1963)’
908 ‘North by Northwest (1959)’
1221 ‘Godfather: Part II, The (1974)’
deepFM算法
deepFM 是一种联合 FM 算法和深度学习的算法,构造如下
deepFM 算法的成果如下
——RECOMMEND MOVIES——–
593 ‘Silence of the Lambs, The (1991)’
1617 ‘L.A. Confidential (1997)’
1233 ‘Boat, The (Das Boot) (1981)’
318 ‘Shawshank Redemption, The (1994)’
1198 ‘Raiders of the Lost Ark (1981)’
858 ‘Godfather, The (1972)’
733 ‘Rock, The (1996)’
1276 ‘Cool Hand Luke (1967)’
2571 ‘Matrix, The (1999)’
953 “It’s a Wonderful Life (1946)”
模型评估指标
- 用户满意度
- 预测准确度
- 覆盖率
- 多样性
- 新颖性
- 惊喜度
- 信任度
- 实时性
- 健壮性
- 商业指标
离线试验的指标
最大化预测准确度
在满足肯定要求的状况下
比方
- 覆盖率 >60%
- 多样性 >30%
- 新颖性 >10%
举荐零碎算法总结
- 多种算法实用不同的场景。
- 混合举荐,进步购买率。比如说用户购买手机,依照内容类似,举荐其余的手机;依照协同过滤,举荐手机套等买手机的人也大概率会买的大小;依照评分预计的算法,依据用户举荐可能会购买的啤酒,衣服的。在无限举荐地位,混合举荐,进步成功率。
慧都大数据分析平台,将学习、推理、思考、预测、布局等能力赋予企业数据,让数据驱动决策,发明最高业务价值。