推荐系统的知识技能
工程技能
基础理论
算法
如何搭建一个推荐系统
内容的标准化处理
以文本内容举例:需要内容分类、主题提取、关键词提取、打标签等
用户数据处理
收集包括行为数据、位置数据、用户属性数据。用户特征挖掘,结合自己的业务,挖掘业务领域内需要的特征。还可以根据用户的所有数据挖掘用户的兴趣点。
生成推荐数据
根据以上两个数据预测。
效果验证
产品设计之初,就要有对比测试的思路(业界称为 ABTest)。算法优化的过程是:“数据分析发现问题、合理假设、设计实验、实现、数据分析、得出结论或新的假设”,不断循环反复。
如何提取特征
如何提取内容的特征
如何提取用户的特征
特征提取的算法有哪些?
特征提取的工具包有哪些?
用户画像
如何给用户打标签
用户标签的权重
用户兴趣衰减
标签体系
三层标签体系
分类 - 主题 - 关键词
标签的粒度
标签的分类
第一类是 ** 人口属性 **,这一类标签比较稳定,一旦建立很长一段时间基本不用更新,标签体系也比较固定;第二类是 ** 兴趣属性 **,这类标签随时间变化很快,标签有很强的时效性,标签体系也不固定;第三类是 ** 地理属性 **,这一类标签的时效性跨度很大,如 GPS 轨迹标签需要做到实时更新,而常住地标签一般可以几个月不用更新,挖掘的方法和前面两类也大有不同
对比测试 A /B Test
参考
[如何成为一名推荐系统工程师(推荐系统需要掌握的知识体系)](https://cloud.tencent.com/developer/article/1143135)
[如何搭建一套个性化推荐系统?( 理论步骤,不包含实操)](https://blog.csdn.net/lsj960922/article/details/79229937)
[文本聚类(特征提取)](https://www.jianshu.com/p/2aaf1a94b7d6)
[文本标签提取算法](https://blog.csdn.net/lb521200200/article/details/53648879)
[文本特征提取方法研究](https://cloud.tencent.com/developer/article/1057788)
[如何设计用户画像的标签体系?](https://www.shujike.com/blog/2599)
[如何从文本中构建用户画像](https://cloud.tencent.com/developer/article/1092075)
[干货请收好:终于有人把用户画像的流程、方法讲明白了](https://mp.weixin.qq.com/s/dBrksCqoftlm0Zy_5ATvtg)
[用户画像之标签权重算法](https://zhuanlan.zhihu.com/p/27828271)