后端小白推荐系统探索

推荐系统的知识技能

工程技能

基础理论

算法

如何搭建一个推荐系统

内容的标准化处理

    以文本内容举例:需要内容分类、主题提取、关键词提取、打标签等

用户数据处理

    收集包括行为数据、位置数据、用户属性数据。
    用户特征挖掘,结合自己的业务,挖掘业务领域内需要的特征。
    还可以根据用户的所有数据挖掘用户的兴趣点。
    

生成推荐数据

    根据以上两个数据预测。

效果验证

    产品设计之初,就要有对比测试的思路(业界称为ABTest)。
    算法优化的过程是:“数据分析发现问题、合理假设、设计实验、实现、数据分析、得出结论或新的假设”,不断循环反复。

    

如何提取特征

如何提取内容的特征

如何提取用户的特征

特征提取的算法有哪些?

特征提取的工具包有哪些?

用户画像

如何给用户打标签

用户标签的权重

用户兴趣衰减

标签体系

三层标签体系

    分类-主题-关键词

标签的粒度

标签的分类

第一类是**人口属性**,这一类标签比较稳定,一旦建立很长一段时间基本不用更新,标签体系也比较固定;

第二类是**兴趣属性**,这类标签随时间变化很快,标签有很强的时效性,标签体系也不固定;

第三类是**地理属性**,这一类标签的时效性跨度很大,如GPS轨迹标签需要做到实时更新,而常住地标签一般可以几个月不用更新,挖掘的方法和前面两类也大有不同

对比测试A/B Test


参考

    [如何成为一名推荐系统工程师(推荐系统需要掌握的知识体系)](https://cloud.tencent.com/developer/article/1143135)
   
    [如何搭建一套个性化推荐系统?(理论步骤,不包含实操)](https://blog.csdn.net/lsj960922/article/details/79229937)
    
    [文本聚类(特征提取)](https://www.jianshu.com/p/2aaf1a94b7d6)
    
    [文本标签提取算法](https://blog.csdn.net/lb521200200/article/details/53648879)
    
    [文本特征提取方法研究](https://cloud.tencent.com/developer/article/1057788)
    
    [如何设计用户画像的标签体系?](https://www.shujike.com/blog/2599)
    
    [如何从文本中构建用户画像](https://cloud.tencent.com/developer/article/1092075)
    
    [干货请收好:终于有人把用户画像的流程、方法讲明白了](https://mp.weixin.qq.com/s/dBrksCqoftlm0Zy_5ATvtg)
    
    [用户画像之标签权重算法](https://zhuanlan.zhihu.com/p/27828271)

评论

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

这个站点使用 Akismet 来减少垃圾评论。了解你的评论数据如何被处理