后端小白推荐系统探索

21次阅读

共计 1138 个字符,预计需要花费 3 分钟才能阅读完成。

推荐系统的知识技能

工程技能

基础理论

算法

如何搭建一个推荐系统

内容的标准化处理

    以文本内容举例:需要内容分类、主题提取、关键词提取、打标签等 

用户数据处理

    收集包括行为数据、位置数据、用户属性数据。用户特征挖掘,结合自己的业务,挖掘业务领域内需要的特征。还可以根据用户的所有数据挖掘用户的兴趣点。

生成推荐数据

    根据以上两个数据预测。

效果验证

    产品设计之初,就要有对比测试的思路(业界称为 ABTest)。算法优化的过程是:“数据分析发现问题、合理假设、设计实验、实现、数据分析、得出结论或新的假设”,不断循环反复。

如何提取特征

如何提取内容的特征

如何提取用户的特征

特征提取的算法有哪些?

特征提取的工具包有哪些?

用户画像

如何给用户打标签

用户标签的权重

用户兴趣衰减

标签体系

三层标签体系

    分类 - 主题 - 关键词 

标签的粒度

标签的分类

 第一类是 ** 人口属性 **,这一类标签比较稳定,一旦建立很长一段时间基本不用更新,标签体系也比较固定;第二类是 ** 兴趣属性 **,这类标签随时间变化很快,标签有很强的时效性,标签体系也不固定;第三类是 ** 地理属性 **,这一类标签的时效性跨度很大,如 GPS 轨迹标签需要做到实时更新,而常住地标签一般可以几个月不用更新,挖掘的方法和前面两类也大有不同

对比测试 A /B Test


参考

    [如何成为一名推荐系统工程师(推荐系统需要掌握的知识体系)](https://cloud.tencent.com/developer/article/1143135)
   
    [如何搭建一套个性化推荐系统?( 理论步骤,不包含实操)](https://blog.csdn.net/lsj960922/article/details/79229937)
    
    [文本聚类(特征提取)](https://www.jianshu.com/p/2aaf1a94b7d6)
    
    [文本标签提取算法](https://blog.csdn.net/lb521200200/article/details/53648879)
    
    [文本特征提取方法研究](https://cloud.tencent.com/developer/article/1057788)
    
    [如何设计用户画像的标签体系?](https://www.shujike.com/blog/2599)
    
    [如何从文本中构建用户画像](https://cloud.tencent.com/developer/article/1092075)
    
    [干货请收好:终于有人把用户画像的流程、方法讲明白了](https://mp.weixin.qq.com/s/dBrksCqoftlm0Zy_5ATvtg)
    
    [用户画像之标签权重算法](https://zhuanlan.zhihu.com/p/27828271)

正文完
 0