支流电商平台有一个很常见的性能:“猜你喜爱”智能举荐,对用户做了精准画像,算法简单,而一般的我的项目中,因为内容规模无限,便用 ElasticSearch 根本能够实现根底需要
在咱们开发的 店熵SAAS平台(shopfai.com)我的项目中应用了本文中的计划,比较稳定,用户体验还不错。
实现思路:
- 拜访某个商品时,提取此商品的关键词,写入ES 历史关键词(索引名示例:history_keywords)
- 聚合ES 历史关键词 中的所有关键词,提取呈现最多的前几个
- 用提取出这几个关键词再次查问商品,作为“猜你喜爱” 举荐后果
几个外围控制点:
- ES 历史关键词 须要管制总数量,只保留最近拜访的数据,能够用Redis实现一个循环记数器,计数器的值作为ES记录的ID写入,实现ES数据的循环写入,这个数量取多少适合,跟据具体我的项目调整优化,1000亦可,10000亦可,会间接影响举荐后果
- 聚合 ES历史关键词时 ,具体取几个需理论优化调整,咱们我的项目中取了 10 个
- 当用户首次拜访时,尚无历史关键词数据,这时候能够取 “热搜词”(热搜词性能需另外实现)
简化流程图:
外围的 ES 查问语法:
提取商品名称里的关键词:
POST /_analyze{ "tokenizer" : "ik_smart", "text": "商品名称ABC"}
因为不同语言封装办法不同,这里只贴了 原生 诘法,分词器中文用了ik_smart,依据具体情况调整
从历史关键词中提取呈现最多的前几个:
POST /history_keywords{ "size":0, "query":{ "bool":{ "filter":[ { "term":{ "user_id":"123" } } ] } }, "aggs":{ "topN":{ "terms":{ "field":"keyword", "size":10 } } }}
history_keywords 里只有两个字段 用户ID(user_id),关键词(keyword)
最初,用这几个关键词查问商品,代码不贴了。
本文原始网址:https://www.liu12.com/article/es-guess-you-like,转载请保留出处