亚马逊的 CEO Jeff Bezos 已经说过,他的幻想是“如果我有 100 万个用户,我就要为他们做 100 万个亚马逊网站”。而智能举荐零碎的呈现,就是为了实现这个幻想,智能举荐零碎解决的是一个信息比对的问题,怎么样基于用户的信息和商品的信息去做一个更好的匹配,为每一个用户实现个性化的举荐后果,这是举荐零碎要解决的问题。从“千人一面”到“千人千面”,这个世界因智能举荐零碎变得更人性化、更丰盛、更美妙。
举荐零碎 = 举荐算法 + 系统工程
《个性化举荐零碎开发指南》这本电子书基于 PAI 构建企业级举荐零碎,从举荐算法开始,到系统工程问题解说,教你构建一个残缺的举荐零碎。
目录
什么是举荐零碎
随同着互联网利用的倒退,人们能够涉猎到更多的资讯。比如说进入到一个淘宝的平台,有十分多的商品,如何将适宜用户的商品去触达他,是淘宝须要解决的一个问题。实质上,举荐零碎解决的是一个信息比对的问题。怎么样基于用户的信息和商品的信息去做一个更好的匹配,这是举荐零碎要解决的问题。
常见的举荐业务场景有两个。一个是 基于搜寻 Query 的举荐 ,比如说,在淘宝平台购买一件商品,Query 举荐要基于用户的购买偏好,还有商品的属性去做一个匹配。另一个是 基于用户和商品属性的 Feed 流的举荐,咱们采纳机器学习举荐模型,它既要学习用户,也要学习商品的属性。
举荐零碎召回算法
召回算法的作用是从海量待举荐对象中抽选出待排序的候选集。
上面是目前比拟风行的 4 个算法。
- 协同过滤:基于统计的形式找到类似的 item 关联关系以及 user-item 的关联关系
- GraphSage:图神经网络召回算法,基于深度学习框架构建的图算法。能够基于用户和商品特色及行为产出 user embedding 和 item embedding。
举荐零碎排序算法
排序算法的作用是针对举荐的候选集进行用户趣味从强到弱的排序,通常应用机器学习畛域的二分类算法解决该问题。
目前比拟经典的排序算法是上面列的这 4 种。
- 一、逻辑回归是利用十分宽泛的一种算法。它是目前业内最经典的线性二分类算法,特点是容易上手,对于计算力要求低,模型可解释性好。
- 二,FM 算法近一两年来,在很多客户的场景中都失去大规模的利用,成果也不错。它是通过内积的形式加强特色的表现力。
举荐零碎线上服务编排
1、业务场景:客户业务潮汐效应很显著,业务顶峰根本集中在中午和早晨。
2、计划:基于高扩大弹性业务场景,采纳阿里云 ACK 构建整体推理架构。
3、调用流程:
- 多路召回:物品协同过滤,语义召回,热门及经营策略召回取回上千条候选集。
- 曝光去重:基于该用户浏览历史,去掉曾经曝光内容,去掉基于经营策略不能举荐的内容(敏感内容)。
- 排序:推理模块调用排序过程时依据用户 id 及物料 id,获取用户特色及物料特色(Redis)后,分批调用 PAI-EAS 服务返回排序后果。
作者介绍
阿里云人工智能产品专家 傲海,长期从事人工智能平台产品能力建设和商业化业务。随同阿里云机器学习 PAI 平台从零起步,逐步成为 IDC、Forrester 认证的国内当先的商业化人工智能平台之一。《机器学习实际利用》书作者,阿里云大学讲师。
原文链接
本文为阿里云原创内容,未经容许不得转载。