关于后端:文娱行业搜索最佳实践

3次阅读

共计 1589 个字符,预计需要花费 4 分钟才能阅读完成。

简介:本文将具体介绍如何通过“凋谢搜寻(OpenSearch)内容增强版“在娱乐垂类场景的利用,晋升用户搜寻体验,带来更多的业务转化内容搜寻的价值次要体现在两个方面:对用户而言,用户将搜寻作为寻找内容的工具,指标是“搜的到,搜的准”。用户更关怀搜寻后果的相关性、时效性和多样性。对平台而言,搜寻是内容生产、流量疏导的外围入口,指标是晋升用户满意度与留存率。更进一步,搜寻还能反对平台的宣发和商业价值,实现业务增长与流量变现。常见娱乐搜寻场景新闻、资讯搜寻社区、论坛、话题搜寻影音娱乐搜寻在线浏览小说、网漫、文章搜寻图像、视频搜寻娱乐搜寻业务特点搜寻成果需保障时效性和个性化波及多频道、多类别,内容笼罩宽泛,须要精准了解用户搜寻用意热搜、下拉提醒等搜寻疏导性能流量占比高可能有文字、语音、图像、视频综合的多模态搜寻需要搜寻痛点用户用词标准水平参差不齐,文本内容简单,用户用意了解要求高内容垂类非凡,须要行业数据积攒,分词和查问剖析难度大千人千面的的个性化搜寻,须要 5 人以上的算法团队继续投入,老本高,周期长业务导向性差,无奈通过搜寻实现付费内容疏导凋谢搜寻内容娱乐增强版解决方案内容娱乐行业分词模型对于内容娱乐行业,OpenSearch 会集多个相干数据起源,利用千万级数据训练了行业增强版分词模型。针对更加非凡的垂类业务场景,在原有分词算法模型根底上,反对基于业务数据的定制分词模型,提供专属文本分词器。文本通用版内容娱乐版拜仁或将签下凯恩以接替莱万拜仁 或 将 签 下 凯恩 以 接替 莱 万拜仁 或 将 签 下 凯恩 以 接替 莱万夜兰配队夜 兰 配 队夜兰 配 队复联 4 高燃局面复 联 4 高燃 局面复联 4 高燃 局面彭昱畅和江疏影演情侣彭昱 畅和 江疏影 演 情侣彭 昱畅 和 江 疏影 演 情侣 内容娱乐行业向量模型相比传统文本搜寻通过分词、同义词、纠错、词权重等算法技术加强语义搜寻成果,基于深度学习的语义向量召回模型具备更弱小的表征能力,能够更好地解决用户查问词中的简写、别名、拼写错误等状况。

凋谢搜寻 OpenSearch 和阿里达摩院单干自研的向量召回技术,在业界出名榜单 MS MARCO 上夺冠。联合娱乐行业数据训练的向量召回模型目前已在 OpenSearch 对客户透出。query 詹姆士绝杀向量召回 TOP 1 詹姆斯绝杀向量召回 TOP 2 詹姆斯不是绝杀?向量召回 TOP 3 对于詹姆斯绝杀球 query 佐鸣向量召回 TOP 1 鸣佐终局向量召回 TOP 2 鸣人喜爱佐助哪点向量召回 TOP 3 鸣人和佐助谁更强?内容娱乐行业 CTR 排序模型针对内容娱乐行业往往个性化诉求和实时性需要较高。比方不同用户兴趣爱好的疏导、以及当天的热点事件疏导。CTR 预估模型充沛联合行业特点,保障搜寻个性化建模和内容实时性。整体网络框架如下:

CTR 预估模型能够依据客户特点和诉求做对应模型定制和链路定制,以达到更优业务转化成果。球鞋爱好者搜:科比粉丝搜:科比 8.24 当天搜:科比科比那些年穿过的球鞋科比 10 佳投篮精彩霎时球迷致敬科比科比同款球鞋体验科比的一天科比头像科比 8 球鞋评测巅峰科比实力到底有多强?科比永远的 MVP 案例实际某娱乐资讯平台,原自建搜寻存在搜不准,跳出率较低等问题,间接影响用户体验和用户粘性。通过接入凋谢搜寻 OpenSearch 15 天疾速实现搜寻成果各项指标的晋升。PV-CTR 晋升超过 10%,UV-CTR 晋升超过 5%,有点击 PV 占比晋升超过 5% 具备语义向量模型能力,针对长文本简单关键词也可精确返回语义相干文档个性化排序模型,反对千人千面的搜寻后果展现填写问卷享凋谢搜寻产品首月 1 元试用:https://page.aliyun.com/form/… 如果你想与更多开发者们进行交换、理解最前沿的搜寻与举荐技术,能够钉钉扫码退出社群

 原文链接:https://click.aliyun.com/m/10… 本文为阿里云原创内容,未经容许不得转载。

正文完
 0