ag真人娱乐主页 > 新闻中心 >

2张图带你看懂今日头条推荐系统

发布时间: 2019-04-19 12:38  
分享到:

  2016年,腾讯以80亿美元估值投资今日头条,成果大师都晓得,张一鸣拒绝了腾讯的投资,此刻大师也晓得,字节跳动估值750亿美元,这一切,保举体系功不成没。

  查询到用户画像后,保举体系就进入召回关键。它通过多种体例,按照用户画像查询成果“NBA、体育和科技”,从分歧索引数据里得到候选调集。

  人人都是产物司理(是以产物司理、经营为焦点的进修、交换、分享平台,集媒体、培训、社群为一体,全方位办事产物人和经营人,建立8年举办在线+期,线+场,产物司理大会、经营大会20+场,笼盖北上广深杭成都等15个都会,外行业有较高的影响力和出名度。平台堆积了浩繁BAT美团京东滴滴360小米网易等出名互联网公司产物总监和经营总监,他们在这里与你一路发展。

  搜刮引擎的在线部门,担任响使用户的搜刮请求,完成内容的筛选和排序,并将最终成果前往给用户。咱们举一个例子来申明这个流程:

  由于搜刮引擎和保举体系太类似,相对来说也更简略(勿喷),所以咱们先来领会一下搜刮引擎。至于搜素引擎是不是保举体系的前身,我很懒,没有调查。

  对付最月朔步,用户的各类动作举动,在搜刮引擎里,会连续优化排序模子,在保举体系里,还会连续改良本身的画像。

  此时,搜刮引擎的事情还未竣事。搜刮引擎会按照用户的点击反馈去优化排序模子。好比,大部门用户都没有点击文章10,则文章10后续就不会得到更靠前的展示位置。

  接下来,搜刮引擎会通过多种体例从分歧索引数据得到候选集,这个关键叫召回。

  用户在搜刮引擎输入一个环节词NBA,搜刮引擎搜刮会对环节词进行阐发、变换、扩充和纠错等处置,好比发觉美职篮与NBA是同义词,就会将其扩充。

  这个时候,还不克不迭将成果展现给用户,必要颠末法则干涉这一历程。这个历程办事于特定的产物目标。假若有如许一条“官方网站庇护法则,确保所有品牌搜刮词都能够优先前往官网”,则此时就会将官网插入并置顶,最初再将成果展现给用户。

  和搜刮引擎一样,保举体系也必要获取内容。保举体系通过数据库导入、和谈同步和用户提交等体例获取保举内容。区别于搜刮引擎,保举体系获取内容的体例较多,且内容的布局化水平要远胜于搜刮引擎爬虫抓取的内容。

  在召回完成后,和搜刮引擎一样,保举体系依照预约预估方针对候选集进行排序。

  接下来,就是保举体系的在线部门了。天啊,看到上图,发觉保举体系真的和搜刮引擎太像了,就多了一笔。

  简略来说,搜刮引擎的离线部门,专一于内容的汇集和处置。搜刮引擎通过收集爬虫抓取网站上的原始内容,并将内容成立索引。这些内容会按照搜刮体系的分歧要求成立分歧的索引系统,好比旧事类型的内容,会成立时效性的索引数据。

  搜刮引擎的输入为用户的搜刮环节词,保举体系同样必要输入,只是这个历程用户没有感知,对保举体系来说,它的输入为场景消息,好比时间、地址和设施等。

  保举体系也必要将待保举的内容进行索引化处置,这一点与搜刮引擎较为类似。保举体系的维度会更多。

  通过上“一”张图,咱们大白了搜刮引擎的道理(无论如何我城市装作你看懂了),而今日头条的这张图,就是比上图上多了一笔,思量到这两张图高度类似,我这么懒的人,当然是不会去画的了,你们阐扬想象吧。

  搜刮引擎得到输入后,会进行环节词处置,对付保举体系来说,会进行用户画像查询。这个案例中,保举体系领会到,该用户在实体词维度,对NBA感乐趣,在分类维度,对体育和科技感乐趣。

  因为我保举体系的课程还未竣事,先不展开这部门内容了。后面博客会对上文进行展开,有乐趣的同窗,接待关心。

  实在,保举体系也有离线部门和在线部门。上图(那不是图,是PNG)便是保举体系的离线部门,与搜刮引擎大同小异。

  获得候选集后,搜刮引擎通过更精细的计较模子对每一篇候选内容进行分值计较,对候选集的每一项进行排序。

  通过对搜刮引擎和保举体系的两张图,咱们大致大白了保举体系是怎样个一回事。现实上,保举体系是一个计谋举动。对付计谋,他有四因素,别离是:

分享到:


地址:福建省福州市铜盘路软件大道89号软件园A区26号楼 电话:0591-83519233 传真:0591-87882335 E-mail:chinaccas@chinaccas.com
版权所有 真人娱乐科技有限公司 晋ICP备14004444号-5
网站地图