推荐系统中的 i2i u2i u2i2i u2u2i u2tag2i ,都是指推荐系统的 召回路径
在这里插入图片描述

通过上图理解什么是召回路径:

  • u、i、tag是指图中的节点
  • 2是指图中的线

i2i:指从一个物品到达另外一个物品,item 到 item

  • 应用:头条,在下方列出相似的、相关的文章;

  • 算法:

    • 内容相似,eg:文章的相似,取标题的关键字,内容相似
    • 协同过滤
    • 关联规则挖掘等
  • 两个物品被同时看的可能性很大,当一个物品被查看,就给他推荐另一个物品

u2i:指从一个用户到达一个物品,user 到item

  • 一般指用户的直接行为,比如播放、点击、购买等;
  • 用户查看了一个物品,就会再次给它推荐这个物品
  • 结合i2i一起使用,就是用户查看以合物品,就会给他推荐另一个相似的物品,就是u2i2i路径;

u2i2i:从一个用户,通过一个物品,到达另一个物品

  • 用户查看了一个耳机(u2i),找出和这个耳机相似或者相关的产品(i2i)并推荐给用户
  • 对路径的使用,已经从一条线变成两条线
  • 方法:就是把两种算法结合起来,先得到u2i的数据,再利用i2i的数据进行扩展,就可以从第一个节点,越过一个节点,到达第三个节点,实现推荐
  • 中间的桥梁是item

u2u2i:从一个用户,到达另一个用户,到达一个物品

  • 先计算u2u:两种方法
    • 一是:取用户的性别、年龄、职业等人工属性的信息,计算相似性,得到u2u;
    • 一是:从行为数据中进行挖掘,比如看的内容和视频大部分很相似,就可以看作一类人;
    • 也可以使用聚类的方法进行u2u计算
    • u2u一般用在社交里,比如微博、Facebook,推荐感兴趣的人
  • userB和UserC相似,如果userB查看了某个商品,就把这个商品推荐给userC;
  • 中间的桥梁是user

u2tag2i:中间节点是Tag标签,而不是 u 或者 i

  • 京东,豆瓣,物品的标签非常丰富、非常详细;比如统计一个用户历史查看过的书籍,就可以计算标签偏好的向量:标签+喜欢的强度。

  • 用户就达到了tag的节点,而商品本身带有标签,这就可以互通,进行推荐

  • 先算出用户的tag偏好,然后匹配item列表

  • 这种方法的泛化性能比较好(推荐的内容不那么狭窄,比如喜欢科幻,那么会推荐科幻的所有内容)

  • 今日头条就大量使用标签推荐

基于图的算法:u2***2i

起始于U,结束于I,中间跨越很多的U、很多的I,可以在图中不停的游走

例如:PersonalRank,不限制一条还是两条线,在图中到处的游走,游走带着概率,可以达到很多的item;但是相比前面一条、两条边的路径,性能不是很好

Match & Rank 定义:Match基于当前user(profile、history)和context,快速在全库里找到TopN最相关的item,给Rank来做小范围综合多目标最大化 通常做法:用各种算法做 召回 ,比如user/item/model-based CF,Content-based,Demographic-based,DNN-Embeddi...
推荐 系统 中的核心是从海量的商品库挑选合适商品最终展示给用户。由于商品库数量巨大,因此常见的 推荐 系统 一般分为两个阶段,即 召回 阶段和排序阶段。 召回 阶段主要是从全量的商品库中得到用户可能感兴趣的一小部分候选集,排序阶段则是将 召回 阶段得到的候选集进行精准排序, 推荐 给用户。 本篇我们来总结一下 推荐 系统 中几种常用的 召回 策略。主要有协同过滤、向量化 召回 和阿里最近在Aic...
前端的打点日志,以Kafka流形式的数据 物品内容数据:存储在MySQL中的业务的物品本身的内容数据,如id、标签、图片等等 来自web 系统 的用户画像数据,存在Hbase,包含两类: 用户自身的人口属性的数据,性别、年龄、职业 根据用户历史行为,算出用户偏好的数...