首页  >  科技  >  推荐策略:如何解决重复推荐问题

推荐策略:如何解决重复推荐问题

摘要: 下面主要聊聊推荐算法实验和常见推荐算法优缺点,以及内容重复推荐相关话题。推荐算法最根本的意义,在于解决信息过载。解决重复推荐可以从根源上压制,比如“阅后即焚”,当用户看过该条内容后即标记为已读,已读状

你有这样的经历吗:我已经看过信息流推荐的内容了。这是因为推荐算法存在重复推荐的问题。那么,对于不同的信息流,有什么方法可以改善这个问题吗?

前一段时间,我接触到了与推荐策略相关的工作,现在产品顺利地走上了“正确的道路”。关于常用推荐算法的规则和原理,网上有很多好的相关文章,可以搜索和浏览。

下面主要讨论推荐算法实验和常用推荐算法的优缺点,以及内容重复推荐的相关话题。

一个好的算法模型不是一蹴而就的,而是通过不断的训练慢慢完善的。

那么,如何评价推荐算法的效果以及不同算法在抛光过程中的优缺点呢?

这里有三种实验方法供你参考。

模拟实验主要利用用户的行为日志,如浏览、收集、表扬等用户行为生成推荐的标准数据集,然后根据规则将数据集分为“训练组”和“测试组”,在“训练组”上训练用户兴趣模型,在“测试组”上预测。

这个实验的优点是它不需要真正的用户参与,只需要从日志系统中提取用户行为数据来快速计算推荐效果。然而,缺点是不可能知道用户的实际转换指数,例如推荐的点击率。

监控一组经历过推荐的用户,并持续观察和分析用户行为。

根据用户行为列表相关问题,在调查中提问,最后根据问答了解推荐效果和满意度。

值得注意的是,高准确性并不意味着高用户满意度,应该更加关注推荐产生的一些内容是否给他带来了一些“惊喜”,是否更偏向于用户的主观感受。

也正因为如此,从行为观察到问题归纳、用户邀请和最终调查结果的分析,实验调查过程和成本相对较高。

通过划分用户组,对不同用户组采用不同的推荐算法,统计不同用户组的转换指标,生成测试报告。请记住,实验中唯一的变量是算法规则,不允许使用其他变量。

另一件需要清楚考虑的事情是,用户运行测试过程需要满足什么样的条件。a/b测试的缺点是周期长,短期生成的测试结果不能保证真实性。因此,该实验适用于用户研究中的模拟实验和更好的算法模型,而不是运行所有的算法,这实在是太低效了。

一类算法只能解决一些问题。单一算法很难实现真正的个性化。它还需要算法和算法的结合。接下来,我们将讨论当前常用推荐算法的一些优缺点。

可以有效过滤出低质量的内容,并呈现给大多数人“喜欢”的用户。它对新用户相对友好,无需任何交互即可生成推荐列表。推荐列表没有空的情况,热度是相对的。热点并不总是热点,而且具有一定的时效性。

基本热得分可以人为干预。例如,今天热门新闻的基本热得分高于今天普通新闻的热得分。

精确的触摸精度不足以满足用户水平。

因为推荐列表是按受欢迎程度排序的,而不是基于个人兴趣和偏好,所以可以“刷掉”单个受欢迎度算法,因此应该采取相关措施。

使用加热算法一个典型例子:抖动

游客登录浏览之前的视频,大部分视频最近的热度值都是前5名,在首页推荐之前,前5名的推荐需要通过多个热池中的大量用户测试。

然而,它不会持续超过一周,除非大量用户模仿跟进,并且用户行为的视频受欢迎度权重被推后。用户“跟进”行为的受欢迎程度远远大于收集、表扬和分享。

对产品用户的数量没有要求,算法不受产品用户数量的影响。因为每个用户产生的行为是相互独立的,所以用户的行为特征由他们自己决定,没有干扰。

此外,该算法具有很强的实时性,只要有新内容,就可以立即“推荐”。推荐机会与旧内容相同,新旧之间没有必然的联系。

无法为新用户生成推荐列表,没有历史行为数据,新用户无法预测。

当没有用户行为特征时,无法将推荐与内容进行匹配。因此,大多数产品将使用注册预填充信息、弹出窗口选择第一个成功的登陆页面等手段,结合热推荐进行冷启动。

但是,应该注意这些行为是否会过度干扰用户,并平衡用户流失和推荐准确性的问题。

其次,基于内容的推荐是非常确定的,所有推荐的内容都是由用户的浏览历史决定的。单独使用该算法很难挖掘用户的潜在兴趣,因此该算法通常与其他算法共存。

就是能够挖掘用户的潜在兴趣,并不断调整为用户创造惊喜。同时,它具有很强的实时性,新内容也可以立即“推荐”。

然而,与基于内容的推荐不同的是,该算法不仅包含平台本身生成的新内容,还包含用户交互行为生成的新内容。

起始阈值相对较高,这需要一定数量的产品用户和平台内容,以及对用户学习样本的高要求。当学习样本不足时,推荐效果不理想,容易成为人工智能障碍。

卡诺模型的需求分析是激励需求,所以当产品冷启动时,算法不会被优先考虑。然而,在算法冷启动期间,用户应该受到积极的培训。如果用户可以被舍入到不同的推荐原型,这将有助于算法。

推荐算法最基本的意义是解决信息过载问题。如果是推荐给用户的相同内容,那就没有意义了。

解决重复推荐可以从根本上加以抑制,如“读完就烧”。当用户阅读内容时,它被标记为已读,并且处于已读状态的内容不再被推荐给用户。

为了清楚地定义用户产生的行为,它被定义为“可见”。是点击细节页面还是点击“查看剩余全文”等行为需要根据自己的业务进行考虑。

上述“读后烧”可以解决内容的单一重复,但不能解决同质化的问题。

以信息流产品为例,有两篇文章甲、乙:

1)a和B属于列表页和详细页相同的文章

对于用户,只需要一个和一个。因此,应该展示其中一篇合适的文章以供推荐。本文中的“适当”可以有两个维度:例如发布时间(过滤和处理)和发布者信息(如果新闻组织号码的权限通常大于个人号码)。

2)a和B属于列表页面相同但细节页面不同的情况。

那么用户已经点击了文章甲,并且很可能在短时间内不会再次阅读文章乙。因为从用户的角度来看,他认为甲和乙是重复的,所以他很可能会错过乙条。对于这种情况,应该打开推荐间隔。

(3)a和B属于列表页不同但细节页相同的情况

有必要考虑用户是否“看过”其中一篇文章。如果你已经阅读了A文本,没有必要按B文本。但是如果你没看过,你可以推荐它。因为列表页面之间的差异会影响用户的行为,标题和封面会导致用户是否会查看文章,所以这种情况下甲乙双方都有推荐的必要。

动物园主管,微信公众号:首席吹牛官,每个人都是产品经理专栏作家。互联网圈的18行歌词作者是国家级退休表演艺术家。阎良和文丑,欢迎交流。

这篇文章最初发表于《人人都是产品经理》。未经允许禁止复制。

主题地图来自unsplash,基于cc0协议。