谷歌机器学习规则要点简析:43条黄金法则 (13)

这并不意味着多样性、个性化或相关性不重要。正如上一条规则中所指出的那样,您可以进行后期处理来增加多样性或相关性。如果您看到更长期的目标有所增长,您可以声明除了热门程度外,多样性/相关性也很有价值。然后,您可以继续采用后期处理方法,也可以根据多样性或相关性直接修改目标。

 43 条规则:在不同的产品中,您的好友基本保持不变,但您的兴趣并非如此。

Google 的团队通过以下做法取得了大量进展:采用一个预测产品中某种联系的紧密程度的模型,并使用该模型对其他产品进行准确预测。您的好友保持不变。另一方面,我曾见过几个团队在应对多个产品间的个性化特征时捉襟见肘。是的,当时看起来应该可以奏效的。但现在看来并没有。有时可以奏效的方法是,使用一个属性的原始数据来预测另一个属性的行为。此外,请注意,仅仅是知道用户有其他属性的历史记录也会有帮助。例如,两个产品上出现了用户活动或许本身就可以说明该问题。

相关资源

Google 内部和外部有许多关于机器学习的文档。

机器学习速成课程:应用机器学习简介。

机器学习:概率法,凯文·墨菲著,帮助了解机器学习领域。

分析大型复杂数据集的实用建议:一种考虑数据集的数据科学方法。

深度学习,伊恩·古德费洛等著,帮助学习非线性模型。

关于技术负债的 Google 论文,其中提供了许多一般性建议。

Tensorflow 文档。

致谢

感谢 David Westbrook、Peter Brandt、Samuel Ieong、Chenyu Zhao、Li Wei、Michalis Potamias、Evan Rosen、Barry Rosenberg、Christine Robson、James Pine、Tal Shaked、Tushar Chandra、Mustafa Ispir、Jeremiah Harmsen、Konstantinos Katsiapis、Glen Anderson、Dan Duckworth、Shishir Birmiwal、Gal Elidan、Su Lin Wu、Jaihui Liu、Fernando Pereira 和 Hrishikesh Aradhye 对本文档进行多处更正、提供建议和有用示例。此外,还要感谢 Kristen Lefevre、Suddha Basu 和 Chris Berg 对早期版本提供的帮助。任何错误、遗漏或(喘气声!)不受欢迎的看法均由本人承担责任。

附录

本文档中多处提到了一些 Google 产品。为了提供更多背景信息,我将在下面对几个最常见的示例进行简单说明。

YouTube 概览

YouTube 是流式视频服务。YouTube 的“接下来观看”和 YouTube 首页团队均使用机器学习模型对推荐视频进行排名。“接下来观看”会推荐在当前视频播放完后观看的视频,而首页向浏览首页的用户推荐视频。

Google Play 概览

Google Play 有许多解决各种问题的模型。Play 搜索、Play 首页个性化推荐和“用户还安装了以下应用”都采用了机器学习技术。

 

Google+ 概览

Google+ 在各种情况下采用了机器学习技术,例如对用户可以看见的帖子“信息流”中的帖子进行排名时、对“热门信息”中的帖子(目前非常热门的帖子)进行排名时、对您认识的人进行排名时,等等。

内容版权声明:除非注明,否则皆为本站原创文章。

转载注明出处:https://www.heiqu.com/zzfxsz.html