推荐系统实践 0x10 Deep Crossing

这一篇,我们将介绍微软BING AD团队提出的Deep Crossing模型,用来解决大规模特征组合问题的模型,这些特征可以是稠密的,也可以是稀疏的,从而避免了人工进行特征组合,并使用了当年提出的残差神经网络。这个模型也算是深度学习在推荐系统的完整应用了:完整的解决了特征工程、稀疏向量稠密化、多层神经网络进行优化等一些列深度学习的目标应用。

特征

微软在广告场景中所使用的特征如下面所示:

查询。
用户在搜索框中输入的文本字符串

关键字
与产品相关的文本字符串,广告主添加的其产品描述词

标题
赞助广告的标题(简称为"广告",以下简称 "广告"),由广告主指定,以获取关注度

落地页
用户点击了相应的广告之后进入的页面

匹配类型
给广告商的一个选项,包括精准匹配、短语匹配、语义匹配等等

点击
显示是否有一个印象被点击用户的点击。点击通常会与运行时的其他信息一起被记录下来

点击率
广告的历史点击率

点击预测
平台的关键模式,即预测用户点击给定广告的可能性。

广告计划
广告主创造的投放广告的计划、包括预算、定向条件等

曝光样例
一个广告“曝光”的例子,记录了广告在实际曝光场景的相关信息

点击阳历
一个广告“点击”的例子,记录了广告在实际点击场景的相关信息

模型结构

网络的主要模型结构如下图所示

推荐系统实践 0x10 Deep Crossing


可以看出网络结构主要包括4种网络层——Embedding层,Stacking层,Multiple Residual Units层以及Scoring层。所需要的优化目标也是很常见的点击与否的二分类log损失:

\[logloss=-\frac{1}{N}\sum_{1}^{N}(y_i\log(p_i))+(1-y_i)\log(1-p_i)) \]

内容版权声明:除非注明,否则皆为本站原创文章。

转载注明出处:https://www.heiqu.com/zzjfyf.html