这一篇,我们将介绍微软BING AD团队提出的Deep Crossing模型,用来解决大规模特征组合问题的模型,这些特征可以是稠密的,也可以是稀疏的,从而避免了人工进行特征组合,并使用了当年提出的残差神经网络。这个模型也算是深度学习在推荐系统的完整应用了:完整的解决了特征工程、稀疏向量稠密化、多层神经网络进行优化等一些列深度学习的目标应用。
特征微软在广告场景中所使用的特征如下面所示:
查询。
用户在搜索框中输入的文本字符串
关键字
与产品相关的文本字符串,广告主添加的其产品描述词
标题
赞助广告的标题(简称为"广告",以下简称 "广告"),由广告主指定,以获取关注度
落地页
用户点击了相应的广告之后进入的页面
匹配类型
给广告商的一个选项,包括精准匹配、短语匹配、语义匹配等等
点击
显示是否有一个印象被点击用户的点击。点击通常会与运行时的其他信息一起被记录下来
点击率
广告的历史点击率
点击预测
平台的关键模式,即预测用户点击给定广告的可能性。
广告计划
广告主创造的投放广告的计划、包括预算、定向条件等
曝光样例
一个广告“曝光”的例子,记录了广告在实际曝光场景的相关信息
点击阳历
一个广告“点击”的例子,记录了广告在实际点击场景的相关信息
网络的主要模型结构如下图所示
可以看出网络结构主要包括4种网络层——Embedding层,Stacking层,Multiple Residual Units层以及Scoring层。所需要的优化目标也是很常见的点击与否的二分类log损失:
\[logloss=-\frac{1}{N}\sum_{1}^{N}(y_i\log(p_i))+(1-y_i)\log(1-p_i)) \]