凹凸技术揭秘·羚珑智能设计平台·逐梦设计数智化 (4)

图片

步骤三、标签落库

当我们跑出来用户标签数据后,最后其实只是一个工程问题,把相应的数据落到对应的表里。然而实际情况却要复杂的多,仍然会存在问题:数据量偏少,不足于覆盖大部分用户!

接着又衍生出了 look alike 这种人群标签的方法,也就是我们的用户可能是完全没有数据的新用户,这个时候期望通过匹配相似人群的标签作为最后的标签结果。

图片

算法模型

除了统计学的思路,我们还在探索用另外一种方式去构建设计画像,使用模型训练输出标签。之前也说过偏好问题可以认为是一个分类问题。

常用的分类模型主要有以下两种:

分类模型 优点 缺点
决策树   根据决策树可以很容易地构造出规则,而规则通常易于解释和理解;决策树可很好地扩展到大型数据库中,同时它的大小独立于数据库的大小;决策树模型的另外一大优点就是可以对有许多属性的数据集构造决策树。   处理缺失数据时的困难,过度拟合问题的出现,以及忽略数据集中属性之间的相关性等。  
朴素贝叶斯   有稳定的分类效率。对小规模的数据表现很好,能够处理多分类任务,适合增量式训练,尤其是数据量超出内存时,我们可以一批批的去增量训练。对缺失数据不太敏感,算法也比较简单,常用于文本分类。   需要知道先验概率,且先验概率很多时候取决于假设,假设的模型可以有很多种,因此在某些时候会由于假设的先验模型的原因导致预测效果不佳。  

目前我们正在尝试使用决策树类模型 XGBoost 实现标签训练输出,它支持各种语言调用,支持单机和分布式,支持 libsvm 的稀疏矩阵的数据格式。

3.1.4展望和目标

设计画像是智能设计基础能力中的一环,结合程序合图,为不同的人群输出不同风格的设计手法,助于千人千面、千人千场等精准营销场景,提升商业转化率。

3.2 实时合图

我们面向开发者、第三方系统平台提供了服务端快速合成图片的接口,开发者可以根据自身的业务诉求集成羚珑的程序化设计能力,构建自己的设计引擎。

「实时合图」在京东最大的应用场景是京东 APP 首焦轮播广告图的千人千面,根据不用访客的用户画像和购买行为数据分析,实时合成并推送精准的广告图,提升其商业转化率(CTR)。

图片

它的核心就是通过 C 去实现了合图的底层引擎,然后通过 NGINX 扩展的形式注入到 NG 里面,通过 LUA 脚本来控制各个业务上层的逻辑配置。

图片

此外,羚珑实时合图方案的一大亮点在于 CDN 兜住了绝大多数请求,能有效降低真正回源的请求量。

图片

CDN是一种加速内容分发网络,通过多节点的形式,让用户访问到离用户最近的节点资源,从而达到让内容快速呈现给用户的技术,简而言之,我们可以理解为缓存。

3.3 智能配色

在羚珑网站上作图,都能体验到智能配色的功能,从而大大提高图片丰富性,做到一键切换图片风格。

图片

内容版权声明:除非注明,否则皆为本站原创文章。

转载注明出处:https://www.heiqu.com/wpjsww.html