实验三:不同布局对CTR影响研究
场景:APP/PC的核心入口首页banner图上
基于以上实验的数据分析后,我们得出一个结论:不同人群在设计上确实存在偏好关系。
3.1.3实践标签(偏好)数据加工的流程:首先客户端埋点上报用户的操作行为数据(主要是点击、浏览、搜索等),其次对数仓hive表中的数据做清洗、特征计算,然后标签落库,最后提供相应接口。
步骤一、数据清洗
前端上报的数据落在数据仓库里,点击、曝光流量模型里面包含了各个业务的埋点数据,而我们需要清洗出针对于广告焦点图的用户行为序列数据!
用户行为序列数据模型示例
user 模板id 时间 场景 sku_id 曝光次数 点击次数x_747b7b44d9bc2 01 2020.11.1 App首焦 23111 12 3
x_747b7b44d9bc2 02 2020.11.1 Pc首焦 21222 12 3
x_747b7b44d9bc2 03 2020.11.2 xxx 2333 4 1
x_747b7b44d9bc2 04 2020.11.2 xxxx 8333 3 0
... ... ... .. ... ... ...
模板标签模型示例
名称 字段 字段类型 枚举值示例模板组ID ps2id string 5c122d3d82acdd181d18292c
预览图 url array ['URL1','URL2']
场景类型 scene int 1-首焦
设计类型 design int 1-图片;2-页面
色系 color string 蓝色
布局 layout string 左图右文
按钮 button string 有
背景风格 bgstyle string 简约
步骤二、统计分析
重行为难题:
当我们在给用户构建品牌偏好时,经常会关注到用户在该品牌下产生了哪些“重”行为?“重”行为可以理解成用户为了做某件事付出了比较高的操作成本,比如用户是否特意搜索了某个品牌的商品。
我们在讨论设计画像方案的时候,几乎找不到方法去定义这种“重”行为,所以常规的套路好像并不适合用来构建设计画像!
经过讨论后,我们决定返璞归真回到最初的统计学的方式,假定如果用户点击某个颜色的广告图多,那就证明用户对于该颜色存在一定的偏好,然后借助于显著性检验来验证数据是否显著,得以确定最后的标签权重!
显著性检验:
显著性检验作为判断两个乃至多个数据集之间是否存在差异的方法被广泛应用于各个科研领域。