本阶段中数据分析挖掘人员需要根据前面明确的需求场景进行业务建模,写好HQL逻辑,将相应的模型逻辑写入临时表中,抽取数据校验是否符合业务场景需求。
第六阶段:线下模型数据验收与测试
数据仓库团队的人员将相关数据落表后,设置定时调度任务,进行定期增量更新数据。数据运营人员需要验收数仓加工的HQL逻辑是否符合需求,根据业务需求抽取查看表中数据范围是否在合理范围内,如果发现问题及时反馈给数据仓库人员调整代码逻辑和行为权重的数值。
第七阶段:线上模型发布与效果追踪
经过第六阶段,数据通过验收之后,就可以将数据接口给到搜索、或技术团队部署上线了。上线后通过对用户点击转化行为的持续追踪,调整优化模型及相关权重配置。
五 画像规划和数据架构——数仓架构 六 数据指标体系需要开发的画像标签从大类上可划分为用户人口属性标签、用户行为标签、风险控制维度标签,进一步细分的话可在这两个画像基础上开发出用户偏好画像和群体属性、群体偏好画像等。
6.1 属性类标签属性类指标按常见一级、二级标签划分可以划分出很多,这里只给出一些示例…
6.2 行为类标签行为类指标按常见一级、二级标签划分可以划分出很多,需根据具体业务决定,
用户行为标签画像
用户偏好画像
用户登录活跃信息
6.3 风险控制类标签风控类指标按常见一级、二级标签划分可以划分出很多
风险控制类标签有多应用场景:
• 客服人员根据一些用户是否高退货、高投诉、高价值等特征标签,采用不同的话术;
• 售后运营人员根据用户是否高退货、恶意刷单、连续拒签收等标签采用不同的运营措施