第一张人口属性表:
同样的,其他的也按这种方式进行存储,这种属性类的计算很容易筛选出来。
然后,我们将用户的标签查询出来,汇总到用户身上:
最终用户的标签就形成了
当然,对于复杂的规则和算法类标签,就需要在计算中间表时做更复杂的计算,我们需要在Flink里解决这些复杂的计算,未来开发中我们会详细的讨论,这一部分先根据标签体系把相应的表结构都设计出来。
Mysql存储标签元数据Mysql对于小数据量的读写速度更快,也更适合我们对标签定义,管理。我们也可以在前端开发标签的管理页面。
我们在mysql存储的字段如图所示,在页面上提供编辑等功能,在开发标签的过程中,就可以控制标签的使用了。
这样,我们的标签体系已经根据实际的业务情况建立起来了,在明确了标签体系以后,也就明确了我们的业务支撑,从下一章开始我们将正式开始搭建大数据集群,接入数据,进行标签开发,未完待续~
参考文献
《用户画像:方法论与工程化解决方案》
更多实时数据分析相关博文与科技资讯,欢迎关注 “实时流式计算”