杨列昂:腾讯移动分析与服务架构 (3)

如果对前面分群的效果不满意,或者希望拓展新的用户,这里也提供了一个lookalike的形式。这里是某汽车行业线下lookalike的场景,通过和大盘用户的关联,叠加的排序,可以找到它的目标人群在不同兴趣类目上的关联度,可以注意到在一些平常认知不到的类目上,比如家居建材、建筑工程这些行业感兴趣的人群,其实跟它的目标用户的重合度,反而比较高。

这就是一次从线下到线上的一次有效推广,我们借助于Lookalike的能力,为每一个接入的客户提供更好的分析。

数据开放 一键导出

img

最后可以一键导出到腾讯内部的广告平台上,这是实际操作的界面,可以看到4月份的活跃用户已经推送到了广点通平台。

定制化渠道对接方案

img

广告界有一句很有名的话,我知道我的广告费有一半都浪费掉了,但我不知道是哪一半。所以广告效果的跟踪是非常非常重要的,这里其实不仅是对接了top10的平台,包括腾讯、爱奇艺、百度、今日头条、陌陌等一些标准的广告渠道,还支持了定制化的平台对接。因为这个渠道对接,在PC端通过用cookie关联数据,因为流量端、分发中心和应用激活分属在不同的层面或者APP,很难串联起来的。

MMA标准:异常流量识别

img

这时候提供两套方案,一是渠道安装包的可扩展的动态签名方案,在下载安装包的过程中实时对应渠道的安装包。还有一种采用关联算法,通过采集到了LBS信息、指纹信息来搜集下载安装、激活这两部分的行为。

提到移动流量分发,不可避免会想到异常流量的问题,现在有很多的黑产或者商业利益的关系,MMA标准是国内移动广告业通用的标准,里面对异常流量的类型做了简单的分类。通过异常本身是否容易被识别,它的误判和漏判率的高低,可以简单分为常规无效流量和复杂无效流量两个部分。

流量清洗

img

我们在实现常规无效流量这些场景的同时,更关注到的是认为刷量这一部分,也就是我们俗称的五毛党。他们可能通过网上的派单,通过一些付费的,他们去自己手工的完成整个APP的下载、安装乃至后续的激活注册的流程。我们联合腾讯内部专门做打击黑产的团队,合作完成了这一块数据的识别。

流量清洗模块,大概分为三个部分,规则的识别、建模以及最终应用。这个地方随着黑产的技术在不断地提升,有很多自动化的手段可以去模仿人工的激活,以及后续的注册等等流程。所以这一块我们也是在引入对抗网络和复杂的神经算法来去加强这一块的能力。

互利共生的服务生态

我们如何去利用腾讯的海量数据和计算能力,来赋能企业,建立一个互利共生的服务生态。大数据可以帮助企业洞察用户、行业变迁和资本走向,来辅助公司的战略布局和决策,但应用大数据过程中面临很多的挑战,如何建设底层能力的支撑,如何培养专业的人才梯队等等。我们这里有一些实践经验可以分享。

数据驱动产品运营

img

img

可以看到现在我们的指标有很多,我们对它做了一个分级的处理,其中有一些全量的指标,关系到一些历史的状态特征,就比如说一些累计用户留存性的问题,我们采用离线分析的模块。对用户分群的分析,有自己多维实时分析的计算模式。另外还有潜在用户流失,潜在付费用户的在线预测模型,以及基于监控指标和诊断指标的秒级实时分析。

基础技术架构

img

为了去实现前面的这一些功能和架构,我们也有一套底层的支撑,首先是内部的docker系统,可以给我们提供强大的底层支撑能力。中间实时计算用到这些hadoop、spark等平台,最后暴露给用户的是用户画像、关键指标数据、自定义计算事件上卷和下钻的分析,外层进行了多种多样的接入方式。

赋能企业大数据能力

img

内容版权声明:除非注明,否则皆为本站原创文章。

转载注明出处:https://www.heiqu.com/zyggys.html