另外一块是潜客挖掘。我们客户比如教育、金融的很多企业,他们有一批已经买过产品的用户种子,包括有电话号码,有身份证这样一些信息,他们希望根据这个包,能够找到更多的人,相似的人去做一些扩散,去分道他的用户盘,这里我们集成大数据的相关特征,去做一个人群扩散。这里做的方式可以简单分享一下,因为只有种子,正向的样本,没有副样本,就是从大盘里面随机抽一部分出来做,这种方式效果不太好,我们后面用标签抽取方式,抽取一些种子人群,比较负向标签关联的人群,这种方式做出来,评估上会非常好看,但是在具体落地的时候稳定性差。后面就是做了一个Pulearing,会先从种子用户,放进副样本里面去先做一个种子筛选模型,再真正抽取出来的正负样本去做预测建模,最后我们会达到一个比较好的效果。
整个行为预测这块在售前这部分能力,在做机器学习的时候,会对自己数据进行处理,先有数据,进行数据的预处理,这部分耗时会非常久,同时我们要去把数据实验各种不同的算法,去调参,去做模型在线调试,去上线,我们不同的行业,不同的客户有不同的模型,需要去做针对性的上线服务,我们时间开销很大,而且要上线一个新的东西,本来需要改一些参数,甚至有一些模块需要重启。
这里我们用了腾讯云上面一个TI One大数据平台,在上面是可以支持各类的机器学习的框架,我们在上面是用到了像CNN,GBDT这样一些算法。
给大家介绍一个TI One好用的点,我写一些计算任务,可以串起来,做一个任务流,像我们要做一个模型的训练,训练好了之后可以再形成一个算法结果的评估节点。我们可以看到一个简单的评估,算法评测效果,在发布的时候不同的客户有模型迭代,这个迭代可能是一个小的迭代,可能是大的迭代,很多环节都需要做更新,甚至有些环节会强依赖;TI One实现了一定的解耦,让算法同学直接做,通过TI One开放出来,再在工程上面做集成。
介绍一下我们行为预测的一些模型样板,当前我们是在四个行业,可以先分享一下这两个行业的案例,我们的匹配率在市场上还是很有优势的,假如用户提供100万的号码包,我们可以识别出来在我们体系内有画像有特征的可能就是在教育这里有93%,在房地产有87%,比其他友商高很多。在模型效果上面我们会做预测上面的意向分级,我们高意向的拿去做营销效果会更好,模型的排序能力也比较好。
我们刚才提到售前,怎么去挖潜在的人群,潜在高价的人群,形成人工外呼流程的功能。但是对于我们对他的意向评估不是太完善,对这样一些人可以走短信营销,在这里我们还可以从短信营销链路里面把他意向拆分出来是强意向还是中意向,在对短信营销做二次过滤意向的人群做一个外呼,经过外呼,在座可能有很多做这方面的东西同学,我们外呼或者呼叫之间通讯的基础能力,或者在这个接入能力之上加上我们数据能力,我们可以希望做到一个点是我们一个电话在呼叫的时候可以辨别性别、学历、收入、兴趣。根据不同的类型选择不同的模板,走相应的剧本。同时我们也基于这样一些机制做了一些后面的营销。
这是一个短信投放的案例,我们在短信投放整个过程里面,会用断链服务,到监测,监测整个转换链路上面数据变化,用户走到哪一步,在这里可以看一下下面这个案例,两个包,第一个包42万,高意向的,可以看到分成三个小包做投放,效果比较好,。在这个基础上可以提供不同营销方案,或者你发送的时间,周期的不同可以做一些营销方案的对比。