记者在与买家接触中发现,他们大部分人都知道买卖数据交易属于黑产,但依然作此举动,一个重要原因在于通过正规渠道打广告,比如百度竞价排名,获客成本在60~80元/左右,而通过地下黑市买用户数据,成本能大幅缩减。
从信息收集到信息售卖再到信息利用,每一个交易环节环环相扣,而由此产生的“灰色产业链”让人难以估量。据猎聘网报告,目前中国网络黑产从业者已经超过40万人,依托其进行网络诈骗行业人数至少有160万人,“年产值”在1000亿元以上。
数据合规交易痛点
海量的个人信息地下市场规模多大,目前没有准确数字统计。但从公安机关的专项打击行动中,可窥一斑。
2020年全国公安机关深入推进“净网2020”专项行动,全年共侦办网络犯罪案件5.6万起,抓获犯罪嫌疑人8万余名。其中,侦办侵犯公民个人信息类案件6524起,抓获犯罪嫌疑人1.3万名。
但很显然,这并非黑市全貌。贵阳大数据交易所业务经理陈经理向记者表示,“目前通过正规渠道进行数据交易的不多,更多的数据可能还是在黑市交易。”
贵阳大数据交易所是国内首家大数据交易所,2015年4月正式挂牌运营,喊出了未来3~5年每天交易量达到100多亿元的口号。如今,交易所成立已经6年,陈经理向记者透露,目前交易所日成交量远远没有达到当时定下的目标。
大数据服务商聚立信CEO罗皓以及陈经理都同时提到,数据交易过程中产生的数据确权、数据回溯,交易过程中的安全性、合法性、隐私性保障等问题,迄今为止还没有得到很好的解决。尤其是数据确权,例如数据的采集、加工、采用、交易等环节可能有多个参与方,什么情况下什么类型的参与方可以获得数据的权利,在实践中尚未达成一致共识。
目前可见的红线是来源是否合法,以及交易数据是否脱敏(涉及敏感信息进行去个人化,隐私化处理)。但问题在于,在数据的流转过程中,其中掺杂非法来源以及未脱敏数据实际上很难被发现。
另外,数据的开放程度还远远不够,导致市面上合法流通的数据品类和数量有限,玩家们难以施展拳脚。
像腾讯、阿里这样的互联网巨头,在拥有海量数据的同时本身还能实现大数据云计算闭环,它们更希望是打包成数据产品和服务卖出,比单纯买卖数据更值钱,也更能避免法律风险。这些玩家共享数据的意愿不强,这从腾讯、阿里与贵阳大数据交易所自合同到期再无续约就可窥见。
但从技术角度来讲,目前已经有一种技术可以实现B2B之间的数据合规化交易。大数据服务商星云Clustar CTO张骏雪向记者表示,目前公司已经采用了一套“联邦学习”算法。简单理解,就是基于双方现有的数据去共同建立一个坐标体系,这个坐标体系就是所谓的建模,建模完成后,就能较为精准地判断客户处于坐标体系安全的点还是危险的点。但是在建模过程中,双方并不知道彼此的用户资料,不用担心用户隐私被复制泄露。
根据张骏雪介绍,上述联邦学习算法目前只是解决了B2B之间的数据合规化交易,且主要还是用于银行金融机构之间的数据交易,且成本较高,并没有被大规模应用。
大成律师事务所律师肖飒告诉记者,个人信息的合规使用目前在中国较大程度依赖于公司的自我约束,各大运营商对于用户隐私是否尽到了保护责任,如何在公众隐私保护和商业模式中寻找一个平衡点,在保护个人权益的前提下规范、安全、有序地利用个人数据,释放大数据的红利值得深究。