互联网圈内圈外的人,几乎都在说着大数据。而对于普通用户来说,大数据是什么?大数据有什么用?大数据在很多方面都能够发挥巨大价值,但这次Facebook风波则让更多人看到了大数据可怕的一面。
作为全球用户规模最大的社交应用,Facebook月活跃用户数已经超过20亿,因此一旦Facebook出现大规模的数据问题,必定会引发轩然大波,尤其是在高度重视隐私问题的美国。5000万用户信息被第三方公司Cambridge Analytica用于大数据分析,根据用户的兴趣特点、行为动态精准投放广告和资讯内容,甚至被怀疑利用数据预测用户政治倾向,成为间接影响总统大选的隐形黑手。
上一个被怀疑干扰美国总统大选的是俄罗斯,结果你也看到了,美国政府全面封杀卡巴斯基软件服务。同时,偶尔的全球黑客攻击事件矛头也往往指向俄罗斯。
而Facebook这5000万用户数据是什么概念,接近Facebook美国活跃用户总数的三分之一,美国选民人数的四分之一。更可怕的是,大数据分析之后美国民众究竟还剩下多少隐私?
这份庞大数据的根源,则是由一位科学家Aleksandr Kogan开发的一个Facebook个人测试应用收集的。当Facebook用户参加测试时,他们都会允许访问自己的数据,包括姓名、地点、年龄和性别等人口统计学信息,还包括“点赞”历史,甚至一些Facebook好友的数据。
整件事情还在继续发酵,更多的内容被挖掘出来,但笔者觉得还是暂时讨论到这里吧,毕竟墙外的事情,时刻关注也不过是一名吃瓜群众。而我们真正该反思的是,我们现在的处境与美国民众所所担心出现的情形相比又相差多少呢?
大数据环境下智能推荐算法隐患其实在这件事情爆发出来之前,笔者在知乎上看到一个内容非常值得作为Facebook这件事的参考。问题为《有没有以前很火,现在发现很危险的发明?》,几天前的一个回答发布后迅速获得了14K的赞同。答主直接点明:智能推荐算法。这个的危险性远比很多人以为的大。其中有几个例子非常有意思:
某些人常浏览某圈帖子,刷几次客户端后,就容易误以为这圈子已经成了网络时代主流圈子了——事实上依旧小众;
某些人总看黑某女星的帖子,刷几次客户端后,就容易误以为这女星已经人人喊打全民公敌就差贫病交加流落街头了——事实上她依旧数钱到手软;
某些人讨论了几次女权相关问题,刷几次客户端后,就容易误以为天下年轻男女都不想着过日子净想着搞斗争了——事实上依旧是过日子的人多;
某些人工作不顺抱怨了几个职场白领的问题,刷几次客户端后,就容易误以为当前社会最普遍的艰辛就是职场青年的苦恼——事实上跟没法被推送到你面前的人的艰辛比你那都不是事;
某些人没事聊几句皇汉蛮夷,刷几次客户端后,就容易误以为这时代怎么那么多汉奸走狗,中华民族简直到了最危险的时刻了——事实上真不是;
这其实是目前国内各大个性化资讯APP、社交应用、电商所采用的所谓“智能推荐算法”或者“个性化推荐算法”,这也是基于大数据分析的结果导向之一。
所谓的个性化推荐,大部分公司只道出了其好的一面,可以了解用户兴趣而推荐其想要看到的内容。但也可能潜在意思是间接帮用户选择了他们将看到的内容,而屏蔽掉了其他的内容。所以,很可能出现一个非常极端的情况就是,当你长时间用几款APP之后,每次打开你所看到的内容基本上都是一样的,这就形成了你每天所了解的全球时事,逐渐形成你所认知的世界。
结合我们实际生活,很多人喜欢看微博热搜榜,几乎每个上榜的热搜都会被数以万计的用户讨论,可能有那么一瞬间,让你觉得微博热搜榜上的事件就是今天的头条。但其实,微博能够给人展示的信息圈依然非常有限。
如果再阴谋论一点的话,就如Facebook事件一样,Cambridge Analytica利用所掌握的大量用户数据,对每个用户进行高度定制的内容推送,不知不觉中逐渐影响其对某些事件的认知,甚至影响他们在总统大选中的投票。
这样一来,所谓的大数据、智能推荐算法甚至能够逐渐影响民众价值观,而这样用户根本无法察觉。