大数据时代的隐私安全危机

315晚会上,网易销售人员为了强调”精准营销”,面对央视镜头称:通过cookies代码可以追踪用户隐私,甚至能读取网易用户的私人邮件。这件事情引起了轩然大波,网易股价当天就暴跌,但是也引起了无数争论。不可否认通过cookie可以获取用户信息,但是在这样做的企业有多少呢,这并不是一件稀奇到值得争论的事情;而推送恶意广告或者获取私人邮件,又成了遭来非议的过分行为。

网易手里掌握了多么海量的用户信息,该怎样用这些信息去谋取利益,却又避免背上“作恶”的骂名?这似乎就是薄薄一层窗户纸而已。没有足够的法律法规,也没有足够统一和公开的标准,每个人都会有自己的理解。当Google在利用搜索推送关联广告赚钱的时候,百度正承受着广告推广、掩埋数据和制造垃圾信息的骂声。

从人类理解事物的模型来说,是基于因果关系的,比如今天下午我肚子疼,我会想,今天吃了什么不干净的东西,或者是不是睡觉着凉的,才会肚子疼;大数据时代,人们会逐渐习惯更关心关联关系,如果经过大量数据的统计发现,使用了微博超过两小时后,大量出现肚子疼的病例,我大概就会回想是不是微博又使用过度了,虽然我根本不知道为什么这二者会产生相关关系。这些数据也许有不准确,甚至有错误,但是在追求数据量的同时,这是不得不接受的妥协。事实上,有许多事件之间,因果关系是极难观察和分析清楚的,但是获知退而求其次的关联关系,却存在足够的可行性。而要做到这一点的一个充分条件,就是大量的数据。

那好,今天你使用邮箱发送邮件,你在当当上买了一本畅销书,你给老爸老妈打了个电话,甚至你出入了某个商场,你会考虑这些会成为观察你、分析你和猜测你的信息和行为的大量数据中的一员么?

拟想这样一个场景:某一天我受到刺激,厌倦了生活,想自寻短见。我在微博里发布了一首别离的诗,我去商店里买了农药,就在我要寻死的时候,有人找到了我,他可以阻止我过激的行为,凭借的,正是对我属性的分析,以及行为的监控,我写了什么,发布了什么,购买了什么,一切都是数据,一切都在掌握之中。有人在每日监控的大量人里面,根据学习到的某种特征,发现我完全匹配,进而发现了我的企图。

传统上说法官判案、医生诊断、警察破案,依据的都是因果关系。但是现在,大量实例的关联关系也被逐渐接受,例如医生在无法确诊的情况下可行使经验性治疗。也许未来会有一天,一些潜在的犯罪分子,也可以被提前挖掘出来。那么,会不会有一天,我被定罪,我被道德舆论谴责,并不是因为我的所作所为,而仅仅是因为数据得出的我的所想,我的邪恶倾向呢?

足够的数据,可以帮助找到那些有威胁的人,他们想做的事情,完全可以通过掌握的数据挖掘分析出来。也许你已经感到一些隐忧,在这些“预知”的背后,可以看到,在数据面前,谁又有隐私可言呢?

通过采集大量的社交数据,可以发现某个人其实是同性恋;采集购买商品的历史数据,可以发现某个人是否有了孩子,男孩还是女孩,孩子大概几岁……这些并非幻想,在不远的将来就可以轻松地普及开来。无论你在哪里,只要有足够的数据,就可以获知你的一切。换句话说,在大数据时代,人是“透明”的。

你可以惩罚那些泄露隐私的人和企业,但是人习惯于大量社交的,你不会有足够的精力去关心潜在生活中的那么多能够获取你数据的厂商企业,无论惩罚的执行有多坚决,隐私数据泄露造成的损失是无法挽回的。这些数据可以很容易从互联网上取得,于是受害者惶惶不可终日。

有人把希望寄托在企业的良心上,在人的良心上。靠“良心”来保护隐私数据的安全,总是不那么牢靠的。

文章系本人原创,转载请保持完整性并注明出自《四火的唠叨》

相关推荐