智能推荐引擎:化成灰都认得你

行为会产生数据,在互联网普及之前,除了算命先生,很少有人纯粹地将这些数据变成真金白银。当麦肯锡在2012年第一次提出“大数据”时代已经到来,人们似乎终于站到了所谓的上帝视角。只不过看到的不是蝼蚁般的芸芸众生,而是一连串不明觉厉的数据。

在普通人看来,数据永远是简单直白的。就好像你根本不需要知道,为什么一个童年打过蛔虫疫苗的肯尼亚孩子,比不打蛔虫疫苗的孩子长大后多赚了20%。作为国家领导人,你需要做的无非是给国家每个适龄儿童打疫苗。

当然,现在很难有人会毫无原则地相信数据。更重要的是,那些站在风口的人,用数据打开了一扇财富宝藏之后,他们心里想的不仅是如何累积更多信息,而是怎样靠数据去挖掘行为本身的逻辑。然后在用户做选择的前一秒,贴心地给出选项预判。这种如先知般的技术手段,就是推荐引擎。

道可道,非常道

Netflix是一家在线影片租赁提供商,其核心竞争力是一种命名为Cinematch的推荐引擎。为了提高影片推荐引擎的效率,Netflix在06年发起了一场世界级的大奖赛,参赛者需要根据Netflix公开的大约1亿个匿名影片评级,将推荐引擎的效率提高10%以上。看上去很像一个加强版的豆瓣电影,但这还不是见证奇迹的时刻。

随着第一次大奖赛的结束,Netflix只是能够准确地预测到,提供了50个以上评级的观众的观影口味。第二次大奖赛的目标则是,为那些不经常做影片评级或者根本不做评级的顾客推荐影片。提供给参赛者们的数据加入了顾客年龄,性别,居住地区邮编。游戏突然变得有趣起来。

智能推荐引擎:化成灰都认得你

弗洛伊德在《梦的解析》里的观点是,人每一个下意识的行为都是有意义的,被忽略的细节背后,往往有着千丝万缕的联系。所以从理论上讲,一个由工程师,统计学家,行为学家,心理专家组成的团队,可能真的会比我们更了解自己需要什么。

监控是为了控制

如果不从营销角度去恶意揣测数据公司们的动机,推荐引擎无孔不入,的确为我们的生活带来了前所未有的便利。至少是给那些有选择困难症的人,提供了各种横向的比较标准。但在一个缺乏监管和控制的环境下,很难保障的是,会不会同样把潘多拉魔盒打开。

2013年的“棱镜门”事件,斯诺登一直站在舆论的风口浪尖。其实令人惊讶的不仅仅是人们的行为被监控,毕竟这不是一种常人很难理解的技术手段。在接受NBC采访时,斯诺登透露,NSA的分析员可以观察人们在网络行为的过程中,了解并改变人们的思维模式。这样的侵入已经不再是简单的达到监控目的,更多是为了左右你的思考。这让我想起了一部电影中经典的台词。

即便是你身上这身廉价的蓝色条纹毛衣,你以为是你选择了它,但其实2002年Oscar de la Rent 的发布会才第一次出现了天蓝色礼服,然后圣罗兰也随之展示了天蓝色的军服系列,天蓝色很快就出现在随后8个设计师的发布会里,然后,它就风行全世界各大高级卖场,最后大面积流行到街头,甚至在那些肮脏的拾荒者的身上。滑稽的是,你以为你做的选择,把你与时尚业区分开来,而事实上,你所穿的毛衣正是这间房子里的人为你挑选出来的。

——《穿Prada的女魔头》


还有谁在意隐私

这个时候总有人会站出来表示,为了消灭社会的毒瘤,人们不应该抗拒组织的监控。即使不这么上纲上线,为了换取更好的用户体验,公开某些数据也是情理之中。但不应该忘记的是,推荐算法的核心是精准。为了达到这个目的,“某些”和“重要”都是很难鉴定越线与否的变量标准。如果还有人粗暴地将这理解为民意,我想Snapchat的火爆就是对此言论的有力回应。

Snapchat作为一款社交软件,用“阅后即焚”的方式虏获不少用户的芳心。如果说每天2000万张的图片上传量还不足以与Facebook媲美的话,Snapchat每天消除的图片量肯定是有过之而无不及。然而剧情没有按人们想象中的发展,从2012年1月到2014年10月,Snapchat已经出现两次大面积的信息泄露事件。

对于商业模式还在摸索阶段的Snapchat来说,暂时不可能为了将数据套现而自废武功。要知道在理论上,没有任何系统是绝对安全的,所以相对于人们普遍的愤怒,我们更应该对此表示遗憾。

智能推荐引擎:化成灰都认得你

推荐引擎的原罪

在《机器的力量与人类的理性:从判断到计算》一书中,MIT的科学家乔瑟夫.魏泽保认为,人类永远不应该允许计算机为我们做出重要的决定,因为它缺乏某些至关重要的人类特性,比如同情心与智慧。

对此,我更愿意理解为,推荐引擎并非生来就注定一半天使一半魔鬼,在计算与算计之间,即使没有技术上的界限,也应该存在道德上的约束。人们在享受互联网带来的快感时,依旧有权利捍卫自己的隐私。如果说哪一天,科技能给人带来一个智能“朋友”,我想那肯定不会是一台背后藏着各种心怀鬼胎的机器。

雷锋网原创文章,未经授权禁止转载。详情见转载须知

智能推荐引擎:化成灰都认得你

(完)