在微博上“贊一下”感興趣的消息,或是在論壇里頂起中意的帖子,似乎已經(jīng)成為最偷懶的網(wǎng)絡(luò)互動(dòng)方式。近來的研究卻發(fā)現(xiàn),當(dāng)人們?cè)谏缃痪W(wǎng)站上大發(fā)好感時(shí),往往已經(jīng)將自己的政治傾向、宗教態(tài)度、婚姻狀況和性取向等信息暴露了。
網(wǎng)絡(luò)檢索詞和社交網(wǎng)站信息正迅速成為科學(xué)家青睞的海量數(shù)據(jù)庫,越來越多的研究者嘗試篩選這些信息,以研究人類活動(dòng)中某些微妙的模式及關(guān)聯(lián)。這項(xiàng)發(fā)表于美國《國家科學(xué)院院刊》的研究則通過對(duì)5.8萬名社交網(wǎng)站“臉譜”的用戶進(jìn)行調(diào)研,揭示了數(shù)字化人口特征的威力與威脅。
執(zhí)掌此項(xiàng)研究的英國劍橋大學(xué)心理學(xué)家米加爾·科辛斯基表示,基于“贊一個(gè)”的數(shù)據(jù)可以作出非常精密而個(gè)體化的預(yù)測,“人們?cè)诰W(wǎng)上叫好時(shí)并沒有意識(shí)到,自己其實(shí)是在暴露非常私密的信息。”
“臉譜”的廣大用戶“可圈可點(diǎn)”的范圍大到一項(xiàng)公共政策,小到一部電影或鄰居曬出的貓咪照片。在此項(xiàng)研究中,調(diào)研對(duì)象已經(jīng)掛在網(wǎng)上的贊好信息多達(dá)人均68次。研究者利用人口統(tǒng)計(jì)、行為問卷和心理學(xué)測驗(yàn)獲得關(guān)于網(wǎng)絡(luò)用戶的數(shù)據(jù),并將這些數(shù)據(jù)與他們的網(wǎng)上“贊好”進(jìn)行分析比較,以確定是否可以僅依靠用戶的贊好模式預(yù)測其個(gè)人信息。
結(jié)果顯示,盡管并非百發(fā)百中,但通過“贊一個(gè)”得出的預(yù)測在很多方面的精度堪比個(gè)人測試。
比如,研究者發(fā)現(xiàn),如果一位用戶對(duì)美國德克薩斯州奧斯汀市、電影《絕地奶霸》和“戀愛只是兩個(gè)人的事,與他人無關(guān)”的論調(diào)豎起大拇指,再聯(lián)合其他幾個(gè)贊好項(xiàng)目,便可得出該用戶“嗑藥”的結(jié)論。相應(yīng)地,如果有人“贊”了游泳、奧利奧碎屑冰激凌和“臉譜”網(wǎng)站上名為“穿著襪子滑地板”的網(wǎng)頁,他就不太可能服用禁藥。
至于數(shù)據(jù)模型的預(yù)測精度,研究者表示,通過贊好信息的組合預(yù)測用戶傾向民主黨還是共和黨的準(zhǔn)確率可達(dá)85%,判斷其是黑人還是白人的準(zhǔn)確率可達(dá)95%,而對(duì)男性用戶是否同性戀的分辨率可達(dá)88%。
“臉譜”公司公共政策經(jīng)理弗雷德里克·沃倫斯則認(rèn)為,利用公開的贊好信息分析用戶及其需求并沒什么可大驚小怪的,營銷專家和社會(huì)科學(xué)家從很早以前就開始使用網(wǎng)絡(luò)信息預(yù)測使用者的個(gè)人特質(zhì)了。實(shí)際上,網(wǎng)絡(luò)用戶大大方方曬出來的贊好信息已經(jīng)為一些點(diǎn)對(duì)點(diǎn)的精確營銷創(chuàng)造了商機(jī)。
盡管如此,美國紐約大學(xué)信息法律研究中心主任海倫·尼森鮑姆還是提醒人們?cè)诠_表態(tài)時(shí)多留個(gè)心眼:“很多人在同意提交某些信息時(shí),并沒有想到旁人從這里面能推測出什么。”