作為一個(gè)生活平淡的人,你是否設(shè)想過(guò)在完成了某一天的無(wú)聊工作后,會(huì)在自家的廚房里聽(tīng)到警察的敲門聲,然后被告知你可能跟一周后即將發(fā)生的一起兇殺案件相關(guān)?
在湯姆·克魯斯主演的電影《少數(shù)派報(bào)告》(MinorityReport)中,神秘的“先知”計(jì)算機(jī)系統(tǒng)能夠預(yù)知犯罪活動(dòng),甚至可以精確到時(shí)間、地點(diǎn)及卷入其中的人物,讓警方能夠提前行動(dòng)加以阻止。
而在現(xiàn)實(shí)中,這并非小說(shuō)家的憑空想象。美國(guó)洛杉磯因警員比例過(guò)低,一直是全美犯罪率最高的地區(qū)之一。2012年,該警察局開(kāi)始進(jìn)行了一項(xiàng)嘗試,由加州大學(xué)人類學(xué)與數(shù)學(xué)系聯(lián)合組成的一個(gè)實(shí)驗(yàn)室,為該局提供了一套類似“先知”的計(jì)算器系統(tǒng)。這套系統(tǒng)把洛杉磯市發(fā)案最高的福德希爾地區(qū)劃分為幾個(gè)區(qū)域,通過(guò)分析過(guò)去的1300多萬(wàn)起案件,找到了發(fā)案與日期、天氣、交通狀況以及其他相關(guān)事件之間的某種關(guān)系,進(jìn)而能夠預(yù)測(cè)出哪個(gè)區(qū)域在未來(lái)數(shù)小時(shí)內(nèi)可能發(fā)生案件。
現(xiàn)在,洛杉磯警察局有一組專門的警員每天會(huì)駕駛著警車按照計(jì)算器發(fā)出的巡邏指令前往不同的區(qū)域。盡管這些熟練的經(jīng)驗(yàn)豐富的警員仍然不適應(yīng)被一堆二進(jìn)制的代碼所指揮,但是在不增加警員的前提下,“先知”已經(jīng)使該地區(qū)財(cái)產(chǎn)犯罪下降了12%,盜竊案件下降了26%。
美國(guó)的另外一所大學(xué)——麻省理工學(xué)院正在進(jìn)行另外一項(xiàng)研究,他們與當(dāng)?shù)匾患覌D女醫(yī)院合作,把該醫(yī)院所有心臟病患者的病例和心電圖錄入計(jì)算機(jī),從而創(chuàng)建了一個(gè)計(jì)算器程序。當(dāng)有病人來(lái)這里看病時(shí),這個(gè)程序可利用心臟病患者的心電圖,預(yù)測(cè)在未來(lái)一年內(nèi)患者心臟病發(fā)作的機(jī)率。美國(guó)咨詢界的翹楚麥肯錫咨詢公司將這些現(xiàn)象總結(jié)為一個(gè)概念——大數(shù)據(jù)(BigData),并預(yù)言這項(xiàng)技術(shù)將成為人類未來(lái)生產(chǎn)力的指向標(biāo)。隨后,英國(guó)牛津大學(xué)教授維克托·邁爾-舍恩伯(ViktorMayer-Schonberger)的著作《大數(shù)據(jù)時(shí)代》在全球暢銷,讓大數(shù)據(jù)這個(gè)概念開(kāi)始深入人心。
“很難準(zhǔn)確地描述什么是大數(shù)據(jù)。”維克托教授說(shuō):“它應(yīng)該是一種思維方式,這也是一個(gè)新的改變,從因果性到相關(guān)性的轉(zhuǎn)變,也就是不問(wèn)原因,而是直接由數(shù)據(jù)得出結(jié)果。”
他說(shuō),在過(guò)去我們問(wèn)的更多的是“為什么”,對(duì)人類來(lái)說(shuō),這其實(shí)是一個(gè)很大的挑戰(zhàn)。比如心臟病發(fā)作這項(xiàng)研究,盡管醫(yī)學(xué)界已經(jīng)研究了幾十年,但是仍然很難找出發(fā)病的具體因果關(guān)系,但是現(xiàn)在,只需要建立一個(gè)足夠大的心電圖數(shù)據(jù)庫(kù),并且找到數(shù)據(jù)與心臟病發(fā)作的對(duì)應(yīng)關(guān)系,就可以作出準(zhǔn)確的預(yù)測(cè)。
“搜集和分析數(shù)據(jù),從表面上看,這就是大數(shù)據(jù)的開(kāi)發(fā)者們正在做的工作,這并不是什么新的技術(shù)。”北京締元信公司CEO秦雯說(shuō):“但是互聯(lián)網(wǎng)的發(fā)展使我們?cè)谶^(guò)去的數(shù)年內(nèi)制造的數(shù)據(jù)超過(guò)了人類歷史上的數(shù)據(jù)總量,更重要的是,隨著全息攝影技術(shù)、傳感技術(shù)以及谷歌眼鏡這樣的新技術(shù)的誕生,我們收集數(shù)據(jù)的能力變得前所未有地強(qiáng)大,數(shù)據(jù)的爆炸性增長(zhǎng)為更全面和精確的分析工作提供了可能性,這正是這個(gè)時(shí)代的價(jià)值。”
整合無(wú)序的資源
6300多年以前,古埃及人通過(guò)太陽(yáng)升起和下落之間的時(shí)間規(guī)律制做了太陽(yáng)歷,預(yù)測(cè)太陽(yáng)在某一天何時(shí)會(huì)升起,將單向前進(jìn)的時(shí)間劃分為365天為一個(gè)周期。2200多年以前,中國(guó)人通過(guò)觀察候鳥遷徙和植物發(fā)芽制作了二十四節(jié)氣,大致預(yù)測(cè)了一年之中的天氣變化情況,讓農(nóng)業(yè)的播種和收割時(shí)間變得有規(guī)律可循。
北京締元信數(shù)據(jù)公司CEO秦雯認(rèn)為,從廣義上看,這些都是根據(jù)過(guò)去的數(shù)據(jù)進(jìn)行的預(yù)測(cè),但是與現(xiàn)在大數(shù)據(jù)的含義相比,這些預(yù)測(cè)顯得過(guò)于廣泛,而且規(guī)律更容易掌握?,F(xiàn)在的大數(shù)據(jù)更多的是分析由人類行為所構(gòu)成的現(xiàn)象,比如華爾街的股票走勢(shì)、洛杉磯的犯罪發(fā)生情況、淘寶網(wǎng)上即將熱銷的商品,而在過(guò)去這些都是不可預(yù)測(cè)的。