本報(bào)訊(記者邱晨輝)大數(shù)據(jù)來(lái)襲,究竟意味著什么?在中國(guó)科協(xié)近日舉辦的科學(xué)家與媒體面對(duì)面活動(dòng)上,中國(guó)聯(lián)通網(wǎng)絡(luò)技術(shù)研究院首席專家唐雄燕給出一組直觀數(shù)據(jù)來(lái)描繪了大數(shù)據(jù)的未來(lái)圖景:到2030年,中國(guó)一個(gè)普通的家庭會(huì)有40~50個(gè)智能終端,一個(gè)家庭產(chǎn)生的數(shù)據(jù)是20TB,相當(dāng)于半個(gè)國(guó)家圖書館的藏書容量,即2600萬(wàn)冊(cè),40TB。
“最近兩三年產(chǎn)生的數(shù)據(jù)可能比人類歷史上4萬(wàn)年產(chǎn)生的數(shù)據(jù)還要多,實(shí)際就是由于互聯(lián)網(wǎng)的發(fā)展,互聯(lián)網(wǎng)是大數(shù)據(jù)來(lái)源的最重要的地方?!碧菩垩嗾f(shuō),如果在一輛普通家用轎車上安裝傳感器,大約需要幾十到近百只,而豪華轎車的傳感器數(shù)量可達(dá)200余只。在傳感器的監(jiān)測(cè)之下,汽車每小時(shí)能產(chǎn)生5~250GB的數(shù)據(jù),而谷歌的無(wú)人駕駛汽車每秒產(chǎn)生約1GB數(shù)據(jù)。而據(jù)IDC預(yù)測(cè),到2020年,全球?qū)⒂?00億個(gè)物聯(lián)網(wǎng)終端,遠(yuǎn)超人類的數(shù)量。
大數(shù)據(jù)就是未來(lái)的新石油。唐雄燕說(shuō):“數(shù)據(jù)已經(jīng)成為一種新的經(jīng)濟(jì)資產(chǎn)類別,就像貨幣或黃金一樣,將形成數(shù)據(jù)材料、數(shù)據(jù)探礦、數(shù)據(jù)加工、數(shù)據(jù)服務(wù)等一系列新興產(chǎn)業(yè)?!闭纭洞髷?shù)據(jù)時(shí)代》一書里所說(shuō)的:知道“是什么”就夠了,沒必要知道“為什么”。在大數(shù)據(jù)時(shí)代,我們不必非得知道現(xiàn)象背后的原因,而是要讓數(shù)據(jù)自己“發(fā)聲”。
一個(gè)經(jīng)典的營(yíng)銷案例是:美國(guó)一家零售連鎖超市Target創(chuàng)建的一套女性購(gòu)買行為在懷孕期間產(chǎn)生變化的模型。一次,一男子闖入了他家附近的Target店,向店鋪經(jīng)理大吼:“你們竟然給我17歲的女兒發(fā)嬰兒尿片和童車優(yōu)惠券,她才17歲?。 钡赇伣?jīng)理向來(lái)者道歉,表明那肯定是個(gè)誤會(huì)。但一個(gè)月后,這個(gè)憤怒的父親打來(lái)電話道歉,他女兒的確懷孕了。
“谷歌流感趨勢(shì)”也曾震撼世人。2009年2月,谷歌在《自然》雜志上發(fā)文,解釋了谷歌僅僅通過研究人們上網(wǎng)的搜索記錄,就能夠預(yù)測(cè)季節(jié)性流感的爆發(fā)和傳播。谷歌的預(yù)測(cè)與美國(guó)疾控中心的預(yù)測(cè)數(shù)據(jù)存在很高的相關(guān)性。但美國(guó)疾控中心通告新流感往往會(huì)有一兩周的延遲,而谷歌的預(yù)測(cè)數(shù)據(jù)更有效、更及時(shí)。為此,谷歌公司處理了5000萬(wàn)條詞條與將近5億數(shù)學(xué)模型。
“要在數(shù)據(jù)里面找出有價(jià)值的東西來(lái),這是大數(shù)據(jù)技術(shù)的核心,迅速完成數(shù)據(jù)價(jià)值的提純。”唐雄燕說(shuō)。以監(jiān)控?cái)z影為例,有的監(jiān)控累計(jì)一整天,其中真正有價(jià)值的可能只有“發(fā)現(xiàn)你干壞事的那一兩秒鐘”,在這中間怎么找出來(lái),就是數(shù)據(jù)挖掘技術(shù)的關(guān)鍵。
當(dāng)然,在利用大數(shù)據(jù)價(jià)值的同時(shí),也須警惕數(shù)據(jù)安全和隱私保護(hù)問題。工信部電信研究院互聯(lián)網(wǎng)中心主任何寶宏說(shuō),對(duì)于政策制定,原來(lái)對(duì)用戶的隱私保護(hù)更多側(cè)重于隱私本身,如個(gè)人姓名、電話號(hào)碼、銀行賬號(hào)等,而大數(shù)據(jù)時(shí)代除了保護(hù)這些信息,更需要一些新的思路和方法,如果只是保護(hù)用戶信息的采集環(huán)節(jié),在大數(shù)據(jù)時(shí)代就是不完整的,因?yàn)榭傆幸恍┢渌畔⒛軌蚍治龀鲇行┥婕坝脩綦[私的信息。