大資料記錄一切 是天使還是魔鬼?

來源:互聯網
上載者:User
關鍵字 大資料 自己 這些

提起大資料,很多人都感覺略知一二;但大資料到底是什麼,又很少有人能解釋清楚。 今年兩會期間,包括小米科技創始人雷軍、聯想集團董事長楊元慶、科大訊飛(002230,股吧)董事長劉慶峰在內的多位代表、委員都提出了與大資料相關的建議和提案,他們一方面希望從國家層面推動大資料的發展, 另一方面也對它在資訊安全方面可能存在的隱患提出了警示。

大資料記錄了所有一切

一份調查顯示,2013年我國產生的資料總量超過0.8ZB,相當於2009年全球的資料總量;而到2020年,一個普通中國家庭每年產生的資料量,將相當於半個國家圖書館的資訊儲量。

中國電子學會秘書長徐曉蘭委員指出,海量的資訊儲存和挖掘,既是大資料的價值所在,也是它有別于傳統互聯網、可能對資訊安全帶來的新隱患。

「大資料時代,記錄了很多以往根本不可能或者不需要記錄的資料,比如微博、朋友圈的內容,上網產生的cookie,家庭水電氣使用的情況、汽車和大型設備上安裝的感應器拿到的資料等。 」社交資料分析公司獨到科技的CEO張文浩說,「如果這些資訊都是"孤島",影響可能不大。 但一旦相互關聯,影響力會大得驚人。 」

中科院資訊工程所所長田靜委員也表示,以往碎片化的資料只是盲人摸象,但現在這些碎片全都被存貯起來,通過相關性分析拼湊,「就知道象到底長什麼樣了」。

技術上的差距,也造成了大資料暫時的「不安全」。

「沒有自己的分析能力,我們怎麼能搞清楚哪些資料是需要保護的? 」

對於田靜的這個「問題」,國家資訊化專家諮詢委員會副主任、中國工程院院士鄔賀銓提供的一組資料給出了答案—資料中,大約有一半是應該保護的,但我們現在真正保護的「只有一半的一半」,很多資料在有意或無意當中被獲取,「 如果這些資料整合起來,被某些別有用心的人利用,會對安全造成很大的影響」。

徐曉蘭介紹,目前我國很多機構和企業使用大資料分析軟體都是國外廠商生產的,特別是近幾年視頻等多媒體資料爆炸性增長,「這些資料都是異構化的,這部分軟體是我們的短板」。

著名軍事專家尹卓委員則指出,現在互聯網所使用的伺服器大都放在美國,「自己沒有伺服器怎麼可能安全」?

另一方面,在田靜看來,缺乏大資料環境下的安全理念也是重要原因之一。 「過去認為無害的資訊,在資料爆炸的今天,已經完全不一樣了。 觀念不改,是沒有秘密可保的。 」

張文浩也認為,國人缺乏這方面的意識。 「在美國,很多人都會要求不公開自己的隱私,或者主動把自己的資料提供給某些特定的機構使用;但在國內幾乎沒有聽到過,大家也不知道什麼類型的資料可能會有多大的風險。 」

大資料或許也很「危險」

張文浩認為,很多人對於大資料的理解都只注意到資料的體量和統計,「其實,通過深度分析,從紛繁的資料中抽象出規則和原理,並實現對未來的前瞻性預測,才是大資料真正的價值和魅力所在」。

因為大資料,奧巴馬在2012年成為過去70年來,第一位在失業率高達7.4%的情況下成功連任的美國總統;因為大資料,Target超市「預測」了18歲少女的懷孕......

任何一項新技術的背後,都可能懸掛著一把達摩克利斯之劍。 大資料也是如此,在人們驚歎于它的「神力」之時,「威脅」也正悄悄逼近。

「前兩年,國外一家情報搜集機構利用國內某機構人員公開發表的資料和資訊,進行深度挖掘分析,生成了有價值的情報。 」徐曉蘭告訴記者,後來經過詳細調查,確認情報確實不是該人員提供,而生成情報的那些資料本身也是可公開的。 「這在以往幾乎是不可能的,也給我們敲響了警鐘。 」

尹卓以戰時的交通流量資訊舉例說,如果不注重資料的安全使用,將可能對國家安全帶來隱患。 「科索沃戰爭中,南聯盟的油料庫雖然隱蔽得很好,但美國軍方通過對衛星圖中的交通流量進行分析,劃定了大量油罐車經常出沒的區域,在進行精確搜尋,從而一舉炸毀。 」

如果您認為這些「危險因素」離自己很遠,那就大錯特錯。

「現在很多智慧手機的應用都要求訪問通訊錄,」鄔賀銓說,很多人覺得自己沒有什麼秘密,就同意了。 「但實際上,這不僅會透露自己的大量資訊,也會把很多人置於隱私暴露的危險之下 。 」

張文浩也指出,現在很多年輕人都有用手機發微博或者「簽到」的習慣,「這樣其實會洩漏自己的很多資訊。 比如你白天經常簽到的位置就很有可能是你的單位,傍晚以後簽的多半是自己家」。

大資料正經歷成長的煩惱

「要想征服資料,只有更好地利用它們。 」張文浩說,資料是一種資源和財富,積累越多,產生的效力也會越大。

這個觀點得到了鄔賀銓的認同。 他認為,越想規避大資料帶來的安全風險,越需要搜集儲存海量的資料,並進行深入的挖掘分析。 「有統計顯示,國內資料搜集量不及日本的60%和北美的7%,大量資料留這樣白白流逝。 」

「企業掌握的資料畢竟有限,而且是局部的。 」百度公司董事長李彥宏委員提出了資料開放的概念,國家應該把那些不涉及安全的資料公開,讓有能力的機構進行更好的分析利用。

國家基礎地理資訊中心原總工程師李莉委員指出,有的公共部門掌握了大量公共資訊,這些資料是國家基礎資訊的重要組成部分。 鄔賀銓強調,這些資料「不願與其他部門共用,導致了資訊不完整或重複投資」。

共用資料在技術上是否存在很大的難度? 在徐曉蘭看來,現在需要大力發展的資料採礦、分析方面的技術,但對於資料共用本身而言,技術不是最大的障礙,關鍵還是利益協調。 她說幾年前,國土部和銀監會準備摸底國家土地資訊,「一開始很多人提出各種各樣的困難,幾乎認為是不可能完成的任務。 但後來引入問責等行政手段,得到地方配合,進行得就很順利」。

張文浩認為,建立一個公開、透明、規範的資料超市,將會大大增強資料的利用率。 但在這個過程中,需要仔細考量什麼樣的資料可以進入市場。

這就涉及到立法的問題。 「界定"隱私"和為數據進行安全分級,是制定法律法規時要優先考慮的方面。 」他指出,「個人化服務和隱私之間是一個博弈。 名字、電話、住址...... 不能什麼都說是隱私,因此需要為數據安全分級。 簡單地說,通過資料分析的經驗,我們會知道哪類資訊具有更強的指向性和排他性。 這類資訊的安全級別就應該更高。 」

相關文章

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.