大資料是什麼
國家圖書館的藏書量有2600萬冊,如果從資料來看的話,一個家庭一年產生的資料相當於半個國家圖書館的資料總量。 工業和資訊化部電信研究院互聯網中心主任何寶宏認為,當一個時代的人沒有辦法用那個時代的工具來處理的資料就可以稱為大資料。 而大資料並非現在才出現,現在的大資料是現代人用現代工具處理不了的資料。 其實古人也會遇到同樣的問題,比如人口普查,中國在東漢時期就有幾千萬人,這顯然是大資料。
中國通信學會副理事長兼秘書長張新生認為,推動大資料大量產生的核心動力,是人們渴望能將現實物理社會存在的東西記錄下來,能夠測量它,並且能夠分析。 隨著雲計算的發展,人們會利用雲平臺,通過先進技術從海量的資訊中挖掘出有品質、有價值的資料,從而使大量有價值的資料轉化成知識。
在談到大資料的時候,人們往往知道的就是資料很大,但是它具體有什麼特徵呢?張新生認為,大資料的特徵應該有以下幾個方面。 首先是量特別大,現在的資料計算單位,已經從GB到達了TB、PB,甚至是EB了;其次是多樣性,絕大多數大資料是非結構性的,其種類十分複雜,我們現在的技術手段還沒法對此進行處理;再次是速度,資料產生和傳送的頻率非常快; 最後是價值,從大量的低品質、低價值的資料中獲取知識,猶如從大海中撈針,獲取資料成本很高,但有待挖掘價值大。
大資料有什麼用
當你打開一個網頁的時候,裡面彈出了你個人比較喜歡的產品廣告——其實,這就是一個利用大資料進行精准行銷的例子。
哪些組織或者應用程式掌握了我們的「痕跡」呢?中國聯通網路技術研究院首席專家唐雄燕舉例說,百度掌握你的隱私,微信知道你的社交圈子,淘寶瞭解你的購物習慣,移動電信聯通三大運營商存有你的通話記錄和上網記錄, 銀聯知道你在哪裡用了信用卡,定位軟體則知道你現在何方......
大資料給企業和商業帶來了巨大的價值,比如在互聯網金融領域降低了不良貸款率,減少了交易成本。 谷歌利用大資料預測季節性流感的爆發和傳播。 AT&T將使用者在WiFi網路中的地理位置、網路瀏覽歷程記錄以及使用的應用等資料銷售給廣告客戶。 當使用者距離商家很近時,就有可能收到該商家提供的折扣很大的電子優惠券,等等。
但是,作為大資料的產生者,廣大公眾能夠從大資料的發展中獲得什麼呢?大資料的發展關乎廣大公眾的切實利益,舉例來說,專家們認為利用大資料可以有效地實現「智慧醫療」,為全面的個人健康管理進行服務;個人可以方便獲取醫院的就診資訊 、檢查資料、醫療影像等,以及個人健康的歷史資料;為慢性病患者提供遠端資料分析和服務;輔助臨床診斷和用藥決策;為公共衛生機構提供及時的統計分析;以及為藥品研發、治療方案設計提供資料分析。 隨著大資料的發展,廣大公眾的生活也將變得更加便利。
我們該怎麼做
剛剛買完房子的你,突然收到很多房產開發商或者代理商的電話和短信,這時你肯定感覺自己的資訊被洩露了。 對於大資料時代來說,廣大公眾會更加關注自己的隱私,而我們應該如何保護自己的隱私呢?
專家們認為,大資料時代關注的是使用者的特徵,而不是具體的資訊。 比如說,通過大資料,希望知道使用者是一個處於20—30歲年齡段生育過子女並接受過高等教育的女性,而不是想知道她姓甚名誰,今年多大,有幾個小孩。 還有一點,就是大資料的採集和處理主要是由一些大型的公司在做,它們有自己嚴格的規範和流程,以確保資訊安全。
專家們也給出了一些具體的建議:首先,國家相關的法律也對個人隱私的保護問題進行了相應的規定和約束,2013年1月份全國人大通過了關於個人使用者隱私保護的決定,同時工信部根據全國人大的決定, 出臺了關於互聯網和電信網個人資訊保護的條例以保護使用者的隱私,這些都對個人隱私的保護具有一定的作用。 其次,企業要履行自己的社會責任,通過特定的技術手段對使用者資訊進行不可逆的處理。 一旦發生使用者資訊外泄,企業要承擔相應的責任。 最後,使用者也需要注意保護自己的隱私。 一些資訊洩露事件的出現,也與廣大使用者本身對個人資訊的保護意識不足有一定關係。 所以,在大資料時代,迫切需要向使用者開展加強自身資訊保護意識的教育,也就是安全上網的知識普及和教育。
不論你接受還是不接受它,大資料就在那裡,不近不遠。 大資料已經在我們的生活當中,給我們的生活帶來了巨大影響。 一方面,我們要加強個人隱私的保護,另一方面,也要充分適應大資料給我們帶來的變革,享受它給每個人的生活帶來的便利。