大資料也有「成長的煩惱」

來源:互聯網
上載者:User
關鍵字 大資料 大資料應用 目前

  

今天,已經幾乎沒有人會再懷疑大資料的價值,人們更加關心的是如何真正將大資料推向應用,真正發揮其價值。 但是,儘管業界不乏探索,但客觀來看大資料的整體發展目前尚處於初級階段。 換句話說,對於大資料理念的認可並不代表就能利用好大資料。 尤其是在中國,儘管大資料擁有良好的產業基礎和發展前景,但資料資源的開放程度較低、資料資產的保護等現實問題都是當前面臨的主要挑戰。 如何應對這些挑戰,驅動大資料快速走向普遍應用?近日工信部電信研究院發佈的《大資料白皮書》,針對上述問題給出了獨到的解答。 —— 編者

有效的應用模式還未找到

當前,大資料還未形成普遍應用的局面。 究其原因,在於大多數企業,特別是傳統領域的企業,還未找到有效的應用模式。

——理念的應用快于資料的應用

資料就是資產。 這一輪大資料浪潮,使得大資料理念迅速普及。 儘管很多資料尚沒有找到合適的用途,但很多公司已經將其作為資產,對其資料進行規劃、存儲,或自行開發,或積極尋找買家,或尋找合作者。

電信運營商最有可能成為典型的資料資產運營者。 電信運營商掌握豐富的使用者身份資料、語音資料、視頻資料、流量資料和位置資料,資料的海量性、多元性和即時性使其具有經營大資料的先天優勢。 目前主要的電信運營商都已積極探索開發其內部的大資料資源,但從目前的應用發展看,電信運營商的大資料仍主要用於支援內部的客戶流失分析、行銷分析和網路優化分析等,對外的應用模式尚未成型。

——大資料應用呈散發狀

目前,大資料應用並沒有形成燎原之勢,主要集中于互聯網的市場行銷場景。 儘管金融、電信、零售、製造、醫療、交通、物流、IT 等行業對大資料應用表現出極大熱情,但目前在媒體和各種論壇上所公開的大資料應用案例仍然非常零散,這表明大家雖然都很關注大資料,但推進實際的應用仍然存在一定的困難。 唯一眾多企業都推出或者採納大資料應用的領域是基於互聯網的市場行銷,在這一領域應用了大資料的公司不僅包括大型的互聯網公司、眾多專業性的中小型互聯網公司,線下企業也在與互聯網公司合作,積極開發這一領域的價值。

從資料來源看,大資料的應用還處於自給自足的「小農經濟」時代,現有的應用仍然以機構內部資料為主。 以機構內部資料為主的主要原因是資料的開放和交易尚未形成市場的主流形態。 以國內主要的電子商務交易平臺為例,儘管目前推出了很多大資料應用,但這些應用基本上都局限于內部。 由於法律和資料交易機制的不健全,這些交易平臺在對外開放和交易資料上仍然持謹慎態度。 Gartner 的一項調查顯示,即使在全球,以內部資料為主仍然是大資料應用的主要特徵,各行業應用最多的仍然是企業內部的交易資料(應用比例普遍超過50%,多數行業應用比例超過80%)和日誌資料。

從技術角度看,大資料仍以初級應用為主,多數應用仍然使用傳統分析流程和工具,只是擴大了資料的來源、增加了數量。 調研發現,與傳統資料分析相比,新的大資料應用雖然開始使用非結構化資料,但在實際應用過程中,這些非結構化資料只是被壓縮、清洗和結構化後,放入傳統的ETL和分析流程中去。 另一些大資料應用通過採用雲存儲和雲處理技術,提高了資料處理效率,從而增加了資料處理的規模,但這些應用也仍然採用原有的ETL 和分析流程。 缺乏應用模式上的創新,使得目前大資料應用仍停留在初級技術階段。

從應用效果看,目前的大資料應用以延續改善現有業務和產品為主,突破性創新應用尚不多見。 以最常見的互聯網行銷大資料應用為例,在大資料興起之前,精准行銷和個人化推薦一直是企業行銷活動的追求方向,新興資料來源和大資料技術的興起使得企業進一步改善其行銷技能,使其精准行銷能力進一步增強, 但這只是對企業舊有行銷能力的改善。 目前大家議論比較多的突破性創新如網上小貸業務,這項業務完全改變了過去金融機構貸款的流程、信用評價和控制風險的方式,從而極大地降低了貸款的成本,擴大了貸款的範圍。 但目前這樣的突破性創新並不多見。 Gartner 的調查顯示,企業投資大資料的主要目的在於改善客戶服務、流程優化、精准行銷和削減成本等,而新產品/新商業模式這種突破性創新的方向並不是企業的主要目的。

不一樣的中國式煩惱

目前,大資料在全球的發展都還處於初期,技術、制度、觀念等方面都需要改變。 具體到中國而言,資料資源不豐富、技術差距大和法律法規不完善是當前大資料發展面臨的獨特問題。

——資料來源不夠豐富,資料開放程度較低

豐富的高品質資料資源是大資料產業發展的前提。 近幾年在互聯網產業及金融、電信資訊化快速發展的帶動下,我國資料資源總量有了快速增長,已達到全球的13%,但其他行業受資訊化水準制約,資料儲量仍不豐富。 已有資料資源還存在標準化、準確性、完整性水準低,利用價值不高的情況。 同時,我國政府、企業和行業在資訊化系統建設中受到各種因素制約,形成了眾多「資訊孤島」,資料開放程度嚴重滯後。 建立良性發展的資料資源儲備與共享體系,是我國大資料發展的首要問題。

——技術水準不高,技術擴散不暢

我國大資料技術的發展模式也與全球類似,互聯網企業具備快速將國際先進的開源大資料技術整合到自身系統中的能力,並構建了單集群上萬節點的大型系統,但仍缺乏原創技術,對開源社區的貢獻不足,進而對前沿技術路線的影響比較微弱。 同時,由於本土開源社區等產業組織發育滯後,國內領先企業在大資料方面的技術創新也難以向社會擴散。

——相關法律法規有待進一步完善

隨著大資料採礦分析將越來越精准、應用領域不斷擴展,個人隱私保護和資料安全變得非常緊迫。 在隱私保護方面,現有的法律體系面臨著兩個方面的挑戰:一是法律保護的個人隱私,要體現為「個人可識別資訊(PII)」,但隨著技術的推進,以往並非PII 的資料也可能會成為PII,使得保護範圍變得模糊。 二是以往建立在「目的明確、事先同意、使用限制」等原則之上的個人資訊保護制度,在大資料場景下變得越來越難以操作。 而我國個人資訊保護、資料跨境流動等方面的法律法規尚不健全,這成為制約大資料產業健康發展的重要原因之一。 需要結合我國法治建設的實際情況,探索通過行業自律等方式彌補法律體系不完善的弊端。

多措並舉走出發展誤區

對於中國的大資料產業的發展而言,首先需要明確戰略目標和戰略重點,統籌謀劃大資料應用、關鍵技術研發與產業培育、資料開放與資料保護、市場監管、法律法規等關鍵佈局,引導國內各地大資料發展方向,避免一哄而上的盲目發展。

在大資料應用上,一是政務和公共服務領域的應用,應重點面向改善民生服務和城市治理等,積極推動環保、醫療、教育、交通等關鍵領域的大資料整合與集成應用,進一步提高政務和公共服務效率。 二是市場化應用,應重點在跨行業的大資料應用方面出臺推動政策,促進互聯網、電信、金融等企業與其他行業開展大資料融合與應用創新,帶動全社會大資料應用不斷深化。

在技術創新上,一是要加強大資料技術研發方向的前瞻性和系統性,近期重點支援深度學習與人工智慧、即時大資料處理、海量資料存儲管理、互動式資料視覺化和應用相關的分析技術。 二是要聚集產學研用力量形成合力,力爭在大資料平臺級軟體上實現突破,以此為核心發展開源生態。 三是創新科研專案支援方式,將開源和開放標準作為考核指標,通過直接補助或後補助方式激勵企業和科研機構參與開源技術發展,促進大資料技術擴散。

在政府資料開放上,建議推進政府和公用事業領域資料資源的普查工作,並按照相關法規制定政府和公共資料開放中的安全和隱私保護檢查表,對可能涉及國家安全和公民隱私的風險點進行嚴格控制。 在此基礎上,按敏感性對政府和公共資料進行分類,確定開放優先順序,制訂分步驟的資料開放路線圖。 同時,政府也應積極規範和引導商業化的大資料交易活動,為數據資源的流通創造有利條件。

在個人資訊保護上,國際上一些機構提出監管的重點應該「從資料收集環節,轉移到資料使用環節」。 我們要密切關注國際上立法理念的演變趨勢,結合技術發展趨勢和我國國情對相關制度進行前瞻性研究。 同時,為了解決當前個人資訊和資料保護的緊迫需求,可依託行業組織及時總結業界的最佳實踐,逐步形成行業共識,在試點成熟後上升為標準或法律法規並推動實施,為大資料的健康發展保駕護航。

原文連結:HTTP://www.cnii.com.cn/industry/2014-05/20/content_1365298.htm

相關文章

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.