太一星晨馮曉傑:淺析大資料的四大誤區

來源:互聯網
上載者:User

【天極網伺服器頻道9月5日消息】目前大資料很火,可是具體到什麼是大資料,各個廠商又有著不同的答案。 我們知道,行業內依靠四個特徵界定大資料:Volume,體量巨大,PB級別; Variety,資料類型繁多; Veracity,價值密度低; Velocity,處理速度快。 簡而言之,需要從不同維度抓取海量資料並將其快速轉變為有序的可用資訊。

目前階段,大資料解決的主要問題分為3類:拓展傳統的商業智慧(BI)領域。 以前針對大資料量的統計、關聯分析、趨勢預測由抽樣變成全量分析、將資料回流到各種報表;業務流程改。 對各種資料進行聚合分析,用來做業務流程改進和考核的依據;資料商品和商業應用。 通過對已有資料或資料處理能力進行服務化或產品化包裝,形成資料產品或資料服務。

應用交付廠商太一星晨產品總監馮曉傑表示,大資料單從字面意思似乎不難理解,可以認為是海量級的資料,但是在這海量級的資料究竟意味著什麼,這在很多業內外人士的概念裡還純在著一些認識誤區。

大資料誤區一:只要大就好

企業面臨著資料量的大規模增長。 例如,IDC最近的報告預測稱,到2020年,全球資料量將擴大50倍。 目前,大資料的規模尚是一個不斷變化的指標,單一資料集的規模範圍從幾十TB到數PB不等。

很多人提起大資料,如果不提上幾嘴日處理資料量上GB、Hadoop集群擁有多少節點、總存儲多少PB等諸如此類的語言,都很怕別人覺得自己不專業。 但是,難道真的只有資料大了,才是大資料嗎?

馮曉傑表示,資料如果僅僅是大那是沒多大用處的!就好像資金的意義在於如何使用周轉一樣,資料大了,但不使用,讓它孤零零地偏安機房一隅,那它就不是大資料了。 比如不少傳統的入口網站,基本上就處於坐擁金山卻無福消費的境況。 每天上億的使用者量,卻只是簡單的廣告呈現,沒有通過對資料的分析產生更多價值。

大資料誤區二:只有技術大牛才懂大資料

大資料可以通過MapReduce這一併行處理技術來提高資料的處理速度。 MapReduce的設計初衷是通過大量廉價伺服器實現大資料並行處理,對資料一致性要求不高,其突出優勢是具有擴充性和可用性,特別適用于海量的結構化、半結構化及非結構化資料的混合處理。

傳統的資料管理和業務分析工具及技術都面臨大資料的壓力,與此同時説明企業獲得來自大資料分析見解的新方法不斷湧現。 這些新方法採取一種完全不同于傳統工具和技術的方式進行資料處理、分析和應用。 這些新方法包括開源框架Hadoop,NoSQL資料庫以及大規模並行分析資料庫(如EMC的Greenplum,惠普的Vertica)。 這意味著,企業也需要從技術和文化兩個角度重新思考他們對待業務分析的方式。

馮曉傑表示,對於大資料的應用更多的是一種戰略能力,而非細節的執行技能,這種能力是可以説明決策者能從無盡的資料裡看出商機看出價值,從而為企業帶來更高的利潤。 而作為決策者並不用太關心在技術細節層面,大資料到底怎麼技術生成,又是如何理順提升使用者體驗的。

大資料誤區三:是個公司都得上大資料

大資料是不是只適合大型企業呢? 對於一般公司而言,根本就不可能擁有PB級別的資料,也無法支撐高昂的資料存儲成本,而且大資料方面的技術人才十分稀缺。 不過小企業也可以利用協力廠商的資料處理服務平臺。 至於企業是不是需要大資料要看自身的業務需要。

馮曉傑表示,雖然大資料固然是個香餑餑,但不是所有人都能消化得了,或者說並不是所有都有上大資料的必要,而是要衡量企業的現狀,看清楚主次矛盾,或是要考量好投入產出的回報率,大資料並不是適合所有企業的現狀。

大資料誤區四:我就要海量資料

是不是如果有了海量的大資料就能助力企業發展呢? 這又回到了大資料價值和金錢價值的類比概念上。 顯然,不流動的錢,是越放越沒有價值,而基數越大,可能導致的損失就越大。

金錢如此,大資料亦然。 只有像比特幣玩家們一樣,不停地使用資料,並以無比的熱情挖掘資料背後的關係和價值,才能如滾雪球一般,使資料之間的相互關係更豐富更完善。 同理,對於企業的大資料來說,只有充分利用大資料,讓大資料充分流動起來,不斷的實現增值效果,那麼才有機會更大的釋放大資料的能量。

因此,馮曉傑指出,對於企業決策者來說,看待大資料必須有一個清醒的認識,當在腦袋發熱準備花大價錢上大資料之前,都一定得先想明白透徹了:我真的需要大資料嗎? 大資料真的能為我所駕馭嗎?

網上商城商品/規格/促銷價格(作者:李祥敬責任編輯:李祥敬)

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.