大資料來臨,企業還未就緒?

來源:互聯網
上載者:User
關鍵字 大資料 大資料 具有 大資料 具有 但是 大資料 具有 但是 認為 大資料 具有 但是 認為 更加

大資料技術令人興奮,它具有創新性且功能強大。 大資料技術絕對可以將企業分析學帶入新的高度... 但還不是現在。

在全球1000家大公司以及無數家規模較小的公司中,商務智慧(BI)的技能和最佳實踐已經積累了多年,關係資料庫管理系統(RDBMS)更長達數十年。 這些範疇內的產品具有卓越的工具技術、可管理性以及容錯性,提供了針對非開發者設計的介面,有精心創建的資料模型,經過多年來的細化,代表著大量的投入。

同時,Hadoop通常用在命令列中,由命令MapReduce代碼控制,MapReduce代碼必須採用JAVA編寫,並且利用單一且易損壞的名稱節點控制的檔案系統(HDFS)。 雖然一些基於瀏覽器的工具不斷湧現,並且類似Hive的技術也為BI工具提供了連接層,但是我們仍然處於上世紀90年代的技術水準。 在此領域,企業尚未準備充分,甚至還未接近準備充分。

深入見解

由於涉及到企業採集、分享和淨化資料的策略和邏輯,因此將資料轉化為資訊在眾多領域已經成為一項長期鬥爭。 在解決這一難題上,大資料並不比商業智慧更加出色。 資料「做大」僅增加了所管理的資料覆蓋面,但卻必將使資料分析變得更加複雜。

大資料優點之一是具有較為靈活的方法,可在輪詢/分析時,對其進行定義,從而消除了管理資料過程中的一些複雜性。 但是管理非結構化的資料工具相對不成熟,並且企業內資料專家在概念上對此也尚未習慣。

大資料的長期潛力是很好的,因此應縮短其創新週期。 但在短期內還不太可行。

小企業使用方式和策略

如果我是一個速食企業家,在一個中等規模城市擁有5個麥當勞的特許經營權,如何利用Hadoop和MapReduce以獲得更多的顧客訪問量,對我而言還不明顯。 如果我擁有一家大型網路公司、一家大型金融服務公司、一家製造相關企業或者大型零售商,具有很大的點擊量、市場和資料,那麼大資料對我的吸引力更加直接。

我確實認為,小型企業現在就應該開啟其大資料策略。 如果他們總是線上(大部分),他們甚至將擁有大量的點擊資料,並且利用轉載操作,就可以開始積累大量的店內視頻(可以透漏購物習慣、店內佈置的效果和產品親和力)。 資料可以説明每個人,當不再丟棄資料,即成為大資料。

大資料的投資回報率

在互聯網行業,大資料能夠在吸引關注以及相應貨幣化方面盈利。 在製造業,大資料能夠在降低或者消除裝配線停機時間獲益(通過對設備故障的預測分析)。 在金融服務領域,大資料能夠促使服務更好、更有效,從而實現更有利的經營策略。 媒體公司可以銷售更多的廣告版面。 電子商務公司可賣出更多產品。

但是這些公司擁有一般企業經營公司不具備的一個共同點:投資回報率顯而易見,足以使這些公司排除進入障礙進入大資料領域。 企業經營團隊是否具有足夠智慧、預算和吸引力,引起必需的Hadoop專家、統計人員和資料專家,以實現有吸引力的投資回報率? 很可能不會。 在現成產品以及專業服務,大資料價值必須非常好、便宜而且足夠成熟,才能吸引顧客購買。

更廣泛的IT戰略影響

大資料絕對有改變企業整體IT戰略的潛力。 這是因為大資料涉及到的內容更多。 例如Hadoop使用直連存儲和商用硬體,這對於我們常見的採用存儲網路、昂貴的伺服器和設備的企業部署具有極大破壞性。

Hadoop也可能使企業更強調JAVA技能,而減少SQL技能的關注。 Hadoop所使用的集群方法也可能加速混合預置/雲策略的推廣使用:將資料推動到預置伺服器上更加容易,但雲計算的彈性在解決大型集群間歇性指令時更加有效。

技能短缺

數學、統計和資料建模技能是必需的,這是一個不足。 很多大學現在才開始在分析和資料科學學科中設立課程,解決這一問題。 正如我上文提到的,JAVA程式設計技能將非常有用,甚至將從事面向資料的工作,而非開發人員的職位。 對於實力雄厚的企業來說,最重要以及最難找的是擁有在這些領域內專業知識和技能相結合的人才。 這就是成功的公式,招聘到符合要求的人才可能非常困難。

哪些行業受益?

同樣,互聯網、媒體、金融機構、網上零售業以及製造行業將受益最大。 供應鏈企業,零部件分銷商當然也可加入到受益的隊伍中來。 醫療研究、管理或者支付/保險操作也可受益。 這些行業的行銷組織可以才從大資料中獲得很大的利益。

我認為每個組織機構都有大資料,不僅是那些沒有對其進行監控、沒有保留資料的機構,還有那些沒有評估通過改變運作模式為以大資料為驅動的成本和好處的企業和機構。

大資料和雲

Hadoop商用硬體以及按需添加的集群方法對雲計算模型具有巨大親和力。 在一般情況下,彈性是兩者的特性之一。 另一方面,上行頻寬仍然是雲中大資料的限制因素。 與遷移大量資料並創建資料庫相比,對新資料進行流失處理和維護雲資料庫(包含Hadoop分散式檔案系統檔)要更容易一些。 這又是終將改變並消除障礙的一個領域。

大資料挑戰

資料品質是一個非常大的挑戰。 資料管理也是一個更廣泛的問題。 在這兩種情況下,非結構資料的快速增長會加大資料整合的難度。 同時,許多大資料技術尚未成熟也是潛在的缺陷。 因此,許多公司仍處於大資料的研發階段。 大資料技術必須更加容易,專案管理技能更廣泛,大資料方可真正成為主流。

CEO和CFO

我認為許多CEO以較高層次瞭解大資料,因此他們希望獲得大資料。 但是,他們的管理團隊必須更加細緻的理解大資料,並執行大資料建議。 從這種風險上看,我不認為我們已經實現了大資料。 大資料只有更見簡單,管理人員充分熟悉,才能普遍。

在許多公司,商業智慧購買決定權在於CFO團隊。 如果大資料成為BI的繼任者,那麼可認為CFO將保持這項權利。 但是,大資料項目目負責人可能來自IT和企業的各個部門。 著手熟悉技術以及取的第一手資料可能成為專案成功的先決條件。 金融業資料相對分散 –可能包含PB規模總分類賬- 但是我還沒有遇到。 因此CFO們似乎不大可能作為大資料決策者。

五年預測

大資料可能是現在的炒作頂點(或許可能不是),但是這絕對不是一時頭腦發熱。 根據我的經驗,資料相關非常少。 無論商業應用開發以及相應的交易資料庫需求,或者空間分析、各種預測分析和其它收集到的關於大資料的觀點,我們討論的是有用的重要技術。

通常情況下,新資料技術以創新和突破性技術開始,然後成為主流和主要技術,並最終成為日常技術,而不是失敗和消失。 我認為毫無疑問在將來大資料將成為企業的主流。 未來可能是五年時間,取決於在這階段內,大資料是否能夠渡過其分散的小型行業階段。

在某項技術被企業廣泛應用前,該技術必須已非常成熟,甚至有點枯燥。 大資料將會達到被企業廣泛應用的程度,但它得先克服一些障礙。

(責任編輯:蒙遺善)

相關文章

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.