消除關於大資料的八個神話

來源:互聯網
上載者:User

Gartner分析師Mark Beyer認為:企業CIO們如果想在HTTP://www.aliyun.com/zixun/aggregation/33722.html">2020年實現大資料常態化, 那麼就要從消除關於大資料的八個神話開始。

讓十位首席資訊官去定義大資料,你會得到十個不同的答案。 Gartner分析師Mark Beyer說,這是因為大資料對企業的IT專業人員來說仍然並不規範。

Beyer在今年Gartner的Symposium / ITxpo會議上說。 「當事情變得很常見,那它就開始正常化了,我們的工作,作為IT專業人士,就是在2020年前使大資料變得正常化。 」

首席資訊官們可以通過從大資料謊言中區分出事實,來説明他們的企業一步步走向正常。 「神話有助於緩解焦慮,而無益于實際情況,」他說。

這裡是Beyer提出的八個大資料神話:

1.大資料起始于100 TB。 不要再去尋覓大資料標準尺寸了,因其並沒有標準尺寸。 「大資料是對資料的處理,而不是資料的大小,」Beyer說。

2.想要大資料就必須更換基礎設施。 「如果我因為有新的需求就決定改變整個基礎架構,那我是把之前所有的東西都當做了賭注,」Beyer說。 他的經驗教訓是什麼? 「你要搞清楚,(基礎設施)成熟度犧牲的風險是否值得。 」

3.百分之八十的資料是非結構化的。 這可能是最經常被引用的大資料統計了,但根據Beyer所說,其並不準確。 「世界上最大的資訊資產是機器資料。 因為其並未相互關聯就說它們非結構化絕對是個謊言。 機器資料是結構化的資料。 」 順便說一句,這些大量的機器資料,往往是重複的資訊,確認了一切的正常。 「這就是機器資料通常所表達的,」他說。

4.工具將取代資料科學家。 放心,所有花在吸引,拉攏,獲取資料科學家上的錢都不會白花,Beyer說。 「工具是一種工程,工程是對已經發現的事實的重複利用。 而科學是去發現新的事實。 」工具不會取代資料科學家 - 至少在工具可以自行複製和發展之前不會。

5.更多的資料就可以解決資料品質的問題。 「資料品質越低,答案品質就越低,」Beyer說。 首席資訊官們應該關注資料品質。 以通過手機收集的氣質地理定位資料為例,有些人把手機等同于真實的個 人,他說。 然而,手機可以被不小心留在辦公室,或者GPS功能可以在任何時間點被關閉。 「手機不是人,」Beyer說。

6.即時只是速度更快而已。 即時操作,並不意味著加快了當前資料的攝入清理和分析過程,Beyer說。 而是「確保資料收集和決策之間的間隔越短越好,」他說。 此外,大多數企業資料是不需要即時操作的。

7.資料量優於專業知識。 那些認為可以簡單地不再管業務流程的人,請再想一想。 這是因為,「一位好的資料科學家必須在某一時刻被叫停」,Beyer說。 如果沒有業務流程,資料科學家將不斷不斷不斷的進行下去而不能供應商業價值。 需要有人幫忙劃清界線。

8.資料模型沒有用。 這一論斷很絕對。 不過,Beyer澄清說,任何數位資產裡的東西都有其數位模型。 「我們不會因為大資料就捨棄模型,」他說。

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.