來源:互聯網
上載者:User
關鍵字
大資料
大資料
我們
大資料
我們
步驟
大資料
我們
步驟
遵循
大資料
我們
步驟
遵循
擁有
在IT領域,我們都熱愛炒作和製造流行語。 與時尚潮流一樣,我們似乎有一個20年的週期,即我們會回歸到以前的技術,然後賦予其新名稱,並堅稱這是每個人必須立即擁有的技術。 最新的炒作就是:大資料。
從HTTP://www.aliyun.com/zixun/aggregation/13541.html">Interop大會到各種雲會議,我們被告知,如果我們沒有制定大資料戰略(並與雲戰略相結合),那我們就落後了。
對於大資料,有三個重要的事實。 首先,它並不是新趨勢。 亞馬遜、微軟和谷歌自上世紀90年代就開始進行大資料工作。 事實上,幾十年來,很多公司都一直在挖掘資料。 可能由於當時只有資金雄厚的大型公司才能夠進行大資料研究,但大資料確實早已存在。 現在,基於廉價的計算和存儲能力以及新工具和技術,幾乎每個人都可以使用高級資料採礦技術和演算法了。
很多人認為大資料只是商業智慧(BI)的新名稱,雖然這兩者有相似之處,但大資料超出了BI的範疇。
第二個事實:「大」是相對的。 現在各行業各組織確實正面對創紀錄水準的資料增長。 據IDC稱,我們每秒創造超過58 TB資料,到2020年,將擁有超過35ZB的存儲資料。 然而,大資料並不一定是巨大的,大資料並不在於其規模,而在於你需要如何處理它。 擁有100 TB的小公司可能也存在大資料問題,因為他們需要提取、分析資料,並作出決策。
第三,大資料處理中使用的資料的定義是廣泛的,它可以包含結構化和非結構化資料。 對於一些公司來說,最重要的是大資料的中繼資料,或者關於資料的資料。
麥肯錫將大資料定義為「其規模超出傳統資料庫軟體的捕捉、存儲、管理和分析能力的資料集」,筆者補充了這一點:「這些資料集需要大量運行在數百甚至數千台伺服器(雲)的並行軟體(系統)來處理。 」
以下是大資料成功的7個步驟:
第1步:承認存在問題。 這往往是最難的一步。 10年前,我們拒絕承認我們的網路已不再受防火牆和代理伺服器設置的保護,而我們不得不為員工遠端存取開放基礎設施並擁抱互聯網。 對於大資料,IT領導者需要評估其資料情況:
● 你的資料集讓你不堪重負嗎?
● 你不知道所有資料的位置?
● 你(或者企業領導者)沒有從你的資料中得到所需的資訊?
● 企業領導沒有基於資料來做決策?
● 有可能提高IT在企業政策和戰略決策中的相關性嗎?
如果你像大多數公司一樣,部分或者所有這些問題的答案都是肯定的,那麼是時候控制你的資料,並從中挖掘出情報以提供給領導層做決定。
(責任編輯:蒙遺善)