來源:互聯網
上載者:User
關鍵字
大資料
大資料
我們
大資料
我們
他們
大資料
我們
他們
看到
大資料
我們
他們
看到
但是
儘管對於許多人來說,大資料相關技術,如Hadoop、NoSQL資料庫以及記憶體分析等都還是新鮮事物,但不得不承認在過去的一兩年中,這些技術都得到了更廣泛地運用和發展。 大資料究竟有多大? 市場調研機構Wikibon的分析師Jeff Kelly指出,2012年大資料超市總額為114億美元,預計到2017年將增長到470億美元。
Jeff Kelly曾就職于TechTarget,並擔任多年新聞編輯工作。 近期,他接受了記者的採訪,針對Wikibon對大資料的預測進行了深入交流。 本文為採訪實錄,主要論及了大資料蔓延、大資料生態系統以及NoSQL等話題。
當你研究大資料超市的時候,除了Hadoop,還有哪些元素是在你的考察範圍以內的?
Jeff Kelly:針對這個問題我們做了很長時間的考慮。 Hadoop當然是其中最重要的一環,但並不是全部。 大資料幾乎與資料生命週期管理中的每一個環節都息息相關,於是我們最終決定對新技術進行考量。 因為傳統資料管理技術無法處理海量、多類型以及高速流動的資料,而Hadoop、NoSQL等則可以。
我們還對硬體進行了評估,因為它是支撐上述技術的基礎。 另外對於一些不是非常新,但是與大資料負載很貼近的軟體技術也是我們考量的範圍。 舉個例子,比如你需要資料整合軟體把把資料導入Hadoop。 但目前還沒有一個統一的大資料平臺標準。
傳統的商業智慧報表軟體不是我們考量的範圍,但其他一些視覺化軟體我們會重點關注。 大資料不僅僅是一種技術,同樣也是一種對待資料的態度。 在大資料的推動下,人們也開始使用一些原有的工具來探索更多處理資料的方式。
我們看到的大資料用例都有哪些?
Kelly:可以看到,互聯網公司在大資料應用方面一直走在最前面。 可以說是Google創造出了我們今天所知道的大資料,然後Yahoo創造了Hadoop,其他互聯網公司也都紛紛在做新的嘗試。 但是我們也應該看到,現在許多傳統行業的大資料應用也在開展,比如生物製藥領域在使用大資料進行基因研究。
金融服務公司也是大資料的早期應用者,比如利用Hadoop技術獲得更多的競爭力。 另外在零售業,雖然發展速度稍緩,但是他們也在不斷做大資料的嘗試。 雖然人們會認為這有些誇張,但我不得不說,大資料已經滲透到了各行各業當中。
根據你的觀點,對於那些大型廠商如IBM和Oracle等,大資料超市是怎樣的呢?
Kelly:大型廠商毫無疑問都在著力投入大資料產品的服務的開發,因為他們知道這是客戶需要的東西。 不少廠商都開始發力大資料超市,而IBM在其中是已經走得比較久的。 IBM很久以前就收購了不少分析軟體公司,他們還在專注于所謂的智慧地球的專案,其中大資料或者說如何更好地利用好資料是他們的重點。 IBM在大資料業務收入方面也是領先的,根據Wikibon的資料,藍色巨人在2012年大資料應用方面的收入已經超過了10億美元。
Oracle在他們的集成系統中使用了Cloudera Hadoop(參考連結:Oracle和Cloudera高管談大資料機),他們也有自己的NoSQL資料庫,還有豐富的Exadata一體機系列。 關於這些是否能成為大資料戰略,我們曾經有過激烈的討論。 根據所看到的負載類型,我們暫且稱之為大資料。
但是Oracle在所有供應商裡應該是地位最尷尬的,因為「Hadoop/NoSQL」模型是需要進行橫向擴展的,集群應該由廉價的PC伺服器組成。 Oracle提供的都是縱向擴展的「大盒子」,而且價格昂貴。 對此Oracle如何回應是非常值得關注的。 Oracle在資料庫領域的領先地位是根深蒂固的,這是他們最大的資本,但我們也應該看到他們現在的模式是與開源社區相違背的,而後者是大資料發展的主要動力。
NoSQL、NewSQL和Hadoop的發展趨勢是怎樣的?
Kelly:最大的趨勢就是Hadoop廠商現在都在努力把SQL功能帶入Hadoop和NoSQL當中。 人們知道NoSQL善於橫向擴展並處理非結構化資料,但是要將其上升到企業級應用層面,就必須滿足企業級在可用性和安全性方面的要求。 現在NoSQL的發展趨勢就是向企業級轉移,這會讓NoSQL資料庫技術的發展邁上一個新的臺階。
(責任編輯:fumingli)