雲端運算時代:大資料泡沫正無限膨脹)

來源:互聯網
上載者:User

在當今企業中80%的資料都是非結構化資料,這些資料每年都按指數增長60%。大資料將挑戰企業的儲存架構、資料中心的基礎設施等,也會引發資料倉 庫、資料採礦、商業智慧、雲端運算等應用的連鎖反應。未來企業會將更多的TB級(1TB=1024GB)資料集用於商務智能和商務分析。到2020年,全球 數據使用量預計將暴增44倍,達到35.2ZB(1ZB=10億TB)。大資料正在徹底改變IT世界。10月幾大科技巨頭的舉動使更多人意識到所謂的高科 技泡沫——即“大資料”正在無限的膨脹。

微軟與Hortonworks合作開發Hadoop

早在今年2月,微軟的HPCTeam Dev就公布了被稱為“Dryad”的分散式運算平台。這也標誌著微軟向Windows HPC Server使用者提供了能夠進行海量資料處理的工具。微軟推出Dryad的目就是鼓勵開發人員們在Windows或者.Net平台上編寫大規模的並行應用程 序。在當時這也被視為微軟在大資料領域與Hadoop對抗的有力產品。

但微軟卻於10月12日在西雅圖舉行的SQL PASS 2011峰會上出乎所有人預料的宣布將與從雅虎分拆出來的Hortonworks合作開發Hadoop,並將在Apache Hadoop上實現搭建Windows Azure以及Windows Server平台。同時基於Hadoop的Windows Server還會與微軟現有的BI工具聯合處理任務。

微軟與Hortonworks深度合作的目標是藉助Hortonworks在此領域的專長協助最大化將Hadoop整合到微軟的產品之中。同時兩家 的合作可協助簡化下載、安裝和配置等幾個Hadoop的相關技術。包括HDFS、Hive、Pig。這將有利於企業通過Hadoop拓寬自身的業務。微軟 還將編寫新的ODBC驅動程式並擴充自己現有的查詢系統到Hive。這樣一來使用者將能夠直接從Excel、PowerView執行Hadoop查詢。

Red Monk分析師Stephen O'Grady也很看好Windows和Hadoop的結合。他表示這將是非常具有吸引力的,這將吸引大量的Windows使用者。微軟在此領域具有競爭的實力。

大資料領域 Oracle硬體、軟體齊發力

Oracle作為全球最大的關係型資料庫供應商也不甘寂寞,在其產品鏈條中加入了被稱為“NoSQL Database”的NoSQL資料庫。NoSQL Database是Oracle在2011 Oracle全球大會上宣布推出的Oracle Big Data Appliance的一個組成部分。Big Data Appliance是一個整合了Hadoop、NoSQL Database、Oracle資料庫Hadoop適配器、Oracle資料庫Hadoop裝載器及R語言的系統。

而Oracle的在大資料領域的投入還遠不止這些。他們不僅在軟體層面推出了Oracle Big Data Appliance,在硬體層面Oracle還推出Exalytics。Exalytics目標非常明確,就是針對大資料。Oracle推出的In- Memory計算就是在Big Data時代能夠提供海量資訊——包括結構化、半結構化、資料集及非結構化資料的分析。同時Exalytics還能夠支援混合的資料來源——包括 Oracle資料庫、Teradata、微軟SQL Server以及獨立的Essbase資料庫共同使用。

並且Exalytics的硬體和軟體配置也相當強悍:1TB記憶體和48核心的處理器;支援OBIEE 11g;200GB/s頻寬的TimesTen並行記憶體資料庫;支援記憶體平行處理的Essbase OLAP伺服器;新的面向高頻寬分析的使用者介面以及最快的連通Exadata的Infiniband串連。

以往,Oracle在雲端運算領域一直顯得有些保守,但隨著Oracle在此次大會在硬體和軟體兩個層面同時推出強有力的產品。這也標誌著Oracle在雲端運算領域邁出了劃時代的一步。

IBM將DB2與NoSQL資料庫有機結合

同樣是在10月,在IBM舉辦的IOD 2011大會上,IBM資料庫伺服器部門副總裁Curt Cotner宣布IBM將在明年推出內建NoSQL技術的DB2旗艦級資料庫管理系統。

IBM在NoSQL技術領域已具備了一些經驗,其自身的Rational Jazz協作軟體交付平台就是使用了“triplestore”技術,而“triplestore”技術同NoSQL資料庫中所涉及到的技術大致相同。 triplestore技術允許使用者簡潔並快速的檢索中繼資料和其他相關資訊。

不過IBM Rational團隊最終發現triple並不具備其所想要的可用性特徵,例如容錯移轉、橫向擴充到多個節點等等。IBM Rational團隊發現如果其在短時間內接收大量的triple,NoSQL儲存的索引將會鎖住資料庫。Rational團隊實際上是從開源社區中借用 NoSQL triplestore,然後進行修改,使其嵌入到DB2資料庫中,通過這樣的修改將能夠使用DB2索引、日誌、高可用性解決方案以及DB2資料庫中所有 的功能。

Cotner表示經過修改後的NoSQL功能在DB2資料庫中運行速度將會比之前的開源產品快4倍以上,同時還可以消除可用性以及可擴充性帶來的問題。現今NoSQL功能還在開發過程中,不過Rational團隊將會在未來為DB2整合更多NoSQL的功能。

大資料在企業的未來

管理大資料的能力將成為那些越來越多地使用新形式資訊——比如文本、社交媒體——的企業的核心能力。這種能力將協助企業尋找最好的模式來支援商業決 策,即所謂的基於模式的戰略。作為一種變化引擎,基於模式的戰略將充分利用模式尋找流程中所有的維度。然後,它為新商業解決方案的建模提供基礎,讓企業更 好地適應新的環境。處理大資料的增長並利用大資料的能力將成為許多企業的優先任務,否則未來幾年他們將受制於這些資料和他們的競爭者。(李智/編譯)

相關文章

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.