在當今企業中80%的資料都是非結構化資料,這些資料每年都按指數增長60%。 大資料將挑戰企業的存儲架構、資料中心的基礎設施等,也會引發資料倉儲、資料採礦、商業智慧、雲計算等應用的連鎖反應。 未來企業會將更多的TB級(1TB=1024GB)資料集用於商務智慧和商務分析。 到2020年,全球資料使用量預計將暴增44倍,達到35.2ZB(1ZB=10億TB)。 大資料正在徹底改變IT世界。 10月幾大科技巨頭的舉動使更多人意識到所謂的高科技泡沫——即「大資料」正在無限的膨脹。
微軟與Hortonworks合作開發Hadoop
早在今年2月,微軟的HPC開發團隊就公佈了被稱為「Dryad」的分散式運算平臺。 這也標誌著微軟向Windows HPC Server使用者提供了能夠進行海量資料處理的工具。 微軟推出Dryad的目就是鼓勵開發者們在Windows或者.Net平臺上編寫大規模的並行應用程式。 在當時這也被視為微軟在大資料領域與Hadoop對抗的有力產品。
但微軟卻于10月12日在西雅圖舉行的SQL PASS 2011峰會上出乎所有人預料的宣佈將與從雅虎分拆出來的Hortonworks合作開發Hadoop,並將在Apache Hadoop上實現搭建Windows Azure以及Windows Server平臺。 同時基於Hadoop的Windows Server還會與微軟現有的BI工具聯合處理任務。
微軟與Hortonworks深度合作的目標是借助Hortonworks在此領域的專長説明最大化將Hadoop集成到微軟的產品之中。 同時兩家的合作可説明簡化下載、安裝和配置等幾個Hadoop的相關技術。 包括HDFS、Hive、Pig。 這將有利於企業通過Hadoop拓寬自身的業務。 微軟還將編寫新的ODBC驅動程式並擴展自己現有的查詢系統到Hive。 這樣一來使用者將能夠直接從Excel、PowerView執行Hadoop查詢。
Red Monk分析師Stephen O'Grady也很看好Windows和Hadoop的結合。 他表示這將是非常具有吸引力的,這將吸引大量的Windows使用者。 微軟在此領域具有競爭的實力。
大資料領域 Oracle硬體、軟體齊發力
Oracle作為全球最大的關聯式資料庫供應商也不甘寂寞,在其產品鏈條中加入了被稱為「NoSQL Database」的NoSQL資料庫。 NoSQL Database是Oracle在2011 Oracle全球大會上宣佈推出的Oracle Big Data Appliance的一個組成部分。 Big Data Appliance是一個集成了Hadoop、NoSQL Database、Oracle資料庫Hadoop配接器、Oracle資料庫Hadoop裝載器及R語言的系統。
而Oracle的在大資料領域的投入還遠不止這些。 他們不僅在軟體層面推出了Oracle Big Data Appliance,在硬體層面Oracle還推出Exalytics。 Exalytics目標非常明確,就是針對大資料。 Oracle推出的In-Memory計算就是在Big Data時代能夠提供海量資訊——包括結構化、半結構化、資料集及非結構化資料的分析。 同時Exalytics還能夠支援混合的資料來源——包括Oracle資料庫、Teradata、微軟SQL Server以及獨立的Essbase資料庫共同使用。
並且Exalytics的硬體和軟體配置也相當強悍:1TB記憶體和48核心的處理器;支援OBIEE 11g;200GB/s頻寬的TimesTen並行記憶體資料庫;支援記憶體並行處理的Essbase OLAP伺服器 ;新的面向高頻寬分析的使用者介面以及最快的連通Exadata的Infiniband連接。
以往,Oracle在雲計算領域一直顯得有些保守,但隨著Oracle在此次大會在硬體和軟體兩個層面同時推出強有力的產品。 這也標誌著Oracle在雲計算領域邁出了劃時代的一步。
(責任編輯:蒙遺善)