SQL Server引入HTTP://www.aliyun.com/zixun/aggregation/14255.html">Hadoop大資料處理能力 發佈時間:2012.05.11 14:48 來源:機房360 作 者:機房360
微軟已經發佈了早期代碼,讓客戶可以將這個JAVA架構接入到SQL Server 2008 R2、SQL Server Parallel Data Warehouse以及下一代微軟資料庫。
Doug Cutting受到Google MapReduce的啟發而發明了開源Hadoop,現在它已經在某種程度上成為了在集群伺服器上處理大量資料的行業標準,包括Amazon、 Facebook和Twitter等網路巨頭也都採用了Hadoop。
業內人士認為,Hadoop可以用來瞭解數以百萬計使用者的喜好和更新狀態等細枝末節以改變服務回應。 Hadoop的目標是,更有力地滲透到主流IT中。
微軟研究部門從2006年起就一直致力於某種非常類似于Hadoop的專案,被稱為「Dryad」。 今年年初,該計畫通過與SQL Server和Windows Azure雲的集成實現了Dryad的產品化。 雖然現在微軟還沒有更新,但看上去Dryad似乎將成為在SQL Server平臺上影響大資料愛好者的有力競爭者。
微軟目前已經開始提供Hadoop Connector for SQL Server Parallel Data Warehouse和Hadoop Connector for SQL Server社區技術預覽版本的連接器。
該連接器是雙向的,你可以在Hadoop和微軟資料庫伺服器之間向前或者向後遷移資料。
微軟表示,這個連接器可以讓客戶在Hadoop中分析非結構化資料,然後接回到SQL Server環境中進行分析。
這兩個連接器採用SQL to Hadoop (SQOOP)在Hadoop File System (HDFS)和微軟關係資料庫之間有效地傳輸資料。 Parallel Data Warehouse採用PDW Bulk Load/Extract工具以進行資料的快速導入或者匯出。
SQL Server PDW客戶可以從微軟那裡獲得這個Hadoop連接器,普通的SQL Server 2008 R2客戶則可以獲得Hadoop Connector for SQL Server代碼。