標籤:
【TechTarget中國原創】 對於企業使用者來說,巨量資料服務是一項較具吸引力的雲端服務。三大巨頭AWS、Azure以及Google都在力爭奪得頭把交椅,但是最後到底是哪一家能夠取得王座之戰的勝利呢? 雲市場正在快速發展,同樣巨量資料服務也在不斷地變化著。雖然因為這三大雲供應商(亞馬遜網路服務、微軟Azure和Google)的起點是不同的,這使得雲供應商之間的比較也變得更為困難,但那還是值得嘗試的。 雲大資料是Google公司一直以來在搜尋應用方面擁有豐富經驗具有協同效應的市場領域,但是亞馬遜網路服務(AWS)和Azure則將吸納一些有趣的初創企業以提升各自的競爭力。 其結果就是巨量資料服務因功能性和經濟性方面的原因變得更具吸引力,從而獲得良好發展前景。雲使用者們將在三大巨頭的巨量資料服務應用爭霸戰中成為最後的贏家,但這場曠日持久的戰爭似乎會持續多年。 以下讓我們逐一介紹AWS、Azure和Google三家現時今日的巨量資料服務。 亞馬遜網路服務 AWS提供了內容極為廣泛的巨量資料服務。例如,亞馬遜彈性MapReduce就可以運行Hadoop 和 Spark,而Kinesis Firehose 和 Kinesis Streams 則提供了一種將大型資料集匯入AWS的方法。使用者可以在Redshift(這是一個PB級的資料倉儲)中儲存資料,並進行資料比較以便於實現成本降低。Amazon Elasticsearch則是一個在AWS中部署開源Elasticsearch工具的服務,它可用於諸如點擊率和日誌監控等分析應用。Kinesis Analytics可通過分析資料流輔助實現這一目標。 與Google公司不同的是,AWS提供了一整套更大型的資料存放區選擇。除了大量的AWS簡單儲存服務,它還提供了一個低延遲的NoSQL資料庫DynamoDB;DynamoDB的Titan版可為Titan圖形資料庫提供儲存服務; ApacheHBase則是一個PB級的NoSQL資料庫;以及關係型資料庫。 AWS還提供了一個商業智慧(BI)服務QuickSight,它主要使用記憶體內平行處理技術以實現高速運行。它主要通過亞馬遜機器學習和物聯網平台實現,它們可將眾多裝置串連至雲,並可擴充串連數以十億計的裝置和處理萬億數量級的訊息。 總之,雖然Google公司在搜尋和分析引擎方面擁有較大優勢,但是AWS擁有更為廣泛的服務、BI以及圖形處理器(GPU)執行個體。 微軟Azure 對於分析應用來說,Azure有Data Lake Analytics,該服務使用專用的U-SQL(SQL與C++)和一個基於Hadoop的服務HDInsight。還有一個Azure Stream Analytics服務,它有一個使用全域中繼資料系統識別資料資產的Data Catalog,以及串連內部與雲資料來源並管理資料管道的Data Factory。 Azure的大資料存放區服務是一個被稱為Data Lake Store的Dadoop檔案系統。這家雲端服務供應商提供了各種通用的儲存產品,其中包括StorSimple、SQL 和NoSQL資料庫以及儲存塊等。 Azure還配合提供了Power BI和機器學習服務,並設有一個物聯網中心。它的雲平台還包括了一個搜尋引擎。微軟的Cortana套件和Cognitive Services則提供了更進階的智能功能。 Google Google公司的BigQuery資料服務使用了一個大多數使用者(即便是非技術人員)都可直觀學習使用、類似於SQL的介面。它可支援PB級資料庫,它能夠以每秒10萬行的速度進行資料流處理,並作為在雲端儲存中運行資料的替代選項。BigQuery還支援地區資料複製,即使用者可以自行選擇儲存他們資料的位置。 BigQuery是一個無需專用基礎設施執行個體的所用即所付服務,它能夠讓Google使用大量的處理器來維持低延遲的快速查詢響應。與Spark整合,它還支援Hadoop、Pig和Hive。企業使用者還可以使用Google的Analytics 和DoubleClick作為資料來源,那是一個廣告業使用者收集供BigQuery使用資料的工具。Google的Cloud Dataflow還允許使用者對雲資料服務進行排序。 Google公司提供的其他巨量資料服務還包括一個用於非關係型資料的NoSQL資料庫Cloud Datastore;一個大規模可擴充NoSQL資料庫Cloud BigTable;一個針對機器學習應用的託管平台Cloud Machine Learning;以及諸如翻譯器和語音轉換器這類的協助工具輔助。 Google在巨量資料服務中所明顯缺少的一個產品是GPU執行個體。鑒於GPU所帶來令人難以置信的效能提升,為資料分析應用編寫GPU代碼確實是一個具有高附加值的技能。Google公司在GPU執行個體產品系列的缺失著實有點讓人頗為費解,尤其是AWS公司在2011年就推出了該類服務,而Azure則在2015年新增了該服務。 AWS、Azure和Google:一場你追我趕的大資料應用競賽 在巨量資料服務的很多方面,雲供應商三大巨頭都是步調一致的,但是在效能和易用性方面還是存在著一些差異的,這需要通過實際測試才能予以區分。雖然Google公司可能在搜尋技術上擁有一定優勢,但它在BI前端應用方面落後,而擁有Cortana的微軟則在此擁有先機。Google公司GPU執行個體的缺失也是一個顯著的區別。 鑒於巨量資料產品服務如此繁多,而所有的產品都還處於生命週期的初期,它們之間的差異還會因用例或資料類型不同而不同。要在三巨頭中做出選擇將是比較困難的。確定最適合你自己的雲端服務的一個方法就是在沙箱中用幾個星期的時間來試用各種服務以便掌握它們的第一手使用體驗和價格資訊。
TechTarget中國原創內容,原文連結: http://www.searchcloudcomputing.com.cn/showcontent_92823.htm
© TechTarget中國:http://www.techtarget.com.cn
巨量資料服務大比拼:AWS VS. AzureVS.Google