雲計算和海量資料分析的組合註定應當配合在一起使用。 雲計算的模式基本上可以讓使用者利用服務商提供的基礎設施和相關的專業知識而無需在其內部構建。
值得慶倖的是海量資料已和雲計算有機地結合。 專家預測,未來在此領域的投資將會逐漸增大。 目前已有幾家公司將雲計算和海量資料融合在一起,並推出了特有的服務。
Quantivo
Quantivo在週二剛剛宣佈進入這個市場,並推出了基於雲的資料分析平臺。 該平臺能夠將來自多方的企業資料彙集在一起,並轉化改進資料,然後使用者可以通過Quantivo專用的介面使用這些資料。 Quantivo表示其技術在收集客戶資料集過程中需要通過「intelligently auto-compiling lists of patterns」預測。
101data
101data實際上在處理大資料領域已經有10年以上的時間經驗。 在人們談論與計算之前,101data已經提供多種針對于海量資料實際使用中的特定服務,包括資料倉儲和商業智慧高級分析。 客戶可使用熟悉的工具與服務進行交互。 例如試算表,客戶可以容易的找到他們想要的。 101data的高級副總裁Tim Negris表示海量資料的收集以及存放和利用海量資料實際上完全是兩回事。 在做任何事前需要大量(準備資料)的工作是像Oracle和大多數資料庫廠商所面臨的難題之一。 我們正是要消除這個難題,並把資料直接交到分析師的手中。
Opera Solutions
Opera Solutions是一個有趣的公司。 儘管年收入達到1億美元,但很少有人知道這家公司。 雖然公司鮮為人知,但其提供的服務對客戶而言還是相當具有吸引力的。 客戶將他們的資料上傳到Opera平臺之上,然後對資料進行分析,最後按照客戶資料集相關「標記」分析出客戶想要的資料。 Opera並不滿足于向客戶提供普通的資料分析,Opera的業務側重于按照每個客戶的具體需求並採用各種行業的專業手段,以説明每個客戶滿足其特有的資料分析需求。
IBM
IBM提供基於雲服務的海量資料分析方面多種方案的選擇,但目前IBM的策略似乎主要是圍繞Hadoop在發展。 IBM在4月推出了其SmartCloud雲計算平臺。 並承諾改善Hadoop工作負載。 IBM提供了基於Hadoop的InfoSphere BigInsights(IBM InfoSphere BigInsights是用於分析和虛擬化海量資料的軟體和服務,這款新產品由 Apache Hadoop 提供技術支援。 )基本版和企業版。 InfoSphere BigInsights之前作為IBM測試和開發的雲產品,現在被SmartCloud取代。
Amazon Web Services
AWS實際上不提供分析服務,AWS主要具有大規模並行處理框架和計算能力。 Amazon Elastic MapReduce創建在Amazon EC2架構下由Hadoop軟體來執行的資料處理工作流。 它會自動按照客戶的需求自動啟動並配置一定數量的Amazon EC2實例。 然後它會產生一個根據MapReduce程式設計模型的Hadoop實現,通過它從Amazon S3中讀取大量的使用者輸入資料,並將他們分攤給生成的Amazon EC2實例去進行並行處理。 同AWS的服務一樣,Amazon Elastic MapReduce的客戶只需要為他們使用的部分付費。
HPCC Systems
Hadoop依靠兩個核心元件來存儲和處理海量資料——Hadoop分散式檔案系統和Hadoop Mapreduce。 Cloudant公司CEO Mike Miller認為MapReduce在編寫並行處理工作流時依然相對複雜,HPCC旨在通過ECL(Enterprise Control Language)改善這一局面。 HPCC提供兩種資料處理和服務的方式——Thor Data Refinery Cluster和Roxy Rapid Data Delivery Cluster。 Escalante表示如此命名是因為其能像Thor(北歐神話中司雷、戰爭及農業的神)一樣解決困難的問題,Thor主要用來分析和索引大量的Hadoop資料。 而Roxy則更像一個傳統的關聯式資料庫或資料倉儲,甚至還可以處理Web前端的服務。 雖然沒有深入探討HPCC存儲元件的細節,但Escalante表示HPCC基於分散式檔案系統,並可支援各種off-node存儲架構和本地的SSD。 HPCC系統已經在金融業和其他重要的行業中普遍應用。 (李智/編譯)
原文連結:gigaom
(責任編輯:劉芬)