隨著企業大資料項目目的進展,資料分析速度的重要性正日漸凸顯。 為了進一步提升大資料分析速度,IBM本週三在加州發佈了一款Hadoop大資料機,旨在説明企業使用者實現對更多種類和更大規模資料進行(更低成本地)即時分析的需求。
IBM軟體資訊管理部門總經理Bob Picciano表示:
企業正被大資料洪水圍困,作為廠商IBM必須向客戶提供更好的工具掘金大資料,這些工具必須夠快,能夠處理海量資料同時還要更容易使用。
在Gartner三月份發佈的BI魔力四象限圖中,IBM是所有廠商中最有遠見和創新力"visionary」的資料分析技術供應商,此番IBM主要通過兩種途徑提高企業(對更多類型)大資料分析的速度, 一是通過分析加速技術將大資料變成「中資料」甚至「小資料」,減少工作負載。 參考閱讀: 忘記大資料,從「中資料」開始;另外一種方法就是硬體優化,推出面向Hadoop的大資料機。
為了達成這個目標,IBM發佈了BLU Acceleration分析加速技術。 當IBM使用者(例如DB2使用者)執行查詢的時候,BLU可以快速縮小資料分析範圍,將海量資料清洗後,只剩下小部分有效資料進入分析流程,這樣一來使用者的資料分析負載將大大降低,硬體處理資源可以更快地給出分析結果。 BLU的一個重要功能就是資料忽略(Data Skipping),「跳過」大量不需要的資料,挑出重要的「小資料」。 此外,BLU還能讓資料在整個分析過程中始終保持壓縮狀態,這也將大大提高資料處理速度。 IBM宣稱在一些測試中,BLU的加入使得DB2資料庫的分析速度提高了1000倍。
在提速大資料分析的第二種路徑——硬體優化方面,IBM還發佈了專為Hadoop大資料處理平臺設計的IBM PureData box。
作為IBM PureSystems家族的第三位成員,PureData Systems大資料專家集成系統被IBM定位為大資料時代的分析處理引擎,去年IBM發佈了包括事務系統IBM PureData System for Transactions、分析系統IBM PureData System for Analytics和運營分析系統IBM PureData System for Operational Analytics(基於Netezza)三個大資料機產品。
據IBM Netezza產品管理和產品行銷副總裁Phil Francisco透露,面向Hadoop的PureData System大資料機產品將於今年晚些時候上市。 使用者將能在90分鐘內完成資料載入,而此前企業在資料中心的Hadoop實例完成資料載入需要兩三周的時間。 IBM面向Hadoop的大資料分析機能在本機存放區Hadoop處理過的資料,這能滿足一些行業客戶對資料管轄權的要求。
(責任編輯:fumingli)