【天極網伺服器頻道5月21日消息】伴隨著大資料時代的到來,承載大資料的基礎設施面臨變革以應對大資料革命。 大資料是具備空前規模和形式的非結構化資訊,隨著基於感應器的行動裝置和輸出資料越來越多,可用的資料量將繼續呈指數級增長。 大資料戰略需要資料中心基礎架構作出的改變主要有以下幾點:
大資料導致的存儲需求量每年都將增長60%至80%,鑒於這種快速增長和當前的成本限制,IT採購者應選擇在可擴充性和存儲速度上最具成本效益的硬體。 類似IBM Netezza和Oracle Exadata的硬體裝置已被證實能有效兼顧可擴充性和性能。 考慮採用硬體裝置來支援關鍵大資料業務,但也應確認設備的架構能在未來提供快速性能升級。
在成功的大資料策略下,企業可以將來自內部的高品質資料與Hadoop挖掘自多個雲供應商的低品質資料進行整合。 這也就改善了業務相關資料的品質,讓分散在各地的資料能組織成為具備一致和及時性的大資料資源。
大資料正在改變中央資料倉儲和松耦合資料集市的決策基礎,後者的存儲庫規模要小得多,既可以替代中央資料倉儲,也可以成為中央資料倉儲的資料來源。 隨著各地辦事機構或者國際子公司的增加,中央管理層在業務線擴大的同時更需要高品質的資料來維持管控力度,避免權力的分散。
企業Web外鏈需求加深了對公眾和混合雲的依賴。 許多大型企業發現他們需要來自于多個雲供應商的大資料,卻不能指望供雲應商會負責整合這些資料。 企業只能從資料虛擬化供應商尋求工具來跨多個雲整合大資料。
SSD的存儲分層策略
大資料要求存儲同時提供大容量和高性能。 存儲分層在存儲資源池中提供多種成本與性能選項,從昂貴的高性能固態存儲到傳統的串列SCSI(SAS)磁片存儲,這些選項的組合降低了擁有權總成本。 在主記憶體和磁片之間增加一個固態層將有助於將大資料任務的性能維持在高位,而且不會引起存儲成本失控。 SSD的成本和速度的最佳組合比例是:使用大約10%的SSD和90%的機械硬碟。 這一策略讓IT公司用僅增加10%成本的代價就能獲得90%以上的性能提升。 主記憶體和SSD的容量比例也遵從同樣的規則。
由於SSD的性能價格比的提升速度超過傳統磁片(容量提升而價格降低),預計在不久的將來傳統磁片和SSD的配置比例會變為遵循80與20的規則。 IBM BLU Acceleration這類最新的縱列和記憶體資料庫設施能利用SSD獲得遠超傳統磁片的性能,它們的設計能夠有效發揮SSD這類扁平化磁片的優勢。
大資料分析和報告能力
雖然嵌入式分析工具已經可以利用報告和自動優化功能改善業務流程,但大資料再次改變了分析規則。 例如,和傳統上對單個客戶進行主要行為分析洞察相比,大資料戰略能為每個客戶創建一個反覆運算和洞察分析執行緒,讓公司能跟蹤客戶並更好地維持與所有客戶的長期關係。
這意味著需要在自動化的報告和嵌入分析之外人工添加協力廠商審議內容:專設和鬆散耦合分析。 支援專設查詢的分析和統計工具是必要的軟體前提。 許多傳統IT供應商以及雲供應商——如IBM、Cognos和Birst——正在擴充這些功能。
企業中的Hadoop
許多IT公司通過在企業內創建自己的Hadoop版本來解決從Web獲取Hadoop資料來源的問題。 然而,缺乏專業知識是一種挑戰。 組織開發他們自己的資料管理工具時應該留意,如IBM、Oracle和EMC的這些主要供應商,往往既提供專有產品用於訪問Hadoop資料,也可進行定制開發,讓IT公司不需要專門的資料歸納措施就能訪問需要的資料。 如果您決定搭建自己的資料平臺,供應商也提供整合服務,使Hadoop更貼合現有IT資源來高效運作。
網上商城商品/規格/促銷價格(作者:李祥敬責任編輯:李祥敬)