大資料是高性能計算領域最熱門的趨勢。 大資料往往是非結構化的大規模資料,這些龐大的資料集中蘊含著對企業極具價值的情報資訊。 而雲計算在過去幾年一直是IT世界的寵兒,因為雲計算開創了計算作為服務的新時代,儘管人們對於雲計算的安全、可用性和成本仍然存在疑慮。
大資料的規模似乎能夠成為雲計算有趣的合作夥伴。 大規模資料的管理存在很高的複雜性,正因為如此,大資料分析通常在HTTP://www.aliyun.com/zixun/aggregation/11770.html">本機伺服器集群中進行。 而雲計算的優勢在於盡可能有效地優化現有資源。 如果部署得當,你沒有理由不結合大資料和雲計算的優勢。
通過業務分析在雲環境挖掘大資料的價值並不會很麻煩,但是也有一些具體的策略來確保你的企業具有最佳效率。 為了讓企業在訪問、分析和改善其業務操作方面處於領先位置,大資料和雲環境都必須滿足一定條件。
首先,讓我們看看你的大資料業務分析工具必須具備的三個能力:
1. 使用能夠本地連接到所有主要大資料來源(例如Hadoop和NoSQL存儲)的業務分析工具。
2. 管理能力: 確保業務分析工具能夠有效地管理和協調大資料任務以及傳統IT任務
3. 整合能力: 用於分析的資料很少是來自單一來源。 業務分析工具必須具備很好的資料整合能力,需要能夠有效地整合傳統關聯式資料庫和非傳統大資料存儲間的資料,例如Hadoop和NoSQL資料庫。
大資料業務分析對雲環境的要求也同樣重要。 雲環境的主要優勢在於具有彈性,根據需要付費,不需要管理企業內部硬體。 例如,一家媒體公司在正常情況下,使用其自有的50台專用伺服器集群就能夠滿足其資料處理需求。 然而,在超級杯或世界盃期間,需要被處理的資料量可能會增加8到10倍,所以他們通過在公共雲臨時增加另外200台伺服器來滿足其需求。 以下是你的大資料分析工具成功地在雲環境運行應該具備的三個條件:
1. 與雲供應商無關: 找到一種能夠在任何雲服務(公共雲或私有雲)運行的分析工具
2. 彈性: 確保能夠在高峰負荷時期快速方便地添加任何計算資源,並在正常情況下減少資源以降低成本
3. 資料通信頻寬: 確保你部署了資料通信管道以有效地將原始大資料移動到雲環境。 可能你的大資料資源(例如web日誌)已經位於雲環境中,在這種情況下,你只需要簡單地將大資料檔案從一個雲供應商複製到另一個雲供應商即可。
總之,如果部署得當的話,大資料和雲環境的結合絕對是強強聯手。
(責任編輯:蒙遺善)