雲計算VS大資料 應用各不相同

來源:互聯網
上載者:User

現在,雲計算和大資料無疑都是很火的概念,業內對他們的探討也愈演愈烈,那麼雲計算與大資料的不期而遇又產生了怎樣的聯繫呢?有人說雲計算和大資料是雙胞胎,兩個是不同的個體,互相依賴又相輔相成,也有人說大資料是來攪局的。

雲計算 VS 大資料

對此,IBM全球高級副總裁、系統與科技部(STG)總經理Rod Adkins認為,當前全球IT領域有了令人振奮的發展趨勢和挑戰,現在每天有大量資料和資訊生成,這為大資料分析提供了機會;資料中心的挑戰也為IT提供了新機會, 比如雲計算,能降低資料中心成本;IBM希望通過智慧的運算,實現智慧的地球的願景。

英特爾亞太研發有限公司總經理、軟體與服務事業部中國區總經理何京翔認為,大資料本身其實是資訊革命的一個新引領。 在未來幾年隨著物聯網的發展,可能會有2100億個RFID或者集群,在我們的環境之中,如果未來的移動互聯、物聯網如果變成現實,我們的生活會被感應器、會被資料獲取裝置所擁抱,這時候資料量將更大。 這些資料量僅僅是資料,並不能解決問題,它要從資料變成資訊、變成智慧、變成商業價值,這才能夠體現出真正的大資料的價值。

VMware全球高級副總裁范承工認為,在過去三年當中,看到大資料的發展從無到有,市場上大家說大資料的趨勢,三年前可能還沒有人說這個詞,現在已經如火如荼。 然而,現在除了資料本身發生了改變,雲計算也使資料變得更加分散,在這樣的趨勢下,傳統資料庫對於海量資料的需求、快的需求、開發者資料多樣化的需求難以滿足,使各種各樣的解決方案大行其道。

EMC的大資料和存儲專家、EMC資深產品經理李君鵬認為,大資料本身就是一個問題集,雲技術是目前解決大資料問題集最重要有效的手段。 雲計算提供了基礎架構平臺,大資料應用在這個平臺上運行。 目前公認處理大資料集最有效手段的分散式處理,也是雲計算思想的一種具體體現。

對於大資料給雲計算帶來的影響,Teradata技術總監Stephen Brobst表示,公有雲架構對資料倉儲沒有影響,因為企業的CIO不會無緣無故把財務資料或者客戶資料放到雲上,那樣很危險。 然而,是私有雲架構確實有影響:第一,通過私有雲,可以鞏固資料集市,減少利用率不足的問題;第二,可以通過靈敏的方式將資料整合,實現業務價值。

大資料和雲計算應用各不同

其實雲計算與大資料的不同之處在于應用的不同,主要在兩個方面:

第一,在概念上兩者有所不同,雲計算改變了IT,而大資料則改變了業務。 然而大資料必須有雲作為基礎架構,才能得以順暢運營。

第二,大資料和雲計算的目標受眾不同,雲計算是賣給CIO的技術和產品,是一個進階的IT解決方案。 而大資料是賣給CEO、賣給業務層的產品,大資料的決策者是業務層。 由於他們能直接感受到來自市場競爭的壓力,必須在業務上以更有競爭力的方式戰勝對手。

大資料不僅僅是Hadoop

Hadoop是Apache基金會發起和研發的,是目前業界公認的開放平臺之一。 授權公司可以發佈自己相應的Hadoop版本。 以Hadoop為代表的分散式系統,是大資料系統必要組成部分。 必要性體現在現在的大資料中很多資料是機器產生的資料,或者是物聯網各種各樣的探測器、電腦產生的日誌,這些是人為產生的,而且數量巨大,不適合把它直接放到資料庫中去,而Hadoop就提供了全新的方式,可以輕鬆進行平面擴展, 把這些資料放在庫裡進行任意的資料分析。 Hadoop成功的建立了這個環境,使得圍繞Hadoop的軟體能夠提供各種各樣的功能,完成智慧分析工作。

然而,大資料不僅僅是Hadoop,在對資料進行分析時,使用者可以把資料放池子裡,Hadoop則把這些資料分成幾百個、幾千個節點,這是在特定的某些應用場景必須進行的部分。 但是更多的應用場景是需要即時的反應,互動的反應,這時候就需要其他技術,包括記憶體類檢索技術,甚至在資料產生時要進行即時反應的技術。 這些技術都結合在一起,才是一個完整的大資料處理系統。

各大廠商應對大資料

不論大資料時代是否真的來臨,作為企業級服務廠商都應該走在受眾的前面,應對大資料。

1.IBM:4V理論+大資料分析平臺

IBM基於大資料提出了規模性(Volume)、多樣性(Variety)、高速性(Velocity)和真實性(Veracity)的「4V理論」,説明企業直觀認知和準確把握大資料特質。

IBM早在2007年11月就推出了藍雲計算平臺,「藍雲」基於IBMAlmaden研究中心(AlmadenResearchCenter)的雲基礎架構,包括Xen和PowerVM虛擬化、 Linux作業系統映射以及Hadoop檔案系統與並行構建。

此外,IBM還有大資料分析平臺——InfoSphere。 InfoSphere是IBM進軍大資料領域的強有力武器,其包括 BigInsights和Streams,二者互補,Biglnsights基於Hadoop,對大規模的靜態資料進行分析,它提供多節點的分散式運算, 可以隨時增加節點,提升資料處理能力;而Streams採用記憶體計算方式分析即時資料。 InfoSphere大資料分析平臺還集成了資料倉儲、資料庫、資料整合、業務流程管理等元件。

2.英特爾:硬體+軟體 火力很猛

硬體上,英特爾從CPU、存儲、記憶體一切的技術考慮怎麼樣使得新一代的系統架構,以及資料中心的解決方案能夠更適合大資料的要求。

軟體上,英特爾提供優化的中介軟體。 以Hadoop為例,英特爾在Hadoop系統,在Hbase、HDFS上都做了增強和優化,使它們在英特爾的平臺上,在英特爾的硬體上性能得到顯著的提高,並推出了Intel Hadoop Manager2.0。

據介紹,Intel Hadoop Manager2.0 優化了Hadoop的處理能力,把擬資料獲取到資料處理縮短到近于即時處理,且在英特爾平臺上性能會成倍增長。

3.VMware:虛擬化架構+雲平臺

VMware公司大中華區總裁宋家瑜認為,雲的平臺才是唯一能解決爆炸性大資料使用的需求,把關鍵應用移到雲平臺已經是一個必然趨勢。 因此,VMware把嘗試著把大資料應用到虛擬環境的雲端。

VMware推出的開源專案Serenget,支援企業在雲端和虛擬環境中,在vSphere上部署和管理Hadoop。 據介紹,在這樣的環境下,Hadoop部署時間可以從很多天縮短到10分鐘。

此外,VMware在統一的vSphere虛擬化架構之上,提供GemFire即時處理、GreenPlum交互處理及Hadoop批次處理三種模式,滿足使用者的海量、快速及靈活的大資料處理需求,並為開發者、資料分析師、 資料科學家和商務使用者提供資料分析及視覺化的資料展示。 VMware還公佈了一個大資料分析平臺 UAP(Universal Analytics Platform),其中包括Greenplum database、Hadoop和Chorus分析軟體, 説明客戶同時分析處理結構化和非結構化的資料。

4.EMC:EMC HADOOP

EMC發佈了EMC HADOOP版本,它主要進行即時、非結構化的資料處理。 EMC的產品系列在HADOOP包括三個方面:Greenplum HD社區版; Greenplum企業版; Greenplum HD Data Computing Appliance。

據介紹,在Greenplum HD中有一些核心的技術創新:可插拔I/O,可以用Isilon OneFS奪存儲系統,也可以用Atmos等,提高效率和性能;即時處理可以即時資料交互和分析處理;在容錯方面,消除名稱節點的單點鼓掌, 作業跟蹤其及其他關鍵元件方面有很多優化。 它最大的亮點是Greenplum Database與Apache HADOOP強強聯合,這樣的一個一體機實現了結構化、非結構化資料之間無縫的集成。

此外,甲骨文也推出了大資料機,為企業提供一種處理海量非結構化資料的方法,集成了硬體、存儲和軟體,包括Apache Hadoop軟體的開原始程式碼分發、新的甲骨文NoSQL資料庫和用於統計分析的R語言開原始程式碼分發。

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.