論big data 3.0取代SAP HANA的可行性
一、big data 3.0簡介
簡言之,big data 3.0就是要實現SQL on big data,而且要兼顧效能、易用性和可擴充性。目前是“搜尋引擎+大資料+SQL“這樣一個融合為一體的趨勢。
大家可以先看下我的另幾篇博文:
1、基於FacebookPresto+Cassandra的敏捷式大資料
http://blog.csdn.net/china_world/article/details/39966699
2、中小企業的大資料技術路線選擇(二)-Cassandra+Presto方案
http://blog.csdn.net/china_world/article/details/44304609
3、融合了大資料、搜尋引擎及SQL的敏捷大資料方案bigdata 3.0:Presto+Elasticsearch
http://blog.csdn.net/china_world/article/details/50651824
二、SAP HANA簡介
HANA是SAP研發和銷售的分布式記憶體列資料庫,兼有分布式,記憶體,列和關聯式資料庫的有點。其作用是來替換SAP R3中的Oracle等其他資料庫。HANA最早是BW的加速技術,後來發展而來,首先用於替換BW,用於支撐資料集市情境,滿足企業的報表統計、查詢及集市分析需求。
三、big data 3.0替換HANA的可行性
HANA的推出是SAP企圖徹底擺脫對Oracle的依賴,並重磅出擊資料庫戰場的利器。當然,其產品、實施和營運成本也是很高的,每Unit(64GB記憶體)公開報價100~200萬,最大折扣也要40萬左右。HANA實施顧問身價也要3000~5000/天。這些對實施了SAP ERP的企業來說,再上HANA,等於繼續交贖金,不上,就要被撕票。那麼,有沒有HANA的替代方案呢。近來蓬勃發展的大資料技術讓我們看到了希望,我近兩年來一直在跟蹤和研究替換HANA的相關技術。我在2014年11月份正式提出用Cassandra+Prest方案來替換HANA,並和BW/HANA的實施顧問專門討論過可行性,結論:技術上可行。
截至到發稿時,Cassandra 3.x已經支援物化視圖等資料倉儲的概念,Presto 0.147已經增加了對Cassandra 3.X的支援。
四、總結
本人蔘加過HANA培訓,瞭解過SAP HANA實施項目,目睹了企業所經曆的一個個坑,也很不認同SAP惟利是圖的商業模式。但HANA的確是個好東西,就易用性來說就需要開源的大資料好好學習。HANA雖好,但太貴,開放性不好,擴充性是個大問題,不適合處理大資料;開源大資料,覆蓋了80%HANA功能,但易用性較差。打個形象的比喻,大資料如果是個巨大的礦藏,HANA是寶馬,高大上,但不能挖礦;Presto+Cassandra是挖掘機,雖然模樣簡陋,但效率驚人。
親愛的朋友們,如果你不是很有錢,有一個巨大的資料倉儲,想要從中挖出金子來,你會選擇HANA,還是Presto + Cassandra呢。我希望你會選擇Presto + Cassandra,而我們已經做了兩年的研發,實際案例即將落地。朋友們,Presto + Cassandra上見。。