在資料庫格式領域將會發生一場戰爭嗎? Hadoop和大資料這兩個世界在企業界會合並還是衝突?就在Janath Manohararaj以藍十字藍盾協會(Blue Cross and Blue Shield Assoc.:美國第一大私人健康HTTP:// www.aliyun.com/zixun/aggregation/6173.html">保險公司集團----譯者注)資料庫服務團隊負責人的身份作客SiliconANGLE的流動新聞平臺CUBE之前, 他與CUBE的搭檔主持人John Furrier和Dave Vellante在幕後提及了這些問題。 這些熱門話題充分激起了Manohararaj的興趣,也開啟了他在惠普Vertica大會的現場訪談。
談及資料庫以及深入探討Hadoop的現狀時,Manohararaj提醒電視觀眾在發展初期只存在關係資料庫,大資料是如此的新穎以至於它屬於市場中截然不同的陣營。 就藍十字藍盾協會所涉及到的而言,這家健康保險供應商未看到資料庫與大資料衝突的風險。 恰恰相反,它預感到兩個事物正在向著資料管理的目的而相互融合。
Vellante想探尋這家公司歷史上是如何使用資料的。 Manohararaj提到以前處理資料的老方法是每個專案都有其自己的資料倉儲,由於資料的重複而導致其擁有成本非常高昂。 與之相反的是,Hadoop將事情變得更加容易,帶來了成本下降而性能提升。
回憶起他的公司意識到到Hadoop潛力時的那個興奮時刻,Manohararaj承認最初在2008年藍十字藍盾協會就通過將Vertica引入系統而進行預資料庫的配置。 Manohararaj的團隊立馬就觀察到性能的提升,比以前的速度快了十倍。
「第一步是從傳統的DBMS(資料庫管理系統----譯者注)轉移到以列為基礎的資料模式。 現在我們正在考慮創建一個資料湖泊(Data Lake)---- 一個統一標準的資料倉儲」 Manohararaj確認到。
平衡創新與遵循
關於醫療保健行業,Furrier想更多的瞭解藍十字藍盾是通過什麼樣的方式平衡創新需求與遵循行業規則的要求的。 「就醫療保健而言」,Manohararaj解釋到,「資訊需要是即刻的,而這在以前是個問題。 Vertica是我們應用過的最好的資料庫之一。 」
「Vertica就是工業界的法拉利,」Furrier也贊同這一點,並追問Manohararaj要其解釋什麼造就了Vertica如此的成功。 Manohararaj列出了三個關鍵因素:
1. 性能;
2. 低成本;
3. 非常棒的支援(主動型服務,調用 (call) 和回檔功能( (call backs) )
開源與供應商分佈
Manohararaj訪談中討論的最後一個議題關注了企業大資料商業化這個興起的進程,而這也是另外一種衝突正在發生的領域。
「你是在使用供應商分佈軟體還是開源的Apache Hadoop」Vellante問到,他很好奇企業是如何應對這兩種銷售大資料解決方案的截然不同的方法的。 Manohararaj透漏這項工作正在進行當中,他們正在逐步向開源靠近:「開源總是一種挑戰,學習曲線總是很陡峭的,而且你需要培訓。 而擁有專屬解決方案,就要容易很多。 」