MongoDB和Cloudera,分別是NoSQL市場和Hadoop市場的重量級大公司。 近日,兩家公司提出要共用行銷和銷售管道,聲稱目的只有一個:為客戶提供大資料整體解決方案,消除客戶的疑慮。
MongoDB是NoSQL市場上成功的資料庫供應商,而Cloudera在Hadoop市場上也是領袖級的大公司,兩家公司都認識到,目前客戶對大資料還很困惑,如果能為客戶解除這些疑慮,為客戶提供整體的解決方案, 對兩家公司未來的發展都是極為有利的。
這兩家公司在週二宣佈了結盟的消息,它們致力於建立更深的合作夥伴關係,作為合作夥伴關係的一部分,MongoDB和Cloudera將把它們的產品整合行銷和出售,在大資料技術上形成互補效應,簡單地說, MongoDB將被定位成面向高擴充性應用的操作型資料庫,而Cloudera基於Hadoop的企業資料中心將被用作分析平臺。
Matt,MongoDB副總裁,負責MongoDB的市場、業務發展和企業戰略。 在一次電話採訪中,他告訴我們:「在去年Strata會議上,我講過MongoDB資料庫和Hadoop平臺應該結合在一起,那時我就認識到MongoDB需要在戰略上做出一些改變。 當時,好多人不理解,他們認為MongoDB和Hadoop是競爭對手的關係。 」
Yuri Bukhan,Cloudera的ISV聯盟專案負責人,他告訴我們:「你或許會覺得區分NoSQL和Hadoop並不難,那些不知道怎樣合理使用NoSQL和Hadoop的人應該去做更多的研究,但事實上, 在這兩個平臺之間確實有許多灰色地帶,比如:HBase,其實HBase就是Hadoop中的NoSQL資料庫,但是HBase更適合於超大規模卻相對簡單的用例,而MongoDB支援更加複雜的資料建模。 」
Bukhan引用了線上行為分析,以比較HBase和MongoDB所擔當的不同角色,以及發揮的不同作用。 「比如,當你研究簡單的使用者點擊或者會話的時候,HBase可以提供非常快速的隨機讀取和寫入,你可以基於特定的索引碼對使用者進行查找等操作,而MongoDB可以為你提供更豐富的模型,使你可以通過線上應用全程追蹤使用者的行為。 」
目前,MongoDB和Cloudera已經有了雙向的資料連線,但從Asay和Bukhan那裡瞭解到,兩家公司還在準備將MongoDB和Hadoop更好地整合到一起, 借此即時操作性資料利用MongoDB可以在Couldera資料中心中建立快照,用於並行分析。 這樣的分析接近即時,通過Shark框架或者Impala傳遞回MongoDB,接著觸發個人化內容的展示或者產生一個基於Hadoop分析的最合適產品。
集成之後的產品,據估計會在六月紐約的MongoDB World中展出,該產品將運行在YARN上,新的資源管理層中引入了Hadoop 2.0。 過去很難想像MongoDB和Cloudera會運行在同一個伺服器集群上,當時很多人擔心MongoDB和Cloudera和產生衝突。
如今,MongoDB和Cloudera建立了合作夥伴關係,很多問題都會得以解決,兩個成功的公司將描繪出一幅「NoSQL應用於操作型資料庫,Hadoop應用於分析」這樣的大資料超市規劃圖。 有人一定會問:為什麼選擇Cloudera而不是整個Hadoop社區?
Asay指出:「這就是開源的好處之一,開源社區內,技術在不斷更新和發展,我們的很多技術都有很強的適用性,而且是公開的,所以其他的Hadoop供應商也能夠使用這些技術。 」
其他的NoSQL供應商,像DataStax這樣的公司,沒能在NoSQL和Hadoop之間劃出一條清晰的界限。 比如DataStax的軟體發行版本,其中既包括Cassandra的NoSQL資料庫又包括了Hadoop,它們共同運行在同一個集群上,而且, DataStax和其他高擴充性資料庫供應商一直忙於加強和兜售它們資料庫的分析和查詢性能。
據Asay所說,MongoDB和Cloudera聯合銷售軟體的同時,它們將各自的銷售能力結合到一起為它們的產品提供最好的、持續的支援。 一段時間以後,大資料超市的局勢可能會變得比現在更加複雜,但是由於已經擁有了大額風險資本的注入,MongoDB和Cloudera對未來征服大資料超市很有信心。