雖然像HTTP://www.aliyun.com/zixun/aggregation/13461.html">MongoDB,MapReduce這樣的技術被視為創新的標誌,但企業還是信賴一些成熟的技術,比如SQL。 當企業需要收集的資料格式越來越多元化,特別是一些新的格式並沒有SQL作為支援的時候,從這些資料中挖掘重要的商業模式就變得非常困難。
當面對這樣的問題時,市場行銷分析公司SumAll選擇了基於Web的資料倉儲來對非SQL資料提供SQL查詢的支援。 據瞭解,該公司選擇了BitYota的解決方案,能夠對存儲在MongoDB中的JSON資料進行快速的交互分析。
SumAll為使用者提供社交媒體以及Web應用指標資料的挖掘服務,根據CIO Korey Lee的說法,公司希望使用SQL來生成報表,從而説明客戶更好地識別社交趨勢並衡量自身與同行在社交媒體上的表現。 他們支援包括Twitter,Instagram以及Facebook等主流的Web應用。
Lee表示,BitYota的軟體服務可以在MongoDB之上構建一個映射層,通過它可以對資料進行查詢和聚合。 SumAll跟蹤了數十億條的社交媒體資料,Lee認為MongoDB的擴充性非常好,但是要分析並對MongoDB資料進行聚合的時候存在一定的困難。
「MongoDB自帶了MapReduce功能,」Lee表示:「我們的程式設計環境往往用Hadoop或MongoDB來處理海量的資料集,但MapReduce與MongoDB一起使用的時候,至少對我們來說在擴展方面還是有些困難。 」
SumAll會生成分析儀錶盤,讓客戶在跨多個社交媒體平臺上對市場行銷專案的結果以及投資回報率進行評估。 説明客戶瞭解哪個平臺的推廣效果更好,比如對一些公司來說,Instagram的效果要強過Facebook。
JSON與NoSQL
從MongoDB或Hadoop資料來源來分析非結構化資料的需求在不斷增長,BitYota的CEO Dev Patel表示他之所以要成立這家公司,就是為了滿足集成不同類型資料的需求, 而基於雲計算的資料倉儲能夠説明客戶構建這樣的應用。
NoSQL資料庫支援事實後的資料模式創建,它能夠讓使用者敞開系統,接納向所有類型的資料。 SumAll以及許多類似的公司都希望能夠通過成熟的SQL來查詢這些Web生成的NoSQL資料。 Patel表示:「NoSQL資料庫之所以流行起來,是因為企業需要更多的靈活性,特別是移動或者Web端應用方面。 然而這並不意味著傳統資料庫技術就會消亡,我們看到有許多領域對SQL的需求還是非常強大的。 」
在現代化的NoSQL資料集合中,JSON類型的資料出現頻率最高。 隨著JavaScript開發浪潮而來,JSON已經成為XML的最佳替代品。
與此同時,MongoDB資料庫也開始流行起來,它通常用來存儲JSON格式的文檔。 而許多傳統的資料庫廠商也沒用忽視這樣的趨勢,包括IBM、Informix、微軟以及Oracle等公司都開始以不同的方式支援JSON資料的處理能力。 像SunAll這樣希望把傳統的SQL方式應用到NoSQL資料上的客戶並不在少數。
Lee表示,SumAll之所以選擇BitYota資料倉儲服務也是處於這樣的考慮,用熟悉的方法處理新的資料的確是最佳的選擇。
據瞭解,SumAll的MongoDB選擇了Rackspace旗下ObjectRocket公司的版本,後者主要提供MongoDB即服務(MongoDB as a Service)。 根據Lee的說法,速度是SunAll選型的主要考量指標,現在公司已經可以在任何時間對完整的資料集進行按需查詢。