雖然視覺化在資料分析領域算不上最具技術挑戰性的部分,但是它絕對可以說是最重要的一個方面。 當然,存儲、資料庫的查詢處理以及演算法都是非常的重要——視覺化離開它們也無法實現——但是在一個資料驅動的世界裡,它們只是處在基本層的位置。 這裡有6家創業公司,他們試圖從根本上改變數據的視覺化。 其中有一些是高度複雜的視覺化處理過程,有些不是。 雖然沒有一個是完美的,但他們所做的一切,會讓我們反思:資料究竟意味著什麼?
Ayasdi
Ayasdi來自印第安語,是「尋找」的意思。 斯坦福大學的Gurjeet Singh, Gunnar Carlsson和Harlan Sexton一直在致力於將拓撲學的研究方法應用於資料分析。 在2008年,他們聯合成立了Ayasdi公司。 Ayasdi成立以後,就獲得了DARPA(美國國防部高級研究專案組)350萬美元的資助。
Ayasdi的底層使用的是HBase資料存儲,然後再利用拓撲資料分析技術和上百種機器學習的演算法來處理複雜的資料集,最終確定資料節點之間的相似度。 而對終端使用者而言,這看起來更像是一個資料集的拓撲圖,只是強調了集群中有關聯的資料點。
Ayasdi的技術有一個重要的特點,它不像別的系統需要類似搜索查詢式語句,Ayasdi可以自動從資料中發現隱藏的模式。 Ayasdi的一個應用就是在醫學研究領域,Mount Sinai醫學院基因與多尺度生物學系的主任Eric Schadt就帶領一個團隊,利用Ayasdi的技術進行一些疾病的遺傳傾向的研究,而且利用Ayasdi的資料分析技術, 説明發現了乳腺癌的14個變種。
BeyondCORE
實際上BeyondCore運作的基本前提和Ayasdi是相同的——只是展示給使用者顯著相關的聯繫,而無需考慮這個結果是如何發現的——雖然BeyondCore使用的是標準化圖表, 但是事實上還提供了另一種選擇:在發現軟體發現關聯性結果時,會讓化身(見圖片)通知使用者。
ClearStory
ClearStory擁有一個獨一無二的產品,即使該產品的很多細節並沒有公佈。 也許只有在產品正式發佈之後,我們才能「一睹真容」。 ClearStory將與存儲在資料庫、網路和其他來源的資料連線,在資料來源變化時進行動態的更新,並加入虛擬的資料採礦元件,使使用者分析資料並理解資訊。 在今年3月份,ClearStory獲得了來自谷歌風投、安德里森·霍洛維茨、Khosla Ventures等多家風投的青睞,融資金額不詳。
Datahero
Datahero是由來自Aster Data的大資料分析業務骨幹Chris Neumann、寶馬的高級工程師Jeff Zabel聯合創立,該公司尚在起步階段就獲得了100萬美元的融資。 他們打著「你的資料你做主」的口號,試圖彌合大資料與普通使用者之間的鴻溝,不僅説明使用者分析密切相關的資料,而且通過視覺化的形式,讓使用者更好地理解這些資料。
據外媒報導,Datahero是基於瀏覽器的一個平臺,資料的輸出、整理以及解釋都會在一個單獨的視窗完成,而不是通常意義上的借助不同的應用。 通過瀏覽器,使用者可以將多種網路服務的資訊輸入到Datahero,也可以從公共的資料庫下載報告,還可以直接在本地把試算表及檔上傳到Datahero。 Datahero會根據它的演算法自動為這些資訊歸類,並給他們加上標籤。
Platfora
初創公司 Platfora聲稱「要把Hadpoop平民化」。 該公司認為只有把冗雜的資料進行有效處理、視覺化,讓資料變成普通的使用者都能看得懂的東西,「大資料」才能真正變成一盤生意,這家大資料創業公司已經獲得了2000萬美元B輪融資。
Platfora在Hadpoop的基礎上進行資料的操作,並為使用者提供一個簡單易用的操作平臺。 因為Hadpoop有很多不同的發行版本,所以Platfora的重點之一就是確保它能在所有的發行版本上運行,這樣大大降低了Hadpoop的使用門檻,讓更多的人能夠體驗Hadpoop的技術優勢,實現真正意義上的「平民化」。
Zoomdata
初創公司ZoomData是為數不多的支援行動裝置的資料分析公司,它們的資料視覺化系統能夠將實施的大資料流程轉化為觸屏友好的、藝術感十足的三維資料。 蘋果iPad和Android平板電腦使用者可以用手指縮放資料視覺化介面,隨著介面縮放的級別不同,資料將即時進行更新。 ZoomData的資料視覺化技術支援多種資料來源,包括社交媒體、企業應用系統以及Hadoop HDFS資料。