大資料蘊含的寶藏就在每個人的腳下,而Ayasdi這樣的大資料創業公司能借你一雙慧眼,從現有的資料中發現新的金礦。
最近,矽谷的創業公司Ayasdi最近剛剛完成了一筆1000萬美元的融資,該公司利用拓撲資料分析的演算法,來推動癌症的研究。
Ayasdi所代表的大資料垂直應用顯然正在成為大資料投資的焦點之一,在IT經理網之前的文章:大資料的下一個熱點在於應用軟體中,我們曾指出:
就長期價值而言, 行業或市場區隔的突破性大資料軟體應用要超過目前火熱的大資料基礎設施平臺。
舊資料裡的新財富
斯坦福大學的學者Gurjeet Singh, Gunnar Carlsson, 和 Harlan Sexton一直在致力於用拓撲學的方法, 進行資料分析。 拓撲學是一個很古老的數學分支, 從歐拉時代就開始研究,不過最近15年左右, 拓撲學開始和資料分析相結合, 用來發現大資料中的一些隱形的關係。 Gurjeet Singh, Gunnar Carlsson, 和 Harlan Sexton在2008年, 覺得將這一技術進行商用。 於是成了了Ayasdi公司。 (Ayasdi來自印第安語, 意思是「尋找「)。 而Ayasdi的目標, 也是為了説明使用者從現有資料中進行一些新的發現。
用Ayasdi的創始人 Gunnar Carlsson的話說:
「人們先有資料, 然後根據這些資料提問, 按照不同的問題軌跡進行尋找答案。 而有的問題軌跡是正確的,有的則不一定正確。 而Ayasdi的目標, 這是説明使用者回答他們還沒想到的問題。 」
Ayasdi成立以後,就獲得了DARPA(美國國防部高級研究專案組)350萬美元的資助。 (編者:DARPA的很多專案都非常具有前瞻性, DAPRA的網路專案ARPANET就是現在Internet的前身)。 隨後, Ayasdi的綜合了機器學習和拓撲資料分析的技術引起了矽谷投資界的關注。
Ayasdi的技術的一個重要特點就是,不像別的系統需要類似搜索查詢式語句。 Ayasdi可以自動從資料中發現隱藏的模式。
隨著Khosla Ventures和 Floodgate等基金的投資到位, Ayasdi目前30人的技術團隊將擴充, 同時將行銷和銷售也將展開。
Ayasdi的投資人Vinod Khosla 有句名言, 說將來80%的醫生將會被機器代替。 他認為, Ayasdi的「機器智慧」技術, 將使我們的探索能力達到過去難以企及的高度。 從而説明解決一些全球性的社會和經濟問題。
讓大資料「顯影」
Ayasdi的一個應用就是在醫學研究領域。 Mount Sinai醫學院基因與多尺度生物學系的主任Eric Schadt就帶領了一個團隊,利用Ayasdi的技術進行一些疾病的遺傳傾向的研究。 這些疾病中包括癌症。 Eric Schadt希望這種技術能夠説明找到一些新的發現, 從而可能帶來一些治療上的突破。
事實上, Ayasdi一直在美國各個頂級醫院和藥廠合作。 醫院和製藥公司可以從公開的資訊源獲得很多資料, 和他們自己的資料結合起來,進行一些新的研究。
Ayasdi的CEO Gurjeet Singh說:
「資料還是那些資料, 只是我們用了新的技術, 可以從這些資料裡自動地得出一些新的發現。 」
通過對一個累計採集15年, 被成千科學家研究過的資料集的分析。 Ayasdi的資料分析技術,説明發現了乳腺癌的14個變種。 Ayasdi的演算法發現了某一個基因數組的病人乳腺癌的存活率比較高。 如果病人的基因是在這樣的子組裡, 可以免受化療之苦。
風險基金Data Collective 的合夥人Matt Ocko是一個專注于大資料領域的投資人,他看到了這個醫學上的突破的新聞後, 決定給Ayasdi投資。 他說:
目前,政府和企業的問題,不在於資料量的缺乏,而是對資料進行發現和直覺能力不足。 Ayasdi的技術, 能夠在短時間內, 提高分析人員面對海量資料的直覺能力,這一點是個突破。
對於醫療行業而言,大資料財富其實就在腳下,甚至在那些被遺棄的資料中,(在本站「Rich Smolan:大資料的人類面孔」一文中提到一個例子,麻省理工學院的電腦科學家和密歇根大學電腦科學家創建了一個全新的電腦模型, 可以分析那些被丟棄的心電圖資料,發現被忽視的心臟疾病復發信號,並能大大改進今天的心臟病風險篩查技術。 )
Ayasdi獲得風險投資的青睞,從一個側面表明,資料直覺化和資料分析創新才是醫療大資料的發展重點。
(責任編輯:蒙遺善)