本文作者為SolveBio創始人及斯坦福遺傳學副博士,twitter帳號@markkaganovich。 科技搜集生物資料的開始以及計算的大規模盛行,兩者的結合將會發起一場醫療革命。 對疾病的理解與治療需要對人體生物學及病變細胞有淵博的知識,直到今天,科學家要想獲得資料建立正常細胞與病變細胞的模型都需要做實驗,看報告,參加討論會議。
但是,隨著技術的突破,資料搜集變得可以擴展,醫療研究將會經歷一次結構性的技術轉變。 大量的資料結合電腦意味著,研究員將能訪問那些他們自己無法搜集或無法記住的資料,診所以及實驗室將會很快擁有大量資料,治療速度將呈指數加快。
新技術改變研究在搜集治療資料方面還存在巨大困難,許多觀察性研究都因為無法搜集到足夠有用的資訊,導致取得的成功有限。 若研究想發展更快,大學,醫院及生物技術公司就必須搜集診療資料並將之與可以採用的結果整合。
在過去10年,生物技術的發展都在描述一幅關於「大生物」這個新領域如何變成現實的圖,DNA測序規模化與正確性的飛速發展讓我們對基因的理解有了極大進步,但這只是開始,定序技術還有很長的路要走。
試想如果有一天,研究員可以將資料整合並找到模式,而且由於技術越來越便宜,病人可以檢測更多專案,比如每個組織的基因序列與基因表達,染色體狀態,小分子及代謝物,土著微生物,病原體等, 任何人在經過病人同意之後都能創建這個資料庫:學校,醫院,公司,所導致的資料龍捲風網路將是巨大的,將出現大量資料及巨大機會。 那這些資料如何被整合,那就是雲計算要解決的問題。
與雲的關係 雲的出現為數據整合提供了可能,雲能為那些擅長某些類型資料搜集及整合的研究員,醫生,企業家創造一個價值網路。 這些資料的真實價值將在分析其它所有可用資料的環境中被挖掘,不論是在公共雲或私人的,安全的環境中。
比如創業公司SolveBio就想利用雲計算,讓一些大規模分析應用技術與整合工具能被更好更簡單的被運用,新醫療發現將會從中收益。
受益最大的應該就是癌症研究,從某種程度上說,如果你活得足夠長,總會患癌症,因為癌症的病因是因為基因調節失控,癌症之所以複雜,是因為它的產生是不同細胞不同病變產生的。
癌症研究=大生物癌症將是最終的大生物問題,腫瘤有成千上萬的突變與重組,比正常組織要多得多,而癌細胞在腫瘤中可能有不同的基因組,許多突變基因都是不攜帶資訊的乘客,而一些細胞則是司機,產生無法控制的細胞增殖,導致癌症, 為了區別「乘客」與「司機」,許多突變基因的複製案例及控制需要理解,
搜集每個病人的每個腫瘤的綜合情況來建立一個可以研究正常細胞與癌變偏差的模型,對醫生,治療公司等制定治療方案非常有用,試想一下,如果某天,每個腫瘤被全面描述,還有不同領域專業技術所需要的很多資料,還有品質控制,模型建立, 解釋等,癌症的治療是否會容易很多?
每例癌症每個人會因為基因組、蛋白質組、代謝和小分子等功能而不同。 現在的技術會花上16GB記憶體的桌面電腦兩天時間處理基因描述資料,這才僅僅是基因描述,還不包括下游資料整合分析,找出資訊的相關性。 然而有了雲,這個工作就容易多了,僅僅是一個分散式運算平臺就能搞定。
我們將從資料整合中學到越來越多用於測量癌細胞的資料,雲能以前所未有的資料整合規模説明醫生,研究院,工程師治療癌症。
(責任編輯:蒙遺善)