大資料時代已經來臨。 2014財年,美國政府就如何充分利用生物醫學大資料,啟動Big Data to Knowledge計畫,這是繼2012年美國國家大通話方案實施後新一輪面向生物大資料的基礎研究計畫。 目前,發達國家在生物大資料領域的技術和應用已遠遠走在前端。 在我國,生物大資料還處於發展的初期階段。 該如何以最快的速度趕上這一潮流,如何從國家主權層面對生物大資料進行有效的保護和管理,如何在基礎研究和技術市場應用上與世界同步,已成為不可回避且值得深入思考的話題。
 
誰是生物大資料技術的領航者
 
大資料發展的核心動力來自于人類記錄、測量和分析世界的渴望。 當前,高通量測序技術的快速發展,使生命科學研究獲得了強大的資料產生能力。
 
哈爾濱工業大學電腦科學與技術學院院長王亞東教授告訴科技日報記者,上世紀90年代,科學家花費10年時間、近30億美元獲得了第一個人類基因組圖譜;而今天,完成一個個人基因組測序不到一天時間,費用低於1000美元。
 
自人類基因組計畫完成以來,以美國為代表,世界主要發達國家紛紛啟動了生命科學基礎研究計畫,如國際千人基因組計畫、DNA百科全書計畫、英國十萬人基因組計畫等。 這些計畫引領生物資料呈爆炸式增長,目前每年全球產生的生物資料總量已達EB級,生命科學領域正在爆發一次資料革命,生命科學某種程度上已經成為大資料科學。
 
「這還只是剛剛開始」,王亞東強調,「隨著測序技術在醫療、健康、醫藥、環境、能源等相關領域的廣泛應用,人類將面臨生物資料的海洋,其將成為這些領域創新的源泉,對這些資料創新性的管理和應用, 將為生命科學及相關產業領域帶來一次新的革命。 」
 
與全球蒸蒸日上的生物大資料創新發展熱潮相比,中國的研發及應用才拉開帷幕。 「我們與國際前沿技術水準至少相差30年,差距主要表現在資料分析、資料管理和與臨床的應用對接上」,上海生物資訊技術研究中心主任李亦學研究員對此深表擔憂。
 
李亦學分析認為,我國有四大方面非常欠缺:其一,國內現有的生物大資料分析能力雖然與歐美相差不大,但是在資料分析構架、軟體系統與先進的IT技術接軌上有待提升。 其二,國外在生物大資料領域的領先人才多,儘管我們也有國際頂級刊物上發表的論文和成果,總體而言,國內高水準團隊還是少。 其三,歐美講求成果應用,層出不窮的分析軟體可被實驗室、臨床、產業多方應用。 其四,在生物大資料理論研究、標準制定和廣泛應用上,中國都亟待全面跟進。
 
誰將引領生物大資料應用的市場和資源
 
對生物大資料的有效管理和利用,發達國家很早就開始了競爭。 早在上世紀80—90年代,美國、歐洲和日本即已分別建立世界三大生物資料中心:美國國家生物技術資訊中心(NCBI)、歐洲生物資訊研究所(EBI)和日本DNA資料庫(DDBJ)。
 
王亞東強調,「這三大生物資料中心掌握並管理著全世界的生物資料和知識資源,並處於壟斷地位。 」
 
美國國立衛生研究院(NIH)建立了8個國家級生物資料技術研究中心,旨在長期發展生物大資料分析技術,提高生物大資料利用和轉化能力,並保持其領先地位。 王亞東進一步指出,美國政府于近兩年兩次啟動生物大資料研究計畫,目的是有針對性地研究生物大資料管理、分析、共用等生物領域迫切需要的核心技術,從根本上提升美國利用生物大資料的水準,並以此帶動生物領域研究與產業發展。
 
在商業領域,生物大資料的應用市場也如雨後春筍,目前,一些公司已開始提供生物大資料服務。 例如,谷歌投資DNANexus公司,提供生物大資料管理和分析服務,並于2011年接管NCBI資料;早在2006年,23AndMe公司就開始提供個人基因組資料分析服務,目前其受益者總數已超過50萬人 ;英國衛生部于2013年專門建立了Gel公司,管理和分析英國十萬人基因組計畫產生的基因組資料。
 
BCC報告指出:「至2018年,生物大資料的市場總額將增長至76億美元,年複合增長率達到71.6%。 」麥肯錫公司報告指出:「如果美國醫療保健行業有效利用大資料,就能把成本降低8%左右,從而每年創造出超過3000億美元的產值。 」
 
誰來掌控我國生物大資料主權
 
對於一個國家而言,重要領域的大資料已成為戰略資源,擁有資料的規模和運用資料的能力將成為一個國家綜合國力的重要標誌。
 
我國人口居世界首位,生物樣本資源豐富,這將使我國很快成為生物資料產出大國,但目前還不是生物大資料利用強國。
 
事實上,國際上生物資料資源一直掌握在歐美的幾大資料中心。 我國產生的許多生物資料資源不得不提交到這些資料中心,導致我國投入大量資金與人力產生的生物資料嚴重流失。
 
在生物大資料領域,我國缺乏從國家層面對生物大資料進行有效管理與利用的體制、機制和環境,李亦學稱,「這已經使中國的生物數位主權受到嚴重威脅」。
 
王亞東也強調,「現在國際上的三大生物資料中心都是歐美國家層面建立的,並免費向國際開放。 我國的相關科學研究和市場應用發展受益于這些資料中心,同時也嚴重依賴和受制于此。 」
 
業內人士指出,我國尚未建立面向生物大資料技術發展的國家級技術研究中心,技術研發缺乏宏觀規劃和引導,技術產出較少,難以建立完善的生物大資料技術體系,不能滿足生物大資料發展面臨的資料管理和服務需求。 同時,除了哈爾濱工業大學和上海生物資訊技術中心等少數高校和研究所建立了生物大資料專業研究團隊外,人才缺口較大。
 
大資料的使用已經成為一個國家各領域提高生產力、創新能力以及競爭力的關鍵要素。
 
專家們指出,生物大資料是國家戰略資源,對生物大資料資源的管理和利用應上升為國家意志,並考慮實施如下措施:建立國家生物大資料中心,保障我國數位主權,統籌管理和合理利用國家生物大資料戰略資源;通過國家科技政策, 集中突破生物大資料核心技術,形成自主關鍵技術與系統產品,打破美歐技術限制;以現有優勢學術和技術資源為基礎,建立國家級生物大資料研究機構,提升我國生物大資料技術和服務水準,並培養專業的生物大資料人才 ;強調應用需求牽引和政策支援,以加快生物大資料產業的全面發展。
 
(責任編輯:蒙遺善)