大資料的「掘金」十年

來源:互聯網
上載者:User

石勇

「2001年3月,當我在美國內布拉斯加州立大學任查理斯—瑪格麗·德姆資訊科學與技術講習教授時,曾邀請時任全國人大常委會副委員長、國家自然基金委管理科學學部主任成思危先生去該校訪問。 」2014年年末的一天,在北京中關村的一間辦公室裡,中科院虛擬經濟與資料科學研究中心常務副主任石勇笑著向《中國科學報》記者回憶起十三年前的往事。

後來石勇又陪同成思危參觀了著名的信用卡管理與資料處理企業「第一資料公司」。 當石勇介紹自己及團隊在該公司從事的基於大規模資料的信用風險管理建模與分析工作時,成思危對他說:「你應該考慮回國工作,這些科研可以促進中國的金融創新。 」

彼時,他們的談話間,都還沒有用到十多年後的今天人盡皆知的一個詞—大資料。

先人一步

「今天人人皆談大資料,卻難以想像十年前人們對於這一概念的陌生。 」石勇帶著幾分自豪說,「我們可是從十年前就開始從事資料科學研究了。 」

2004年秋,在應中科院領導之邀回國的石勇的主持下,資料採礦與知識管理中心(籌)在中科院研究生院中關村校區正式成立。

在那之前,資料採礦與知識管理這兩個方向在國際上還是分離的,石勇適時地組織了一次學術會議,邀請了兩個領域的專家參加,專家們討論後得出共識:要將兩者結合起來,產生新的創新性科研成果。

考慮到當時公眾的認知,在時任中科院院長路甬祥的建議下,中心的名稱變成了「資料技術與知識經濟研究中心(籌)」。

2006年6月,在該中心(籌)發起組織的一次香山科學會議上,來自世界各地的知名專家一致認為,資料是已知資料分析、資料採礦、知識發現、知識管理、客戶關係管理等的基礎。 資料本身具有科學的含義和規律,應該將資料研究作為學科來對待,研究資料科學(Data Science)。

從此,以資料與知識為背景的資料科學逐漸得到眾多領域的認可。

同年9月,受路甬祥的邀請,成思危將其虛擬經濟團隊與石勇的團隊進行了重組合並。 後來,從日本築波大學回國的石敏俊教授也帶領綠色經濟團隊加入中心。 中心再次改名為「中科院虛擬經濟與資料科學研究中心」並延續至今。

2007年初,中科院正式批准該中心成立。 後來,國際上也陸續成立了有關資料科學的團隊。 「例如,美國哥倫比亞大學2012年成立資料科學研究所,比我們中心整整晚了5年多。 」石勇說。

在海量資料裡淘到「金子」

領先的當然不僅僅是時間。

這些年來,虛擬經濟與資料科學研究中心為國家宏觀經濟提供了不少決策依據。 中心名譽主任成思危2009年曾撰文《論人民幣匯率制度改革的下一步—建立靈活的人民幣匯率雙層目標區》,而後運用虛擬經濟理論,寫就《全球金融危機與中國的對策》等報告。 在2014年度出版的《人民幣國際化》一書中,成思危提出了10年內基本實現人民幣國際化的目標和時程表建議。

該中心也通過扎實的研究為地方建言獻策。 石敏俊團隊通過研究,為石羊河流域治理規劃調整和完善提出了具體建議。 他們還與埃森哲合作創建了埃森哲中科院新資源經濟城市指數,為中國城市規劃與管理提供了一套全新評估分析體系。

科研成果直接面向相關產業,則是該中心的一大特色。

2006年至2009年,石勇團隊與中國人民銀行征信局和征信中心合作,在全國個人信用資料庫基礎上建立了全國個人信用評分系統。 這一工作對中國13億人在商業銀行的日常經濟活動有重大影響。 截至2010年5月31日,該個人征信系統查詢次數達6.5億次。 該系統年收費20億元,實現了真正意義上的基於大資料採礦的金融工程理論實踐。 中國人民銀行前副行長、現中國駐國際貨幣基金組織副總裁朱民讚揚這一居民信用評級「已經超過了國際水準」。

目前,石勇團隊獨創的多目標最優化資料採礦模型,已成功應用於金融、保險、電商等領域的海量資料或大資料問題,網易、工商銀行、中國經融期貨交易所、中國投資公司、中國再保險集團、國家審計署、一號店、商務部都成為他們的「客戶」。

各個團隊的努力,為中心贏得了總數4000多萬元的課題經費,而難以置信的是,中心的全職研究人員僅有十來人。

中心的學者也拿下了諸多獎項:成思危于2014年獲得復旦管理學終身成就獎;石勇於2009年獲得復旦管理學傑出貢獻獎和國際多目標決策學會的最高獎項—康托學術獎,2013年還獲得教育部自然科學獎一等獎。

中心的畢業生中誕生了兩位國家「傑青」和一位教育部長江學者。 此外,一位應邀任職于美國加州大學,兩位任職于澳大利亞兩所大學。 除了科研骨幹,畢業生中還有包括著名創投平臺「36kr」CEO在內的企業精英和創業人才。 據石勇介紹,中心招收的研究生分為數學、電腦和管理三個專業,「我希望不同的學科交流碰撞,促成更多新思想的產生」。

一直走下去

2014年8月,石勇作為申請單位代表,參加中科院重點實驗室的申評。 評議會一開始,他就犯起了嘀咕:60多個候選者角逐30個名額,而他們被安排在學科組第一個答辯,「總覺得評委們會對第一個講得特別嚴苛嘛」。

但讓石勇驚喜的是,評委們高度評價他們的工作,一致通過了他們的申請。 中科院大資料採礦與知識管理重點實驗室得以獲批成立,該實驗室將依託中科院虛擬經濟與資料科學研究中心,國科大管理學院、數學科學學院和電腦與控制學院的科研力量。

作為實驗室主任的石勇認為,這一新平臺勢必會進一步促進中心在相關領域的前沿優勢。

出於對他們工作的認可和肯定,美國工程院院刊The Bridge邀請石勇作為主編,在其最新一期冬季期刊上刊登了題為《大資料的全球視野》的學術專輯。 石勇邀請了14位來自9個國家和地區的知名學者,就各國大資料的現狀、挑戰及趨勢撰文研討。

在石勇看來,大資料目前面臨不少重大挑戰:其一,研究異構資料的不同表現形式之間的邏輯關係,以尋求基於異構資料的「多維資料表」的一般規律;其二,探索大資料複雜性、不確定性特徵描述的刻畫方法以及大資料的系統建模;其三, 研究資料異構性與決策異構性的關係對大資料知識發現與管理決策的影響。

面對這些挑戰,石勇表示:「我們中心在分析與運用海量資料的科研道路上已經走了十年,未來還會繼續走下去。 」

(責任編輯:mengyishan)

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.