2014年12月12-14日,由中國電腦學會(CCF)主辦,CCF大資料專家委員會承辦,中科院計算所與CSDN共同協辦,以推進大資料科研、應用與產業發展為主旨的2014中國大資料技術大會(Big Data Technology Conference 2014,BDTC 2014)暨第二屆CCF大資料學術會議在北京新雲南皇冠假日酒店盛大開幕。
本次大會歷時三天,以更加國際化的視野,説明出席者瞭解海內外大資料技術的發展趨勢;從技術與實踐角度出發,探討「大資料生態系統」、「大資料技術」、「大資料應用」、「大資料基礎設施 」等領域的新技術應用和實踐經驗 ;通過創新大賽和培訓課程等方式,深度剖析大資料創業熱點和分享行業實戰經驗。 同時,由中國電腦學會主辦,CCF大資料專家委員會、南京大學與復旦大學共同承辦的「第二屆CCF大資料學術會議」也同時召開,並與技術大會共用主題報告。
在12日下午舉辦的第二屆CCF大資料學術會議——大資料搜索論壇上,包括中國工程院院士方濱興、中國工程院院士吳曼青、華東師範大學教授查宏遠、國防科技大學教授賈焰、蘇州大學教授周曉方、復旦大學電腦科學技術學院汪衛、 哈爾濱工業大學教授張宏莉都發表了精彩的主題演講。
下午13點30,大會在中國工程院院士方濱興的主持下,第二屆CCF大資料學術會議「大資料搜索論壇」正式開啟。 同時作為演講嘉賓的方院士發表了「大搜索成就大資料的價值」的主題演講,他表示大搜索,就是搜尋引擎和大資料的結合,就是大資料智慧解答。 接著他講解了大資料時代所需的大搜索,隨後他從實踐角度分析了大資料實施的5個核心技術:資源關聯、背景關聯、眾智、雲平臺、隱私保護,以及其所必須具備的5個能力:資料索取、資料選擇、資訊綜合、解決方案和安全搜索。
中國工程院院士 方濱興
中國工程院院士吳曼青分享了名為「存在就有痕跡、聯繫就有資訊,反恐環境下大資料的意圖搜索」的專題演講,他以眾多美國案例為引,描述了新時代反恐行動應有的特性:法律保障、以人為核心、高技術手段、國際合作。 隨後,吳曼青重點分享了構建虛擬空間資訊社會雷達這個創意,並詳細講述了意圖搜索對反恐活動的提升。
基於「存在就有痕跡,聯繫就有資訊」的基本理念,從而構建網路空間中行為事件、思想事件等模型,在實體空間和虛擬空間中全面收集人的存在痕跡和聯繫資訊,關注人物或事件間聯繫鏈,從而發現網路空間中存在的各種意圖,完成對意圖產生源頭 、傳播途徑和發展趨勢的全方位描述,達到對個人和組織的所思所想所為所在的全面搜索和分析。 因國內反恐形式嚴峻,大資料搜索需要積極應對新時期恐怖主義威脅,立足恐怖分子存在和意圖特徵,運用大資料技術進行深入關聯分析,實現對恐怖分子的準確識別和暴恐事件的提前預警,有力提升反恐維穩核心能力。
中國工程院院士 吳曼青
華東師範大學教授查宏遠的演講主題是「搜索意圖:理解、表示和匹配」。 查宏遠主要從三個重要的技術層面來解釋怎麼去理解使用者的搜索意圖:用於搜索意圖徵集的POMDP、用於追蹤使用者意圖轉移的預測模型、便於徵集基於知識圖譜探索的搜索意圖。 他還分享了主要複雜任務怎麼去搜索,以實體為中心的搜索怎麼去理解使用者意圖,還有就是怎麼和使用者互動來結合更好的理解使用者搜索意圖。
最後他根據這樣一個搜索意圖理解可以知道在大資料裡面怎麼理解醫療,對於醫生怎麼進一步提高好的診療方案,定診療方案線性的分析,還有就是能知道他和其他病友交流,提高生活品質。 實際上很關鍵的就是遇到一個病例,找到類似的病例,通過以前的病例形成個人化的解決方案。
華東師範大學教授 查宏遠
國防科技大學教授賈焰發表了題為「線上社交網路智慧搜索」的演講, 她表示社交網路深刻影響人們的工作和生活,線上社交網路資料蘊含了使用者思想、情感、興趣、關係、圈子、使用者方位。
對於社交網路上的資料,可以進一步發掘做到智慧搜索,大搜索。 我們應該重新定義一下社交網路的搜索概念。 我們認為這個概念可能有這麼一個前提,就是說我要正確的理解使用者的意圖,第二我有這麼一個邊界,這個邊界是我們社交網路的一些資料;第三我們要通過發掘的操作,二次加工,三次加工, 這樣一種推理計算的操作來獲得真正使用者需要的智慧的解答。
另外,她詳細介紹了線上社交網路智慧搜索的特點:精確語義、時空演化、場景感知、多態融合、智慧解答。 最後他還表示線上社交網路搜索的應用前景,首先是社會化管理,比如說放開二胎這個事情,你可以利用社交媒體上搜到更加準確的答案,關於政策怎麼制定,下一步怎麼走;第二個是公開情報分析,我們都知道美國在網路上挖掘恐怖分子的社交情況 ;還有社會化行銷,像雙十一、雙十二,如果他推動了價值,社會價值就會非常大。
國防科技大學教授 賈焰
蘇州大學教授周曉方分享了名為「多媒體大資料搜索」的主題演講,他表示多媒體資料是大資料的一個重要組成。 大資料背景下的多媒體搜索是一個全新的重要研究方向,面臨使用者查詢介面與意圖理解,結果表達與回饋,資料組織存儲及處理效率方面的眾多挑戰,研究視角遍及多媒體處理,電腦視覺與模式識別,資料庫,資訊檢索,知識管理, 海量存儲以及高性能計算等研究領域。
最後他總結在多媒體大搜索裡面需求非常明確,技術難點多,但前期研究已經奠定了很多堅實的基礎;第二個多媒體大搜索突破的關鍵在於Connection,對於資料,不同方法和領域的融合。 多媒體研究也做了很多年,突破也比較困難,但是也許這種融合是我們突破比較好的方法。 最後我們在推大搜索情況下,多媒體大搜索充分體現了大搜索的問題和方法。
蘇州大學教授 周曉方
復旦大學電腦科學技術學院汪衛分享的主題為「大規模實體物件及關聯關係建模」。 期間,他主要從「原始狀態的大資料不能支撐大搜索」與「需要對原始大資料進行建模以支援大搜索」兩個方面進行了講解。 在「實體物件及關聯關係」中,他表示實體物件/關聯是當前大資料一種可行的組織方法。
實際上對於資料建模,他們已經做了很多很多年,從最早的實體資料建模,到後面面向關係模型,面向語義模型等等都是如何在研究資料有一個比較好的整理,但是對於大資料來說物件整體關聯是我們覺得對於大資料是非常好的描述基礎, 但是我們在這個基礎之上怎麼能夠有描述很好的提升,這是建模重要的問題。
復旦大學電腦科學技術學院教授 汪衛
哈爾濱工業大學教授張宏莉分享的主題是「大資料搜索中的隱私保護問題」,期間,她首先分享了大資料時代隱私保護所遭遇的挑戰:主題規模巨大,資料的擁有權和使用權分離;動態變化快,即時回應。 隨後,張宏莉分別從變換、分治、隱匿、混淆4個途徑的應對之道進行了分享。
他表示在目前法律可能還沒有跟進那麼細化的情況下,技術的保障可能顯得尤為重要。 在大資料場景下隱私保護是不是足夠呢? 現在我們需要隱士。 大資料主體規模大,因為它的使用權利,以及最後可以加工再發佈,這都是通過若干個環境,並且大資料有個特點,變化快,又需要我們的服務即時地進行回應,所以給隱私保護提出了新的挑戰問題。
哈爾濱工業大學教授 張宏莉
互動環節
論壇最後是互動環節,參會人員就大搜索、大服務、隱私保護的界定等問題和演講嘉賓進行了精彩和卓有成效的互動,其中大搜索無疑成為本屆大會的一個關鍵字。