最後更新:2015-03-19
來源:互聯網
上載者:User
關鍵字
大資料
Hadoop
NewSQL
Spark
OpenStack
BDTC
BDTC2014
從2008年僅60人參加的技術沙龍到當下的數千人技術盛宴,作為業內極具實戰價值的專業交流平臺,已經成功舉辦七屆的中國大資料技術大會忠實地描繪了大資料領域內的技術熱點,沉澱了行業實戰經驗, 見證了整個大資料生態圈技術的發展與演變。
12月12-14日,由中國電腦學會(CCF)主辦,CCF大資料專家委員會承辦,中國科學院計算技術研究所與CSDN共同協辦的2014中國大資料技術大會(Big Data Technology Conference 2014,BDTC 2014)將在北京新雲南皇冠假日酒店如約召開。 大會前夕,我們從議題角度總結了今年BDTC不可錯過的十大理由。
理由一:深度的產業現狀與趨勢解讀。 中國電腦學會將在BDTC 2014上正式發佈《2015大資料十大發展趨勢預測》與《中國大資料技術與產業發展白皮書(2014)》。 上屆大會——BDTC 2013上發佈的兩份報告得到了學術界和產業界的高度關注。 今年,在大資料的產學研用繼續深化更加務實之時,由百余位技術專家參與的《2015大資料十大發展趨勢預測》以及涵蓋大資料發展背景、大資料典型應用現狀、大資料技術體系現狀、大資料IT產業鏈與生態環境、大資料人才資源、 大資料發展趨勢與建議等多個篇章的《中國大資料技術與產業發展白皮書(2014)》,更加值得期待。 除此之外,BDTC 2014還設有多場對行業趨勢的預測和解讀,其中包括星環科技CTO孫元浩分享的《2015年大資料基礎技術的演進趨勢》與武漢綠色網路資訊服務有限責任公司副總經理雷葆華帶來的《大資料時代的網路基礎設施演進》等。
理由二:頂尖的行業應用分享。 歷經數年發展,大資料已愈加成熟,並在製造、交通、醫療、教育、金融等行業中得到了深入應用。 為此本屆大會將展開多場對行業應用的探討,其中包括,中國聯通千人計畫引進人才,華盛頓大學副教授陳一昕的《電信運營商大資料應用實踐》,中國移動蘇州研發中心大資料產品部總經理錢嶺的《電信運營商大資料商務模式研究》, 萬向集團通聯資料首席戰略官龍白滔的《金融大資料的分析和挖掘》,高德技術專家周琦的《大資料在即時交通資訊中的應用》等。
理由三:國際前沿的學術研究成果。 在技術分享之外,2014年第二屆CCF大資料學術會議也將同時召開,並與技術大會共用主題報告。 屆時,Conviva聯合創始人兼CEO、卡耐基梅隆大學電腦科學系教授張暉,特拉華大學電子與電腦工程系教授、電腦系統結構和並行系統實驗室創始人暨主任高光榮,ICML 2014程式委員會主席、卡耐基梅隆大學教授Eric P . Xing都將出席本次盛會,為大家分享國際最前沿的大資料技術研究成果。
理由四:來自Hadoop生態圈的豪華陣容。 回顧Hadoop歷史,該專案在2006年初雅虎聘請Doug Cutting後才正式脫離Nutch專案,到2008年也才剛剛成型。 但是,就在2008年底,大會組委會即投入精力到Hadoop的佈道,雖然規模只有數十人,邀請的專家卻涵蓋雅虎、Facebook、百度等公司的核心技術人員。 時至今日,Hadoop已被業內公認為大資料的核心技術,分散式環境下提供海量資料處理能力的事實標準。 而本屆會議,我們更邀請到了Hadoop之父、Cloudera首席架構師Doug Cutting,Hortonworks核心技術人員Ted Yu,Apache Hadoop committer、PMC成員Uma Maheswara Rao G,Apache Hadoop Committer Yi Liu,Apache Hadoop和Tez專案PMC成員Bikas Saha等多位知名Hadoop專家,帶大家領略Hadoop生態圈最新的研發成果和發展趨勢。
理由五:Databricks:瞭解源于Spark的初創公司在做什麼。 Spark發源于美國加州大學伯克利分校AMPLab的集群計算平臺,立足于記憶體計算,在與Hadoop生態圈相容的情況下,提供了近即時的資料處理能力。 在短短4年時間,Spark已發展為Apache軟體基金會的頂級開源專案,擁有30個Committer,其使用者包括IBM、Amazon、Yahoo!、Sohu、百度、阿裡、騰訊等多家國內外公司,更包括了Spark SQL、 Spark Streaming、Mllib、GraphX等多個相關專案。 然而,這個新貴的步伐顯然不止于即時計算,在近日Sort Benchmark公佈的海量(100TB)離線資料排序結果上,Spark已經接手了老將Hadoop的冠軍寶座,而在不久前更終止了Shark專案, 並開啟了全新的Spark SQL。 那麼Spark今後的RoadMap又將是什麼,這裡我們不妨看向本屆會議上Databricks 軟體工程師孟祥瑞的分享——《Spark and Databricks Cloud》。 同時,在分享結束後,你還有機會向孟祥瑞單獨請教。
理由六:百度、騰訊分享的深度學習探索。 近年來,各大互聯網公司對機器學習的投入是越來越高,也間接造成了當下神經網路和深度學習領域的火爆。 在BDTC 2014上,百度和騰訊將分享各自在深度學習領域的最佳實踐——《百度深度學習探索》與《Mariana:騰訊深度學習平臺的進展和應用》。
理由七:一網打盡各個領域國內外眾多機構的大資料實戰。 大資料時代給人們帶來了數不盡的機會,然而想利用大資料取勝卻並不是件容易的事情,企業往往需要克服海量資料存儲、處理、安全等方面的眾多挑戰。 為了迎接大資料時代的到來,進一步推進大資料技術創新與應用,本屆會議將放出大量知名機構的最佳實踐經驗,其中包括:LinkedIn 軟體工程師王國璋的《Apache Kafka解析及其LinkedIn的應用實踐》, Dropbox技術經理邵錚的《Dropbox大資料應用》,百度核心技術專家的《百度集群管理系統分析》,騰訊廣點通高級工程師趙學敏的《大規模主題模型及其在騰訊的應用》,VMware資深架構師介文清的《 12306鐵路購票網站的架構優化》,搜狐移動研發部經理劉佳的《基於全網內容的搜狐移動新聞用戶端推薦系統》,eBay高級產品經理、Kylin聯合建立者韓卿的《 Kylin.io:基於Hadoop的大規模連線分析(OLAP)引擎》,阿裡小微金服(螞蟻金服)資料分析師陳繼東的《基於大資料的網路安全與欺詐風險管理實踐》,沃爾瑪實驗室首席資料科學家Tao Zhu的《The ' Nanotechnology' in eCommerce 》,攜程資深軟體工程師廖曉格的《Make Big Data Visualizable and Real-Time》等。
理由八:大資料時代的資源管理技術。 時至今日,雲計算已經成為大資料底層資源調度的最佳平臺,然而雲平臺的打造卻並不是件容易的事情。 在BDTC 2014上,我們特別邀請了OpenStack基金會董事杜玉傑,為我們分享名為《OpenStack在大資料方面的思考:技術、應用、生態系統》的主題演講。 而在智慧型網路建設上,博科高級技術顧問谷增雲更為我們帶來了SDN技術的實踐分享。 資料中心層面,浪潮集團副總裁胡雷鈞會分享《開放融合的雲資料中心》。 資料存儲層面,希捷公司的技術專家將介紹開放計算專案(Open Compute Project,OCP)的存儲部分的技術內容。
理由九:基於公有雲的大資料實踐。 當下,雲計算已越來越成熟,而公有雲服務亦在各行各業得到了深入應用。 本屆會議上,我們為大家分享了多場基於公有雲的大資料實踐,其中包括AWS大資料和高性能計算框架全球高級行銷經理Ben Butler帶來的《AWS大資料應用實踐》,Huawei EU Research Center研發架構首席架構師Sabri SKHIRI分享的《Lambda Architecture 2.0 Convergence between Real-Time Analytics, CoNtext-awareness and Online Learning 》, ODPS資深技術專家徐常亮傳授的《ODPS實踐》等。 對於創業公司和技術實力不夠雄厚的機構來說,這裡是絕對的天堂。
理由十:關係資料庫技術的最新進展。 關係資料庫系統的研發並沒有停下腳步,在橫向擴展、高可用和高性能方面也在不斷進步。 在今年的大會上,我們為出席者呈上中國移動集團公司業務支撐系統部專案經理、高級工程師何鴻淩的《MPP資料庫技術及應用分析》,細說關係資料庫在MPP方向上的歷史發展和實例分析。 柏睿資料科技有限公司董事長兼CTO劉睿民的《海量並行(MPP)記憶體資料倉儲的發展階段及實現探討》,探索資料倉儲記憶體化的需求、動機和可行性。 阿裡巴巴資深技術專家恒謙的《Oceanbase資料庫實現基本問題解決/分散式優化等》。 網易自研TNT/NTSE引擎負責人核心開發人員胡煒的《網易資料庫資料壓縮技術實踐》。 為傳統關係資料庫使用和開發人員處理大資料打開一扇窗。
除此以外,隨BDTC 2014一起啟動的「第二屆中國大資料技術創新大賽」和「第二屆全國大資料創新專案評選」也已進入火爆的評選階段。 針對百度大資料創意及應用,多媒體展示廣告點選率預估,基於人物的相關網路視頻挖掘,電商消費行為預測,使用者流覽新聞的模式分析及個人化新聞推薦,系列危害公共安全事件的關聯關係挖掘及預測, 基於互聯網大資料的日誌類應用處理等七道賽題的近900支隊伍已完成作品提交,正式進入評審環節。 大會將舉行獲獎隊伍的頒獎儀式並組織獲獎作品的專場報告會。 而包含大規模互聯網架構技術,大資料存儲與分析(資料採礦、商務智慧、機器學習/深度學習、資料視覺化),高性能計算領域的創新專案與產品,大規模互聯網的建設、管理與服務,虛擬化技術,開源技術Hadoop、Spark等專案應用, 大資料行業分析等領域的近百個國內團隊正在積極地爭奪大會現場的10個微型展位。 相信在這裡,你可以收穫無數的創新機會和更為志同道合的創業夥伴。
如果認同大資料發展趨勢,如果重視技術人才和工程師在大資料時代的意義,如果期待技術實踐能帶來一日千里的發展,如果決心塑造新的企業關鍵競爭力,那就不要錯過2014中國大資料技術大會。 目前購票火爆, 團體購票可享受8折優惠,個人票僅有部分剩餘,迅速搶票 !
CSDN誠邀您參加中國大資料有獎大調查活動,只需回答23個問題就有機會獲得最高價值2700元的大獎(共10個), 速度參與進來吧!
附錄:BDTC 2014時間表(點擊圖片可查看大圖)
█全體會議 12月13日(全天)
█大資料生態系統論壇 12月14日(全天)
█大資料技術論壇 12月14日(全天)
█大資料應用論壇 12月14日(全天)
█大資料基礎設施論壇 12月14日(全天)
免費訂閱「CSDN大資料」微信公眾號,即時瞭解最新的大資料進展!
CSDN大資料,專注大資料資訊、技術和經驗的分享和討論,提供Hadoop、Spark、Impala、Storm、HBase、MongoDB、Solr、機器學習、智慧演算法等相關大資料觀點,大資料技術,大資料平臺,大資料實踐 ,大資料產業資訊等服務。