壓軸論壇:大資料時代的商業變革
和訊科技消息 1月16日,2012中國互聯網產業年會今日在京召開,本次大會的主題是「醞釀2013:在變革中掌握精彩」,和訊科技進行全程報導。
以下為「壓軸論壇:大資料時代的商業變革」實錄:
主持人:高新民理事長
嘉賓:謝文知名IT評論人、徐明強 微軟亞太研發集團windows Azure首席架構師、齊向東360公司總裁、姜奇平中國社科院資訊化研究中心秘書長
姜奇平:對於大資料現在大家是眾說紛紜,想聽聽大家的看法,高新民老師是中國互聯網協會副理事長,過去我們一直以來有雲計算和物聯網,新的浪潮又到來,怎麼評估,美國奧巴馬政府也提出了自己的戰略,這裡面的要點在什麼地方, 請高老師發表意見。
高新民:我是一個旁觀者,這輪的互聯網的新技術,主要是移動互聯網,一個是雲計算,還有一個是物聯網,前幾年炒的很熱。 大資料是和這些緊密的聯繫在一起的。 現在移動互聯網產生大量的資料的很重要的基礎,雲計算實際是存儲大資料的很重要的技術。 我認為將來可能是一體化,但是運用層面看,移動互聯網現在是已經做的非常好了,每天我用手機上網,企業加速,你的手機快慢了,要加速了。 垃圾太多了,按一下就清理了。
大資料在網路行銷是現實的問題,在其他的領域裡面,大資料還是蓄勢待發,主要是資料量還不夠大,或者量很大的資料還沒有結構化的技術的支撐。 廣東有一個交通卡,全廣東的16個省市在一個平臺上做起來了,每一個城市都幾百萬張卡,坐地鐵、公共汽車,積累了大量的資料,這些資料是非常的有價值的,這個資料智慧交通裡面叫歐迪資料,始發點在什麼地方等,有多少人群, 坐公交為什麼要擠,線路和車次夠不夠,對於改善交通有極大的價值。
互聯網這個產業裡面,做精准行銷,做交易平臺,還有DSP廣告投放,進入了大規模的發展。
姜奇平:到最後大資料到底是什麼已經搞不清楚了,我想請教謝文老師,您在行業是非常資深,在您看到,大資料到底是什麼?
謝文:大概是去年這個時候寫了相關的文章,簡單的講,大資料的概念,有一批人是用現代資料來描述,我個人選擇用將來時,凡是現在說到的,用到的,賣軟體的,硬體的,和我說的大資料不沾邊,大資料是一個比較模糊的未來的東西。 在座的領導和姜老師都經歷了,我們都是經歷了中國互聯網從無到有的階段,資訊化社會分三個階段,第一個是電腦,第二是互聯網時代,第三是大資料時代,當大資料時代成熟的時候人類進步就完成了資訊化時代。 世界的萬世萬物都在以極高的速度迅速的資料化,包括人,包括社會和物質世界,我們不斷得用到雲計算,物聯網都是這個過程中的現象,當世界的萬世萬物都資料化的時候積累下來的龐大的不知如何下嘴的那樣一個資料的堆積,規模之大, 挑戰之複雜,形成了未知的巨大的財富,或者叫資源,我們管這個資源、資產叫大資料。 對資源、資產的理解,利用,挖掘,使得人類的生活方式由此產生巨大的變化叫做大資料時代。 從概念上講,我是以奧巴馬的來講,他是2012年講的這個詞,我們一般比他們慢3、5年,本來我希望2013年是作為大資料的元年,一看咱們又通過法,恐怕還要推兩年,2015年才是開始認認真真的有一個比較好的環境。 有人把它比喻成新時代的星球也好。
大資料不等於資料大。 大家講的大資料基本是資料採礦,資料採礦有20年的歷史了。 現在大概處於補課階段。 我們幹了好多年了,一點新意都沒有。
姜奇平:謝老師的見解非常的犀利,大資料不是大,這是一個普遍的觀念。 下面我們有請徐明強先生,您覺得雲計算和大資料是什麼關係? 您是怎麼看待技術發展和潮流的關係?
徐明強:我搜索了大資料和資料大的相關的資訊,謝老師和我的觀點驚人的一致,我講一個寓言故事,一個球遇到一個螞蟻,他說做三圍的東西真好,我一眼就看到有多少的螞蟻,螞蟻說線上有多少螞蟻我也得從頭爬到尾才知道, 三維和二維就是這樣的差距。
大資料是在原來的基礎上給你一個新的看見,是質的區別。
再講一個真實的故事,2006年的時候,國際是公信貸上收益是80%,中國是20%多,中國發現差資料,差二維和三維的資料,如果你只有二維的資料對企業本身分析你很有可能覺得這個企業風險高不能貸給他,但是你看三維的資訊, 母公司有很多的控股,你就可以給它貸款,但是因為中國沒有這樣的資料,就沒有辦法做成。
在我們這些從事者或者推動者來說,有兩個因素,一個是不可控因素,還有一個是可控因素,我們常常把可控因素說成完成這個事情的必要條件。
第一,雲存儲,我個人認為,在初期是非常的成功的,是拿微軟的雲存儲舉例,現在是供不應求的狀態,每個星期都有一個嶄新的資料雲存儲中心,原因是客戶和企業發現雲存儲確實可以以最低的成本,和高可靠性, 方便擴容的方式代替他們本地和企業內部做這樣的存儲。 低成本到什麼程度? 在今後的幾年,利潤會到百分之幾。 因為這是競爭非常厲害的產業。
第二,雲計算給大資料的應用提供了非常好的彈性的處理的能力。 我們微軟的Azure,夏天就要落地。 我們的合作夥伴說現在要弄上千台機器,但是雲計算給我們提供了非常便捷的方式。
姜奇平:齊總您怎麼看大資料到來了以後帶來的創新的機會?
齊向東:雲計算的概念很多人還沒有完全弄清楚, 我更喜歡大資料的詞,比較形象,雲計算感覺雲裡霧裡的感覺,但是謝文老師一說,大資料我又有點暈了,謝文老師是理論家,說3、5年之後是大資料時代的到來, 但是大資料時代的到來不是天上掉下來的,是我們產業的人士從不像大資料的事開始,先把大資料變大,把變大的資料處理,逐漸的讓我們的社會真正的進入到謝文老師指引的時代。
360是具有創新精神的公司,06年我們開始做安全,很多人都知道360的成功是因為做免費的殺毒,普及到中國每一個人的電腦裡面去,老百姓受益,顛覆了整個產業。 但是很少有人關注商業模式成功的背後,還有我們技術上的顛覆的創新,安全,老百姓是有明確的使用訴求的話,如果不能解決安全問題,06年用了你的軟體,07年就卸掉了,06年到今天,使用者口碑越來越好,使用者數不斷的增長, 360和其他的殺毒軟體相比好用,06天我們做殺毒的時候是不懂的,殺毒行業的公司在這裡面耕耘了20幾年,積累了很多的專業的知識,360為什麼能夠戰勝這些殺毒的廠商? 主要是我們的技術比他們好,傳統的殺毒沒有把客戶變大,很難應對互聯網千變萬化的木馬,360就做了件事,在傳統的殺毒引擎又加了一個大資料。 我們不僅僅依靠用戶端,對木馬進行識別,我們更重要的是用戶端,構築了大資料的集合,每一個使用者,我們叫雲安全,每一個使用者用我們的安全軟體掃描自己軟體和程式的時候,我們把電腦的每一個程式都打上一個做的程式的指紋。
把這個東西放在服務端,在你的電腦你都有很多的程式。 這些程式的樣本分佈在全國各個電腦裡面是什麼情況? 安裝了多少? 通過這樣的一些資料的分析,我們就能夠創造出一種更好的對未知木馬的病毒的查殺的力度。
木馬的傳播路徑和正常程式的傳播路徑是不一樣的,木馬是昨天還沒有這個程式,今天就突然爆增,被掛馬的網頁把漏洞補上了,傳到第三天高速增長的時候就不再增長了,過了五天之後它又搞了一個網頁,傳播途徑,他的傳播路徑就是高速增長, 停止,再高速增長,再停止。 正常的軟體,是有一個通知,然後下發一個光碟,比如全國3500個使用者,一周之後增長,然後就不增長了,這是一個正常的傳播路徑,或者是商業的軟體保持持續的增長,或者持續的下降。 把這樣的特殊的樣本拿出來,再用機器的學習來處理。 這是我們最初的時候對大資料的應用。
我們把使用者電腦所有的程式資料化,然後打上指紋,通過這些東西來分析到底是好還是壞。 這個技術是適合互聯網的應用。 我們用雲安全的技術,徹底的顛覆了傳統的殺毒引擎。
最近在手機上騷擾電話,垃圾短信,現在是越來越厲害,前幾年,垃圾短信都是SP,運營商,造成的,這幾年經過工信部的治理有明顯的成效,現在的垃圾短信都是分佈在全國各地的銷售,賣房子、保險的。 從各種途徑拿到電話,都是點對點的攻擊和轟炸,不是通過SP的埠號發出去的,一天發500個,從行為上你沒有辦法識別,這是騷擾還是正常的電話,我們在360裡面加了一個雲舉報,你接到一個電話是賣保險的,我們就會出現一個提示, 如果是騷擾電話我們會分類,標誌的資料就會到雲端,這樣的資料積累多了,我們通過演算法分析,達到什麼程度可以確實是廣告、推銷的。 這個定義完了之後,再有人接到電話,可能有7-8個人標注他是一個賣房子,你可以選擇不接,這樣的大資料的匯合,把垃圾短信進行有效的分析,我們攔截騷擾電話,已經幾百億條了,還是很能解決問題的。
姜奇平:我是你們的使用者,確實是這樣的。 最後一個問題想問一下高新民老師,大資料在中國,我們看到美國是高度的重視,推動中國的大資料時代的商業變革,政府和協會、市場在裡面都應該發揮什麼樣的作用?
高新民:大資料的概念,剛才幾位專家都講了,互聯網和雲計算到現在為止都沒有突破,有各種各樣的說法。 要真正的推進它本來對我們所有的資訊資源的一些充分的利用,而且能夠提供創新的服務,同時帶動產業。 我建議我們的政府,因為雲計算、互聯網都有專項的資金,移動互聯網和雲計算都可以充分的利用政府的有利的政策和基金的管道來發展大資料。
作為企業,最終還是要創新,包括精准行銷等等。
作為我們協會講,主要是為行業服務,一點我們既然是講大資料,肯定涉及到很多個人的資訊,這裡面有很多的細節要做,上次我們開的座談會,當時有很多的專家是堅決反對基於大資料的(應用),有很多的垃圾的軟體。 第二個是創新,我們互聯網企業規範的競爭,既保護智慧財產權,又要保護創新者的權益。 我們的行業裡面,包括大資料的行業裡面,也是需要研究。 我們協會也願意和大家一起研究來推動和找出一些大家能夠接受的。
姜奇平:謝謝,由於時間的關係,我簡單的點評一下,今天幾位專家都是非常資深的,概括起來,我們現在解這個題起來很難,這個事情剛開始,以後我們會繼續的剖析大資料的細節。 作為第一個題目,比如說在這樣的論壇上,由業界專家解析,破這個題的意義在這兒。 今天破到什麼結果呢? 大資料的水挺深的,道可道,非常道。 謝文說了,我們說不是什麼很好解決,大資料不是資料大,但是資料是什麼? 我認為從今天的結論裡面我隱約的感覺到大資料從歷史來又走向未來。
在道層面是資訊化的浪潮的自然的延伸,大資料的概念第一次出現是托夫勒33年前提出的,大資料除了表面的意思以外更是資訊化的發展浪潮,包括雲計算、物聯網、互聯網,到當前的自然結果,我們更多關注與怎麼推, 推進我們的產業的發展和應用的發展是實實在在的。 同時我又看到謝文說的,我們不知道明天的事情,明天是一個重要的事件,也許我們不知道它,不知道的時候怎麼把握它呢? 就是把它創造出來,創新,也許在創新的過程中,我們鋪的路把它走出來了,所以我認為在這個過程中,大資料才能不斷的發展。 但是我認為就是要把握這樣的原則,在歷史的基礎上,包括我們今天談了很多很深的話題,這背後的挖掘和發展與基礎,我們這樣好的題目,沿著大資料的方向通過創新,把它創造出來,我認為這是對大資料最好的定義方法,今天的論壇就到這裡, 讓我們一起來謝謝這些嘉賓!