2014中關村大資料日于2014年12月11日在中關村舉辦,大會以大會以「聚合資料資產,推動產業創新」為主題,探討資料資產管理和變現、大資料深度技術以及行業大資料應用創新和生態系統建設等等關鍵問題。 大會還承載從政亞信府主管部門到各行各業的需求和實踐中的疑問,探討包括政府、金融、運營商等部門是如何通過資料資產管理和運營,實現轉型發展和產業創新的路徑。
在下午的論壇上,中國移動業務主管何鴻淩作主題演講, 分享中國移動在大資料的應用和平臺的實踐。 何鴻淩是中國移動業務事業部,主持了中國移動規範架構和基礎研究工作。
以下是何鴻淩演講全文:
何鴻淩:大家好,我感謝主持人,每次楊總一介紹以後都覺得自己好象高大上了很多,其實我在中國移動負責架構規劃和基礎研究工作,今天非常容幸來到這樣一個開放日和大家分享和報告一下我們中國移動在大資料的應用和平臺的實踐, 希望和大家做一個分享和討論。
剛剛看了范總的介紹,我們三大運營商都類似,而且這種思路也是不約而同,都做了開放平臺的方式。 我再介紹一下更全面一些。
首先是應用層面,因為中國移動的使用者主要是移動手機這一方面,我們來看整個的手機上面的流量增長是非常的快,這個快體現在它是一種非線性的增長,可能跟我們平常感知有差異,它是不一樣的佈局。 我們看語音層面占的量特別少,而資料行動裝置手機產生的資料量增長的非常快,我們現在感覺到移動互聯網已經滲透到我們生活過程中的各個環節。 這一方面在為我們豐富了生活,降低了我們溝通和交流的成本,提供了很多的分享。 另一方面也是在運營商的後端沉澱了很多資料資產。 我們來看看典型的從左至右看看我們把它納入資料資產的資料,第一方面是業務生產方面,就是業務產生的資料,這些資料是最早納入資料分析系統,主要是包括使用者資料,帳單,話單等等資訊,這個資訊構成了我們傳統的資料資訊的主要環節, 在這個層面我們做了資訊化管理,精確推薦,精確行銷方式。
後面我們通過網路的位置新令,網路方面新令,通話新令,這些資料其實它跟使用者資料比較接近,能夠深刻地洞察使用者,瞭解使用者,所以它構成了我們現在最有價值的資料,我們現在很多對內和對外的資料變現都是圍繞這個展開的。 另外一個不容忽視的是講運營商的三條曲線,語音流量和增值業務是移動互聯網的產品,三大運營商方面都做了很多工作,後面我會具體講到一點。 在這一類產品給互聯網產品提供的同時也豐富了很多資料,因為它跟使用者更接近,所以最接近使用者原本行為,所以它的價值更大。 我們傳統運營商平臺來說這個資料規模都不夠大,但是這個是很好的補充,幫我們更完善的層面。
對大資料來說是至關重要的環節,我們看到現在隨著摩爾定律不斷發展,隨著封閉圍牆不斷被打開,現在從原來稀缺經濟學到現在瘋長經濟學的轉變,這個轉變很厲害。 古人說從增入減是比較難的,但是實際上來說我們從比較稀缺時代到富饒時代很多東西都面臨著顛覆。 現在很多東西都變得免費,運營商也不除外。 我們運營商都存在被顛覆的可能,但是從古到今時間沒有變化,我們一天只有24個小時,保持清醒的時間就是十幾個小時,如何充分利用搜集使用者的時間,這是價值最大的基礎。 大資料對於運營商而言存在對外和對內兩個層面,對內是我們一直想實現的資料來實現利潤增長增效的操作,這個是大資料變現主要的資料所在。 我們通過這個資料能夠安排每年有上千億的網路投資,每年有數百億的行銷成本怎麼樣定量投放,同時它也產生很多的價值,這是主要的陣地和主要的關注點。 但是非常不容忽視的是對外這一塊,因為大資料大家都知道有一個非常重要的特性就是外部性,剛剛說的資料都不是為了外部應用出發,都是為了提供更好的管理,提供更好的網路接續,但是資料存下來以後為很多的其他商業模式提供的更好。 這是資料外部化應用,資料外部化應用是一個增長階段,它不只是移動互聯網移動通訊的行業,而是對所有的企業都可以用到。 我講幾個對內的案例,第一個肯定是監控企業過去發生了什麼事情,更重要的是監控企業現在正在發生的什麼事情,這是大家都會有的,但是我們通過大資料的發展,變得更加即時變得更加精細、精准。
第二個我們必須得知道我們的客戶在哪裡,客戶特徵是什麼。 所以客戶的識別非常重要。 我這裡舉了一個例子,第一個例子是對於校園客戶的識別,我們怎麼識別校園客戶? 我們以前可能最早通過佈置及出現在位置區域裡面的客戶,後來我們加上了時間、使用者的時空特徵,這樣把一部分老師和校工排除,或者是在校園其他的人排除校園之外。 除此之外不夠,聯通使用者和電信使用者不在我們的區域內。 還有蹺課和上課層面他在宿舍,或者是他經常跑出去玩的使用者,這個也不夠精確。 我們通過全網連接的情況。 這幾年我們發現很多學生在使用互聯網場景方面有很大的差別,我們可以看到這個識別準確率是非常高的。
我們中國移動在過往寬頻是後來者,這些使用者他辦理寬頻,他的公休日和晚上及白天有很大的差別,我們把寬頻使用者識別出來。 同樣基於識別特徵和使用者各種各樣的特徵,還能識別出哪些是快遞員,因為快遞員跟其他使用者有很大的差別,識別出來快遞員之後就能識別哪些使用者曾經做過網購。
第二個剛剛講的都是長期的使用者積累,實際上在大資料越來越蓬勃發展的情況下,我們還更多的關注他的短期變化,因為短期的關注行為,特別是關注變化,意味著短期行為模式的變化。 這可能是非常重要的時機,再進而一步,根據這個特點形成他當前的情況,這個是很好的。 比如說有人在電影院不方便接電話,在上下班,正在開車或者是說正在會議的情況,實際上通過我們剛才講的資料支撐去洞察這些數事情,以前我們從基礎上沒有發展這個層面,但是實際上現在我們可以做到以分鐘為單位去識別使用者特性, 剛剛一分鐘掛斷電話,那我不能就不會打電話給他,這就提高了我們企業的工作效率。
我們把長期和即時洞察結合在一起,這就做成了BMP,一個非常完善的資料洞察平臺,通過這個平臺我們可以做更多後續的應用。 最主要的應用就是做行銷,比如說2G3G4G不同的套餐,不同的業務,我要做很多業務,這些事情就需要通過精確的方式。 剛剛只是講了我們針對客戶的洞察,做好行銷還需要做好客戶和產品的匹配,也就是我實際上要形成個人化的推薦引擎。 這裡舉一個終端的例子,我們怎麼識別終端的換機,怎麼識別使用者的換機偏好。 在換機的過程中也有很多做交叉銷售的,比如說使用者換4G的手機,我可能要給他推薦4G的套餐,以前下載不能用的應用也可以使用4G端。 所以需要做很多的個人化推薦,包括後續我們還要聯合做一些網路的優化或者在做的一些銷售的工作。 通過這樣我們每年,應該是去年1.5億部終端,今年需要設出2億部終端,這是一個非常大的量。
第二個數據商三條體現,比如說飛信,這是一個互聯網業務,現在它的月登陸數1.8個億,還是很大量的使用者,這裡面提供了非常多的行銷資源可以用。 還有現在手機閱讀,UV量0.3億,PV量195億,手機動漫和手機視頻也有相當的一些UV量,這個就要求我們一個是提供很多推薦位,跟客戶做接觸的資訊。 第二個是基於使用者和使用者的推薦,還有內容和內容的推薦。 但是我們有大量的使用者資料,我們做使用者和使用者的推薦資料更容易,運營商還有交往圈,有社交網路在裡面,這樣我可以知道你的朋友喜歡什麼。 客服人員接觸,我們現在希望把客服人員接觸都充分利用起來。 為什麼這樣去做? 因為現在主動接觸使用者隨著政策規範這塊已經非常稀缺了,但是我們被動的接觸使用者手段,我們希望每次接觸使用者都是更精准的,這樣提高效率。 我們現在通過跟各省手段建立服務方式,以一個月大概能創造出百萬級別的推薦的機會,通過發短信上億級別的,如果通過APP就是百億級別的機會。 這就是剛剛范總說的我們在省級,因為我們投資了科大訊飛的語音辨識,我們通過語音分析,把客戶投訴,錄音質檢通過錄音,這樣我們非常快速的通過熱點去搜集使用者的洞察。
第三點利用網路規劃,比如說我們網路大資料時,優先在哪些地方建,優先調整在哪些,這個都可以利用大資料規劃出來。 還有同時我們整個終端,以及整個交換器,各種類型的交換器它的聯合情況也是需要非常即時的洞察。 這是一個網路的根本。
接下來是網路大資料的對外服務,我現在是把大資料用的個人客戶和群體客戶發揮得價值在四個象限,第一個象限就是第二個象限,也就是利用社會資源和群體價值。 第三個體客戶,第四個群體客戶沒有發展。 我們現在做了社會指數,基於群體客戶我們針對一些社會的洞察,比如說31個省之間的通話聯絡程度,左邊這個圖,右邊上和下是非常典型的特徵,它跟國外的圖的區別。 我可以簡單說一下,左邊的區域通話比較多,當然我們不是專家,稍候和大家做一些專門的社會家和科學家合作,可能我們有些不起眼的資料在他們那裡發生非常大的價值。 舉個例子天津打電話最多的是日本,但是接電話從國外最多的是美國,吉林通話程度非常高,接電話57%是來自韓國,打電話60%來自于韓國。 這樣可能解讀于當地的經濟情況,當然這個需要更專業的人來做。
第二個就是社會科學研究,我結合我自己的專業,我想如果有人能夠在我們這個平臺上做分析,就能夠更加的有效果更加的豐滿。 這是我們自己的內部員工形成了影響力的模型,包括影響力的方向和一個值,這個基本上通過資料方式和我們實現的值基本上是一一連接的,同時我們三度以內是什麼情況,六度以內是什麼情況,在什麼階層實現傳播,這是非常有意思的點。
然後有旅遊特徵,我們基於位置識別以省為單位的創新,做了一個叫做智慧旅遊的一個平臺,它可以提供一些旅遊的行業標準化產品,也可以結合大資料的分析報告,通過合作夥伴提供分析報告, 也可以通過開放API的方式為合作夥伴和政府提供API許可權。 這個是整體客戶的資料,也就是說它IP是主物件,而不是子使用者,而且它也是符合KN的法則的。
這是截圖,這是北京的旅遊資料指數,右邊是江蘇的資訊化產品。 這是去年51節後的模型,通過識別特徵,以及使用者的行為,包括使用者訪問APP的行為,我們可以知道使用者的出行,以及出行方式,以及商業目的,以及出行選擇的途徑是什麼,同時可以聯合做一些會員的資料增強,以及外匯的增強, 這是在航空公司做的事情。 在交通資訊化領域也是一樣,交通資訊化領域在城際之間很少布探頭,這個成本很高,一個探頭成本就要一萬塊錢,但是通過群體探空,他通過手機就可以實現。 還有在城際的使用方式,雖然不如LBS地圖那麼准,但是通過群體行為來說,我們可以分析群體行為分析,通過這個分析能夠更好地為城市的發展,公交的規劃提供一些參考依據。 這是交通資訊化發展領域。 同樣在零售領域,西班牙代理商,同時我們也正在嘗試做同樣的事情,另外我們自己對行銷類對一些地方,跟萬達的合作做聯合行銷。 另外在金融領域提供金融聯合驗證,通過他把資訊放到金融網站上,這種金融網站我通過輸入驗證碼,通過主要的連絡人,以及消費情況通過我們的消費形式來進行驗證。 這個是我們在嘗試的剛剛我們講的精確行銷。 精確行銷除了剛剛深刻的客戶洞察,還有個人化推薦引擎之外,還有通過管道去推,這個非常重要的,這是我們大資料之外運用一個非常重要的資源推廣管道。
包括下面的兩個,一個是DNS導航,你找不到頁面的時候回到導航頁面,還有頁面的認證頁。
剛剛我們講的都是應用情況,我們公司應用人員還有省公司的人員自己嘗試做的應用,外部應用是根據具體的外部平臺合作,對於我自己就是能夠在這個平臺上低成本快速的長出來,這是我們中國移動的大資料平臺。 我們中國移動的大資料平臺和聯通有差別,我們天然的是兩級的大資料平臺,省級的就是省級的負責對外的大資料探索。 在集團彙聚了全網的資料,我們每天8TB事物系統資料,400TB日誌資料,我們有專業公司,有總部,還有各省的資料交換和資料增強,把資料下發的哪些工作我們通過服務資料,還有深化和大資料探索對外的應用,包括資料價值, 資料交換和行業應用,未來的這個架構可能會進行調整。 因為實際上省的平臺和集團平臺形成一定的競爭,這種競爭是比較良性的,這樣大家互相參考,互相借鑒,互為實驗的目的。 為什麼這樣去做呢? 大家可能有一點我們做技術的人可能會深刻地感受到,現在的基礎設施已經非常的廉價,而且它還會沿著這條曲線一直廉價下去,當它變得成本沒有那麼高的時候我可能去願意做一些嘗試,因為我希望大資料能夠充分發揮出來, 並且沒有阻礙的發揮出來。
後續就是通過兩級大資料平臺做成本效益。 技術上類似,大家幾大運營商都是比較類似的,傳統企業都是類似的,我們相對於互聯網我們存儲了大量的結構化資料,結構化資料需要探測和探查,我們都會有一個BMP的資料,也有HADOOP,我們也有混搭系統,跟范總講的一致, 我們同樣通過EQR來統一管理,統一服務,形成一個總體的資料開放平臺。 對於平臺來說,我怎樣通過這個平臺去充分發揮大資料的價值,大資料的應用是長尾的特徵,長尾大的頭固然重要,但是絕對不能忽視長尾的尾,我們怎樣通過大資料平臺結合起來很大,但是實際上一個點很小,來把它都發揮出來。 這是非常重要的問題。 傳統的時代我服務于我的內部系統,我非常專業,我非常知道市場的狀況。 但是對內的網路規劃網路的優化,還有我要服務內部的一些審計,還有服務財務的資訊化管理,我們是缺乏這些方面的專業知識。 另外特別是服務于外部,我們新的專業記錄者,缺乏外部的資源和行業的資源,無論是外部價值還是經濟價值都會面臨這個問題。
我們的且方法跟剛剛范總講的一致,就是搭建一個開放平臺,把平臺一大堆快速的靈活小的應用,快速的去試錯,快速的嘗試,作為他來說就是要對你瞭解你所應用的這個領域,你有這個背景,而且要逐步快,就是因為快,失敗也很快。 第二個就是要做很好的管理,你要知道誰用了這個資源。 對資料獲取,加工,以及展現存儲這些東西,像水和電一樣的雲計算資源去提供。
同樣我們有一個大資料平臺的參考架構,在參考架構我們形成了一個DATA 的PAAS平臺,還有存儲生活表,還有檔,還有採集能力都做了都逐步化,並且兩者管控,通過自己的服務方式可以來申請,無論是對外還是對內都是這樣申請, 我們可以建設一個SDORE這樣一個概念來交換。 同時作為資料交換,我們在這個平臺裡面也有資料交換的基礎設施,整個裡面都是做平臺,做好計量,做好配合,大家可以知道亞馬遜平臺主要針對業務運營系統而言,我們大資料系統主要是針對特別的系統,當然理念是一樣的。
最後我有一點思考,大資料裡面我們有一點來說,為什麼我們在個人客戶嘗試的不多? 因為我們現在覺得沒有解決一個問題。 就是說我在做大資料這種應用這種價值變現的時候我怎麼實現跟使用者共贏? 因為現在很多的大資料應用模式都是可能忽略了使用者,只是從廣告主和媒體方的角度去講,這樣其實背離了現在互聯網時代使用者佔據消費鏈的主導地位,使用者的主權,更加彰顯了這種邏輯,我認為這種邏輯是零選擇的情況,當然這個我們要多方共贏。 這是我們要解決的,目前這種解決方式很困難,但是我們現在正在演進。 我們有兩種方式,一種方式是個人化推薦引擎,但是個體客戶是完全歸屬客戶本身所有,而且也是他可以選擇託管在資料平臺和他背後的應用設備裡面。 這樣把整個資料使用的權利交到使用者的手上,通過這樣的方式根本去倒轉這樣一個資料龍頭,讓使用者享有更多的權利,這樣我們做的任何操作我們可以實現跟使用者的共贏,這是我們在大資料應用的想法。
我覺得大資料時代,特別是數位經濟時代,有很重要的一點是我們需要多分享,而且我們通過分享不會損失掉什麼東西,比如說我們今天交流了以後,你不會損失什麼,我也不會損失什麼,但是我們社會價值都增加了, 這是我們今天來到這個論壇上做交流的目的。
下一步對於大資料而言最重要的就是開放的合作,大資料最重要的合作就是外部化應用,中國移動是後來者,很缺乏行業的支援,我們在金融行業,征信行業,在零售行業,既沒有行業的知識,也缺乏行業的經驗, 所以我們渴望和希望有應用合作夥伴和我們一起去探索怎麼通過資料讓社會變得更加美好,讓各行業和企業商業模型變得更加有效率。 所以我希望能夠有更多的合作,通過聯繫的方式,我們實現與使用者資料需求方,資料生產者,資料提供者形成共贏的環境。 我講的就是這些,謝謝大家!
(責任編輯:mengyishan)