2014中關村大資料日于2014年12月11日在中關村舉辦,大會以大會以「聚合資料資產,推動產業創新」為主題,探討資料資產管理和變現、大資料深度技術以及行業大資料應用創新和生態系統建設等等關鍵問題。 大會還承載從政亞信府主管部門到各行各業的需求和實踐中的疑問,探討包括政府、金融、運營商等部門是如何通過資料資產管理和運營,實現轉型發展和產業創新的路徑。
在下午的金融@Big Data論壇的圓桌論壇環節中,來自政府、金融、運營商等部門的業界精英就《資料資產重構金融生態》這一話題進行討論。
主持人易歡歡:首先想請教在座每一位,我剛才在聽完演講之後討論完大資料還是要回歸到本原。 作為來自不同類型機構的從業 人員,你怎麼來理解和看待大資料? 因為有人說大資料是千人千面,每個人都覺得大資料很有用,但是不知道大資料在哪裡。 結合自 己的工作經驗來談一下您認為什麼是大資料。 因為咱們這次的主題是聚合資料資產,能不能談一下對現有的企業來講最寶貴的資料資 產究竟在哪,具體怎麼使用。 第三個我想問的就是當前關於資料資產的使用在我們所處的金融環境裡面大概是在什麼樣的階段,下一 步可能是什麼狀態? 給大家展示一下。
劉賢榮:謝謝易總,最近大家都在談大資料這件事情,在剛才討論的時候我也提到過,我們一直在思考大資料對銀行意味著什麼 ,剛才說了一句話大資料千人千面。 我們請教過很多公司也做過很多溝通,大資料感覺是有幾個業界的通用的定義。 但是一旦落到銀 行我們發現實際上這種定義往往都很難以去落地,其實你如果為每一個人的話,大家對大資料的期望都不太一樣。 當我們跟營業單位 溝通的時候,營業單位首先就問你們在搞大資料的時候是不是我們傳統意義的帳目就不用做資料了,大家一談資料就是多種類型的。 最後我們總結完之後大家形成了一個共識,我們認為大資料實際上是能夠為業務上帶來價值,讓我們更緊密的瞭解客戶,然後可以讓 我們優化流程的所有資料對我們而言都是大資料,這是從圓的視角來看。 雖然我們講資料是資產,但是資料擺在這裡不是資產,因為 我們不是做交易的,銀行我們最終是提供金融服務,所以我們最終是圍繞金融服務如何做得更好。 對我們而言我們理解的大資料是怎 麼利用各種內外部的資料説明我們更好的決策,説明我們更好的瞭解客戶,説明我們更好的管控風險,説明我們更好的優化流程。 這 裡面是資料加分析加應用,這是我們理解的大資料,它變化了一個體系。
反過來講,從這個視角來講,我們現在銀行領域要談大資料,我們最關心是兩個事情。 第一個是怎麼樣啟動現有資料的價值,包 括征信的資料,包括內部交易的資料,其實我們資料也不少,可能可以到P級。 但是我們面臨最大問題是怎麼啟動,怎麼真正的讓數 據說話。 第二是怎麼活,我理解大資料裡所謂的活就是通過資料可以在一個特定的場景,比較活的場景裡把客戶的行為、愛好和風險 還原回來,這是我們做大資料的最終的目標。 希望以後在大資料的整個體系裡,我們以後和外部的資料公司也好,買資料也好,做數 據分析也好,最終我們的資料的體現在銀行裡面是通過資料讓銀行變得更智慧,這是我們做大資料的初衷,也是我們做大資料的最終 的目的。
如果讓我把銀行資產做分類,其實銀行第一類資產是銀行和客戶的交易,以及記錄的客戶的靜態資料,這是傳統意義上銀行主要 的資料資產,比如做信貸和支付,銀行資料最大的優勢其實銀行是天然具有客戶的身份資訊,做存款或者貸款也好, 首先把你的真實 身份會提交給銀行,無論做大資料到什麼程度,我認為這也是銀行最為核心,價值最大的資料。 第二類資料就是客戶的交易性的資料 ,這個剛才說了,客戶的靜態資料和交易資料是指結果,什麼是過程資料,過程資料就是你到網點裡去,你到網點的行為,有些是音 頻的,有些是視頻的。 你在網路銀行和手機銀行的行為,這是行為資訊。 逐漸會把行為資訊跟我們已經記錄的帳戶的資料和靜態資料 整合在一起,內部就為客戶畫了一個相。 第三類資料就是外部的資料,最近幾年來有一類外部資料我們用的很多,就是征信資料,每 一個信貸產品幾乎都要用征信資料,除了征信還有別的,像宏觀經濟的資料,包括市場諮詢資料,包括協力廠商資料等等。 現在可惜的 是現在處於一種什麼狀態呢? 基本是處於有需才用資料,這種資料都是在某一個流程裡的,比如征信資料就是在信貸流程。 未來我們 需要有一個統一資料、統一平臺的視角,要打通,不但是資料的一個流程,內外部加在一起形成一個完善的客戶視圖。
剛才問我們到什麼位置上去,這個很難判斷。 我們有一個資料評估模型,其實評估模型有很多概念,有一種是資料管理成熟度, 還有資料應用的成熟度,你問的問題應該是應用成熟度模型。 我不想分得很細,我們到底到了優化還是什麼等級,其實很難判斷,不 同的領域不一樣。 分成三個的話我有答案,我們是分析型,比如傳統的統計報表型,第二是分析型,第三種是問題導向型或者資訊導 向型。 我們是第三階段正在逐漸成熟,往第三階段發展的過程。
2王曉蕾:關於什麼是大資料的定義,我也同意千人千面。 我對大資料的理解可能是感性多餘理性,地球剛剛誕生的時候和今天 的地球實際是一樣的,雖然有一些變化。 但是這裡面最大的差別是什麼? 就是在以前的荒蕪的年代你的記錄水準沒有。 後來發展到結 繩記事,逐漸到今天的記錄,我們可以用一種事實上、資料性的、數位性的,把現實生活中的很多現象記錄下來,這種現象包括人的 行為。 隨著技術的進步,對這種需求上的生物的活動的記錄越來越精准,比如說對人的認識,一天是望聞問切,現在是戴個可穿戴設 備,人方方面面的變化可以用資料精准的記錄下來。 你問我什麼是大資料? 我的理解就是由於手段的先進,我們逐漸可以把地球,甚 至宇宙上發生的所有事情記下來。 這些記下來以後就方便我們更好的瞭解這個環境,這個環境包括自然環境也包括社會環境。 所以從 這個意義來講,我覺得所有的資料都可以歸結為大資料。 最初我理解大資料以後,特別是對一個人的資料的記錄可以逐漸的去預測這 個人未來的行動的時候,比如連我早晨起來我還沒有想到我今天中午可能會去哪裡,但是通過對資料的記錄已經預測出來我要去哪裡 。 我馬上就會想到,通過這個預測有一天它可能會預測我的思想,之後我覺得這個結論就更可怕了,人可能會逐漸的被資料所取代, 人可能就是滅亡之時了。 所以當人的思想可以被某種東西控制的時候,我覺得那個時候世界是什麼就不太清楚了,為什麼這樣說呢? 比如說大家現在的消費為什麼所控制? 為數據、為廣告。 剛才講的推送,銷售行為怎麼受影響? 我上了你的平臺,你平臺周圍根據對 我的認識推送一些保險廣告,你已經用資料行為決定了我的消費行為。 有一天通過這種推送和方方面面可以決定我的思想的時候,那 個時候是什麼樣就不知道了。 所以我對大資料的理解可能更多是感性。
回到征信中心,對征信中心我們最珍貴的資產是記錄了2004年以來中國證券市場上每人個的行為,還有企業1997年開始的最一筆 借貸行為,這對了解中國市場的經濟發展規律來講是非常重要的資產。 大資料的應用是兩大部分,一個是宏觀應用,讓大家更好的了 解規律,比如說大家對感冒藥的搜索,可以不必具體,但是反映了整個的趨勢。 另外就是關係到某個主體,就是征信對每個主體的征 信。 兩大應用,對征信中心來說我們也逐漸意識到、認識到資料的資產的價值是需要發覺的。 所以我們也在想盡各種辦法,利用各種 手段來利用我們征信資料和價值,從而為中國市場和企業、個人服務。
我們目前的階段是作為一個征信機構來說最為核心的任務是為每一個借款人提供信用報告,從這個意義來講我認為我們的系統是 做得非常好的,做得好的原因就在於兩點,第一個是行政力量。 其他國家大家知道它是自願的,自願的結果就是有些機構參加,有些 機構不參加,這樣的信用報告所反映的企業和個人的信用狀況就不全面。 中國有行政力量,同時也是信貸市場發展到現在所有的金融 機構的共同的需要,所以當我們決定建這個征信系統的時候銀行相應非常積極。 第二點就是當系統建成之後查詢是非常活躍的,因為 大家都需要這個東西。 從這個意義來講,從提供信用報告的角度來講,我認為我們目前的階段已經是相當不錯了,至於擴大資料來源的 話,有很多是不受我們中心所左右的,涉及到國家對政府資訊公開、立法等等,這方面我們也是一直在努力,到今年為止也在努力。 另外一個就是對資料價值的挖掘我們剛剛開始,我們剛剛起步。 隨著基礎設施、方方面面,包括資料積累的不斷的增加,我相信從數 據當中挖掘價值的事情在未來幾年會加速。
主持人易歡歡:接下來請亞信的楊總,但是這個題目我想給你變一變。 因為前年兩位在應用場景裡更偏甲方,更偏資料的擁有方 ,像亞信更偏產品的提供方。 第一個問題還是一樣,亞信怎麼來理解大資料,怎麼看。 第二個想看一下,因為亞信當年的核心的優勢 領域主要是在電信行業。 現在你的產品應用在金融行業的話,能不能比較電信行業的資料資產和金融行業的資料資產以及側重點有什 麼不一樣? 還有在技術的應用的階段上,這兩個行業,比如像Hadoop這個技術,Hadoop這個技術在互聯網是OK的,但是在金融行業裡 面,因為它的交易量非常大,Hadoop的速度比較慢。 您怎麼看待不同的行業應用的技術的階段性的問題?
楊晉:我先說第一個問題,就是怎麼看大資料,大家可以在網上看到大資料的3V、4V的特徵瞭解很清楚了。 我們看到大資料時代 這個書裡也提到,就是大資料的玩家分為三類,一類是資料擁有者,像銀行、運營商等等,天然的就是擁有大量資料。 第二類是沒有 資料,就是服務者,像我們亞信一樣,我們本身沒有資料,但是我們有很好的技術,可以提供大資料相關的平臺、產品和服務。 第三 類是既沒有服務也沒有資料,但是有很好的創意,可以在這方面發揮我的作用。 現在很有趣的現象是像銀行或者像運營商,他們天然 擁有很多大量的資料的公司很多時候他並不強調大資料的事情,說得更多的反而是像亞信我們沒有資料的公司,我們不斷的強調大數 據應該怎麼樣怎麼樣,我們是想更多的通過資料產出更多的價值, 資料是資產。 原來我們會清理歷史資料,因為磁片容量滿足不了存 儲需求了。 現在大資料是資產的時代,我們很難想像說你的資產每隔一年區別清理掉,我想大家都不會去做這個事情的,大資料時代 資料是重要的資產,有的資料現在可能不一定有用,將來可能會產生重要的價值。 資料是重要的資產的情況下,並不是採集下來保存 在硬碟上就有價值,也是要有不同的應用在上面,使資料產生價值的變現,包括在交易市場,在互聯網金融領域,等等,使資料真正 的發揮作用。
在這個情況下還需要涉及到一點,現在我們說資料的開放,資料的應用,還有一點就是資料的安全性,如何更好的保證資料的隱 私性。 像美國做大資料開放通過採集一些資料做一些分析。 有的機構拿這些資料分析完發現某一方公佈的一份資料看不出來對這個人 有什麼影響,但是我把幾方公佈的資料做應用關聯起來,去確定比如說這個人是什麼什麼州的,他是學生,在什麼醫院就醫了,把數 據關聯起來就可以定位到這個人, 這個人的位址,就很可怕了。 如果自己在沒有授權的情況下怎麼保證,這個也是未來要關注的問題 。
主持人易歡歡:亞信最早做電信,現在進入到金融,隔行如隔山,兩個行業的資料資產的著重點有什麼不一樣?
楊晉:從整體來比較資料資產有很多相同的,比如在運營商裡像通話、語音,就是話單的記錄。 銀行裡每次的刷卡會有交易行為 的記錄,這些資料都是很相似的,像有一些帳目和財務的資料,不同的應用都會有這些資料。 具體的區別在不同的資料有不同的應用 方面和特徵,像運營商裡可以做到新的資料,可以通過資料定位到人所處的位置資訊,這是它的典型特徵,也可以基於位置資訊產生 不同的應用。 在運營商裡拿到資料可以做全景的描述,之前銀行做交易資料,或者互聯網做的網上行為資料只是謀劃一方面的資料, 我可以通過互聯網,可以通過移動互聯網每次在手機訪問一個網頁或者應用的時候都可以把這些特徵記錄下來,這是跨平臺,跨行業 的,這是運營商裡獨有的,非常有價值的資料,現在基於這種資料做使用者的精准的定位產生一些廣告的推銷,做這方面的應用。
主持人易歡歡:Hadoop這種技術在運營商的應用有什麼影響?
楊晉:其實我們應用有幾種方面,一個是像金融裡的銀行有這種高頻的交易,做一次交易馬上收到餘額有多少,這對於Hadoop的 技術來說可能沒法達到高頻次的要求,但是現在說Hadoop說大資料技術,並不只是說Hadoop, 並不只是說存儲等等,而是包括整個分 布式的體系裡,像Hadoop、spark等等,這些都是屬於大資料的技術。 因此說的即時交易,可能我們Hadoop做不到,可能spark可以做 到,或者其他的高頻的流處理技術可以做到。 像Hadoop和spark可以用在分析,用在內部的季度性的報表,這些本身處理資料量大, 對傳統的架構處理效率低,同時投資成本非常高,這時候可以用到Hadoop相關的技術實現資料的快速處理,同時可以很好的降低投入 的成本, 這個是它的一大優勢。
主持人易歡歡:您講講大資料的標準定義,就是從工作實踐裡面,互聯網門戶。 您的企業從發展到現在,積累的最寶貴的別人不 可複製,未來成為你們公司業務延伸的殺手鐧的資料資產有哪些? 第三個就是怎麼進一步在這個方面做,處於什麼階段?
許澤偉:最務實的角度大資料對我的意義就是它是我融資的概念,這個很務實的一個事。 我們做的時候我們就要進入電商,2012 、2013我們就叫金融大資料了,2013、2014年我們就變互聯網金融了。 我們正在變成金融交易所,實際上對一個創業者而言,因為我 要說這個意思就是說甭管你在幹嗎我們都在做資料變現這個事,所謂能變現是因為我們有資料變現的能力,或者我們找到了一定的數 據變現的方法,但是資源、媒體, 或者大家樂於去給這個東西一個概念所以就出了一個大資料,所以大資料更像我們融資的一個概念 ,不管叫什麼都是我們賺錢的一個方法。 就是把非結構化的資料結構化的過程,對我來講這就是最簡單的理解大資料了。 實際人類一 直都有大資料這個事情之不過怎麼應用了,對企業而言就是變現,這是我的理解,這很務實了。 它可以給我標上標籤讓我有更高的估 值,就叫大資料了,但是有沒有這個概念都要做這個事。
第二個最重要的資料資產就是漁和魚的概念,就是使用者和使用者在我們平臺的有意向的購買行為,這是對我們有意義的。 當然更有 意義的就是這些工具了,就是怎麼持續擴大這些方法,從應用到分發到行銷,當然怎麼賺錢還是看你的資料怎麼變現。 對平臺來講最 重要的是這個方法,方法論,實踐的經驗,試錯的經驗等等,這個對我來講是最重要的及
第三個問題我覺得任何一個領域都是術業有專攻,我從做資料分析的經理到做行銷到現在,這是一個生態系統,但是僅限是金融 相關的事情,也可以幹別的但是不是我們擅長的,我們服務的人群可能是中小,就是平均個人是20萬的, 可能他在這個平臺交易、貸 款。 我舉的例子我們平臺不是做保險,保險只是一個頻道,一個產品。 就是所有的交易行為,我們還有可能上升,等等,我希望是一 個平臺系統,還是一樣的,他做的頻次越多,我們收的手續費越多。 大的說走就走了,服務小的頻次就比較多,還是中小,所以希望 最後是中小使用者金融產品的交易所,是這樣的生態體系,可以做很多事情。 隨著我最開始到現在和京東聯合做,希望做一個生態系統 ,現在做的也是我現在能想到的最多的事情。
主持人易歡歡:下面的問題給到宣博士,大資料的定義是什麼? 您這邊既服務了淘寶,一些電子商務企業。 同時也服務了金融機 構,您認為這兩類積累的資料有什麼不一樣的特性? 在應用場景上能否交叉使用,尤其在金融應用上兩者之間,像淘寶缺什麼,銀行 做小微商戶缺什麼,能不能中間有一個融合的交易平臺這是第二個問題。 第三個問題還是想請您展望一下,像Hadoop和雲計算在這裡 的應用,您覺得還有什麼是在技術這塊比較值得大家去關注?
宣博士:以前資料採礦經常說我們講海量資料,就是大資料,海量資料比大資料小嗎? 我覺得從資料本身來說我覺得只是更多樣 化,而且易購。 以前我們傳統的做資料可能關注的或者經常接觸的是結構化的資料,交易為主的資料,現在不管互聯網資料也好,傳 感器也好,方式不太一樣,種類發生了變化。 把資料轉化為價值,對我們來說沒有變,只是原料不太一樣,原料更豐富了,對我們也 是好事。 我們本身的定位是把資料轉換為價值。 做資料窄義理解就是變現,就是更高效之類的。 但是把大資料講大一點,作為國家戰 略來說就是讓社會也好、政府也好、人也好,通過大資料變得更智慧,更美好,包括更自由、更有尊嚴,這些都是華院角度來看的。
第二個就是金融和電商,金融本身反映很多是跟財務有關的資料,包括現在個人財務有關的資訊,電商反映更多的是商品購買, 消費嘛。 所以這兩類資料反映的角度不一樣,綜合起來肯定有很多好處。 最初包括阿裡做小貸也是跟銀行合作,開頭跟建行合作,後 來沒合作了,所以建行做了一個善融,然後天貓自己成立了小貸公司。 總的意思我覺得本質來說結合是最好的,本來應該是電商提供 資料平臺,金融去做金融服務,我覺得結合是最好的。 我相信這個結合是非常多,包括個人消費也是這樣。 如果個人的信用又基於個 人財務資料,很多時候跟個人財務和還款意願有關,同時結合個人消費有關的資料,綜合起來有一個個人評分更有意義。 我們本質來 說也不用資料,我也不認為我們擁有資料,因為已經那麼多擁有資料的人,比如有銀行,比如電商,比如我們的子粉絲經營的業務有 資料。 可能還會有新的個人征信公司,還有像資料堂這樣的公司他們也專門搜集資料,而且他們有非常大的眾包團隊來搜集資料,我 覺得我們本身不必要去做那麼多去搜集資料有關的工作。 我們就是怎麼樣把搜集資料的公司和需要資料的公司對接起來,把資料應用 好。 所以第二個問題就是我們也站在很好的角度來做我們的平臺,可以幫忙機構把運營商的資料也好,把電商的運營商的資料也好, 綜合起來。 所以第二個問題就是結合有好處,就是最大的好處。 但是做起來也不是容易的。
第三個問題是技術,Hadoop的技術目前在處理非機構化資料也好,主要它有一個(英文)技術,我覺得現在用更便宜的伺服器可 以做更大的資料處理和計算,這個不管任何一個雲計算平臺,這個(英文)的技術是非常重要的。 第二個就是spark技術,也重新有 一個新的程式設計方式,而且程式做得更小,這個是非常有説明,新的技術肯定會不斷的發展,我想spark以後肯定還會有新的技術,所 以技術產生是不斷的。 我們本身也是定位在研究,因為大資料還有一個名字叫數位科學,第二個是大資料的成熟的計算和運用。 第三 個我本身覺得在中國目前這個階段還是需要關注的,尤其大量的在座的企業最關注的還是應用,就是應用本質上來說還是更大的市場 ,我覺得包括不一定大資料,就是一個小資料裡中國可以做到的話,中國很多企業也不一定是可以做到的, 這個階段也沒有完成。 中 國傳統講就是資料採礦的時代,小資料時代。 所以這個本身來說我覺得也沒有做完,所以我認為更多的關注很重要。
主持人易歡歡:胡總等了很久了,第一個問題是依舊,希望您談談自己的感受。 第二個事情我想咱們一直在研究資料交易所,交 易所這個層面上因為資料是一個非標資產,是仁者見仁智者見智,每個人的理解不一樣,我們構建一個資料資產的話,意味著我要定 價,我要非標變成標準,第三可能要切割、複製, 整個過程您覺得我們怎麼來解決核心的問題,這是第一個。 第二個我想問一下資料 交易所未來大規模發展的話存在的社會需求跟大的外部的應用環境是什麼樣的?
胡才勇:第一個問題就是易歡歡說的,我們經常問的問題,就是資料怎麼定價。 有一天我忽然一想,資料的定價跟石油差不多, 石油下跌俄羅斯有多大的損失,其實可以看到。 我們計畫是採集石油、勘探石油、加工石油、運輸加油來看看石油的虧損,從來沒有 人考慮石油本身的價值,大自然給我們的石油。 我們直接算成本一般是從採集資料的成本,加工資料的成本。 像石油我加工成了柴油 等等不同的產生。 資料裡面的定價有些時候也是這樣,就是看加工成什麼產品,然後資料是我們人產生的,從來沒有向產生資料的人 付過費,而且資料本身不能賣,所以在這地面這也就是我們面臨的問題,資料本身的價值、價格怎麼判斷。 這裡面的話辦法總比困難 要多,這是非常難的事情,我們軟體領域本身就定價很難。 我們2012年就推出了一個地標,軟體成本度量標準,這個是從價值,我把 它判斷為是作為一個價值。 就是開發一個軟體需要的錢和成本,這是價值。 但是價格我們一定是隨行就市,這就意味著所有的交易所 的一大功能就是資訊披露。 這裡的話我們軟交所一定將來會具備和擁有發現價格的功能,定價權不在我們裡邊,但是這個東西到底值 多少錢我們一定要具備,這一定是在海量資料、海量交易的基礎上的。 現在有些價格已經開始形成,比如說哪怕拿最新資料來說,泛 泛談資料交易是非常難的,我安排我們的公司把資料買過來一看,完全對不上路,但是價值依然在,它是基於公共的視角來看,同時 因為它註冊進去有免費送的帳號,有些公眾的企業。 買回來是一百塊錢,以後可能是50塊錢、60塊錢,就是隨行就市的過程中逐漸形 成價格。
我們交易所做的時候一定是一樣的,我一定找最容易交易的,定價大家都比較公開認可的,這些在我的交易平臺先交易起來。 那 些難的,像軟交所現在開始做一個事情,我們在制定使用者的標準,可以讓使用者非常簡單的描述他的資訊。 我們在座談大資料和不懂大 資料的人談大資料,他們是缺乏這種優勢的,因為他們缺乏這種背景。 所以我們軟交所會逐步引導企業,為甲方服務,可以為了讓他 們放心、大膽、方便的採購資料的時候,我們會呼籲,我們會逐漸的引導企業制定相應產品的標準。 哪怕征信系統,哪怕一個企業數 據,它要包括什麼基礎資料,這些都要,逐步逐步的標準化的情況下,它的架構也差不多就可以發現了。 這個基本上是我們的目前的 思維。
主持人易歡歡:時間關係,再留幾個問題給在場的各位來賓,大家有什麼問題舉手,先報一下自己的單位,同時想問誰。
提問:我有一個問題想問宣博士,聽宣博士講做國電信行業和銀行業,也是通過自己的技術能力和技術手段幫忙大的產業或者公 司去做生產,但是現在都在講互聯網用技術手段改造現有的管理流程、管理手段或者運營手段。 我想聽聽宣博士這麼多年的經驗和寶 貴的經歷,有沒有指引我們做軟體行業的做新一代的升級或者思路的改進?
主持人易歡歡:兩個相對來講比較大的問題。
宣博士:第一個是互聯網,軟體本質來說在公司的管理過程中越來越重要了,軟體的革命很早就開始了,從ERP開始的,把所有 的流程變成電腦,軟體方式來管理,而且可以通過很好的方式,通過最佳實踐。 因為我在一個地方做了最佳實踐就可以適用于其他 的企業,這個過程很早就開始。 互聯網現在講很多互聯網思維,也不說了,互聯網本身從商業角度提供了一個非常好的,拓展性很強 的方式。 比如以前進一家企業要每個地方去開店、買貨,通過互聯網可以很快的把整個東西用整個網站的形式,所以互聯網有擴充性 ,這是互聯網很重要的特徵。 沒有互聯網也可以把產品做到極致、專一啊。 我覺得互聯網就是擴充性,大資料本身來說是智慧。 企業 來說如果有更好的方法來管理,尤其在決策層面,或者管理這麼多客戶怎麼樣用自動化方式管理的時候肯定大資料很有效,所以大數 據就是怎麼樣智慧化、自動化。 我剛才講的主要是從存儲和計算來說,現在大資料的發展也是更自動化,把機器智慧又推到一個更高 的程度,就是讓演算法更智慧,這個我認為是大資料的本質。 但是這件事情沒有大資料的時候是不是我們應該也智慧化,這個本來也有 的。 你要說到智慧化很早就有,資料採礦很早也是智慧化的方式,它在上個世紀的50年代信用卡公司就開始用了,就是怎麼通過識別 ,通過資料怎麼定義和度量每個人的風險。 更早的反而是為零售企業做的,為零售企業提供方案,就是怎麼能夠增加收入,怎麼能夠 延遲付款,從這個意義上很早就開始。 現在資料可記錄、可度量,更多的穿戴設備,使資料資源越來越多了,所以可以加工和應用的 領域方面也就更多了。 但最好的開始還是把它變成軟體,有了模式以後可以變成軟體用於所有的管理,這是很大一塊。 作為我們這樣 一家公司肯定也是可以做的事情更多了,而一個企業利用大資料可以優化、管理、決策,這個過程主要還是自發的,也可以是市場環 境,當一個企業本身想做的時候實際上有很多方法。
楊晉:亞信過去專注于運營商,給他們做各種系統和專案。 過去我們亞信是屬於互聯網的建築師,現在提出我們要做專業互聯網 的領航者,我們走出了運營商行業,進入到更多行業裡面,包括像銀行、政府。 像今年我有一個明顯的體會,因為我做大資料的,我 去了很多省市,主要是參與的國家智慧城市的建設,他們也會用到大資料,包括前段時間參與深圳這邊的智慧城市聯盟,我們亞信也 是負責其中的智慧城市大資料的標準的編制, 我們參與了很多其他的行業。 本身原來我們更多是做服務、做專案給運營商。 現在我這 邊負責的Hadoop等等,包裝成很成熟的產品,這些產品不只用在運營商領域,其實在其他領域也都可以有很好的應用。 我們大家都說 互聯網思維,我們這邊也基於互聯網思維成立了產業基地,説明運營商做資料的變現,通過分析運營商的流量資料我們去做使用者的客 戶標籤的分析,取得使用者的精准定位來做互聯網廣告,也是不斷的推陳出新。 現在我們亞信可以說是全面推進,不是像過去一樣專注 于單一行業。
提問:大家好我是中國大資料產業網的記者,我想向王曉蕾主任提一個問題。 在中國針對企業的征信大資料方面央行是怎麼考慮 的? 對企業這些資料又怎麼保證它的準確性和真實性?
王曉蕾:首先我要說明我不代表央行,我只是征信中心,作為一個重要的服務的提供者。 所以我發表的所有意見只代表我本人的 意見。 你剛才提的這個問題,我覺得一定程度上是反映了現在社會上認識上的一種誤區。 首先你要瞭解一個企業,不同的需求者需要 瞭解的企業的情況不同,現在就拿企業征信來說,一方面你需要瞭解對方,需要瞭解對方你需要從各個方面瞭解他的情況,比如剛才 說到對於一個大企業來講如果是他的客戶的話他最相信的資訊是他自己拿到的,他自己通過什麼方式拿到的資訊? 現場去。 比如說劉 總到了一家企業跟董事長一握手,可能憑著他多年的經驗不用談了,就知道可以做還是不做。 就像交朋友一樣,你希望瞭解你男朋友 也好、女朋友也好,你希望瞭解他是什麼人,這種情況下有一張紙可以告訴你所有答案嗎? 更不可能有一個分數或者級別告訴你會是 什麼樣。 所以這個世界是複雜的,沒有人可以保證你哪個資料是準確的,哪個材料是準確的。 因為所有的資料就像我剛才講的,地球 幾億年前就存在了,只是後來採用不同的方法可以抓住某一個時點的特徵以資料表現出來,你說這個資料准還是不准? 對於瞭解一個 企業來說,事實重于評價。 今天好幾位專家談到評級、評分等等,比如說你們單位新來一個同事你問他怎麼樣,有人告訴你不行,你 怎麼覺得不行? 這個不行就是一個評價,就是一個級別。 你馬上會問你怎麼覺得他不行? 所以你要的是一個事實。 所以這個社會不缺 評價,每個人都會根據自己的經驗有評價,缺的是什麼? 缺的是事實。 為什麼說從銀行拿來的信貸資訊保證準確呢? 因為他是達成交 易的一方,簽了合同,這是已經發生的事實。 所以在事實是否準確的時候,關於一個企業也好,個人也好,有很多很多的事實。 有些 事實是實際上已經發生的,比如法院給他的判決,政府部門給他的出發這都是發生的,對企業來說最重要的是什麼? 財務目標,那你 能保證報表的準確性嗎? 不可能,財務報表誰能保證它盡可能的準確呢? 這個企業的董事長簽字。 所以說從哪可以保證一個企業的信 息的準確性或者人的資訊的準確性可以告訴你沒有。 對各個放貸機構來說就是練的這個本事,有什麼方法可以最貼近事實的瞭解這個 人。
所以以前老說P2P,信貸做不好是征信體系不發達,可以這樣抱怨。 但是P2P不練就自己對某個市場區隔的獨特的能力的話,只能 是錯失市場良機。 所以永遠不到期待哪一個部門或者機構可以給你百分之百的確保它準確性的這麼一個報告。 因為既使是鏡子裡面的 你也有看走眼的時候。
主持人易歡歡:回答的非常精采,還有人有問題嗎? 時間也差不多了,再次以熱烈掌聲感謝6位嘉賓的精采分享,謝謝大家。 我 們整個下午的活動到此結束,感謝各位來賓!
(責任編輯:mengyishan)