近年來,「大資料」風靡一時,各行各業都在探討「大資料」思維與技術在本行業的應用。 高速公路是否可以應用「大資料」解決相關問題呢?
近期,由中國公路學會主辦的第十六屆中國高速公路資訊化研討會暨技術產品展示會在山東青島召開,不少代表對大資料在交通運輸行業的應用提出了自己的精彩見解。
公路海量資料潛在價值巨大
據瞭解,學界將大資料特點歸納為4個「V」,即Volume(大量)、Velocity(高速)、Variety(多樣)、Value(價值)。 事實上,以前並非沒有資料採礦,而「大資料」理論則與傳統的資料採礦存在差異。
西安公路研究院姬建崗介紹說,傳統資料採礦採用的數學方法通常是找到一些引數與因變數的關係,形成一個因變數與一系列引數的因果關係,建立一個方程式,繼而進行結果的計算。 而「大資料」恰恰是對上述結果的逆向求解,即通過大量資料找到關聯,再去尋找其中蘊含的關係式。 大資料是「知其然而不必知其所以然」,外行通過大資料分析可以打敗內行。
長安大學教授許宏科則介紹說,當資料取得時,可能是雜亂無章、看不出規律,但運用作圖、造表、各種形式的方程擬合、計算某些特徵量等手段便可找出資料的規律性。
資料採礦可甄別逃費車輛
山東省交通運輸廳高速公路收費結算中心徐清峻介紹了如何應用資料採礦實現收費稽查的目的。 據瞭解,山東省專門建設了一套稽查平臺。 該平臺根據設定的演算法,定期對全省聯網收費資料集中進行逐條甄別,對於符合逃費特徵的車輛進行標識和匯總,繼而自動提醒相關部門和各收費站。
「演算法很關鍵。 」徐清峻分析說,看似正常的一條條車道業務流水,哪些車輛具有逃費嫌疑呢? 單條流水自然無法判定,需要結合多條車道,但山東省高速公路每個月產生約五千萬條的收費資料,海量的收費流水資料讓人暈頭轉向。
為此,他們首先分析各種能夠成功偷逃通行費的行為特徵,繼而構建能甄別這些資料的唯一演算法,這樣就能通過系統找出嫌疑車輛。 當然最終確認仍需要通過現場驗證。
「大資料」離不開「雲計算」
近年來,與「大資料」一道,「雲計算」也成為流行的熱門詞彙。
據瞭解,「雲計算」是將計算任務分佈在大量電腦構成的資源池上,使各種應用系統能夠根據需要獲取計算力、存儲空間和資訊服務。 在許宏科看來,「大資料」的應用需要「雲計算」助力。
許宏科分析說,圍繞大資料,一批新興的資料採礦、資料存儲、資料處理與分析技術將不斷湧現,因此處理海量資料更加容易、更加便宜和迅速。 大資料的處理技術正在改變目前的電腦運行模式,大資料的存儲和管理要求,使得雲資料庫的建立成為必要條件。
據介紹,2014年交通運輸部開展的交通運輸科技計畫專案中的資訊化技術研究計畫,將基於雲計算的交通運輸資料交換與處理關鍵技術、綜合交通運行監測與資訊服務關鍵技術作為一個重要方向。