資訊戰打的就是資訊流的戰爭。 從整個資訊流的轉換來看,誰控制了最真實的資訊流,誰就控制了這場戰爭的主導權。 奪取制資訊權已經成為奪取制空權、制海權的先決條件,是未來戰爭勝敗的決定性因素。
隨著資訊化不斷發展,人類社會已經進入了一個不折不扣的「大資料時代」。 每天,遍佈世界各個角落的感應器、行動裝置、社交網路和線上交易平臺生成上百萬百萬位元組的資料。 美國奧巴馬政府甚至將大資料稱為「未來的新石油」,誰掌控了資料流程誰就將主宰未來世界。 眾所周知,軍事領域一直都是人類最先進科技的實驗室,大資料無疑將給未來戰爭形態帶來巨大的改變。
大資料「大」在哪兒
麥肯錫全球研究所對大資料的定義是:一種規模大到在獲取、存儲、管理、分析方面大大超出了傳統資料庫軟體工具能力範圍的資料集合(datasets)。
中科院電腦所研究員王偉平告訴《中國科學報》記者,大資料的「大」,理所當然,首先指的是資料體量空前巨大,遠遠超出傳統電腦處理資料量的級別。
當前伴隨著電腦網路技術的迅速發展和互聯網的高速普及,資訊資料量已由TB(1TB=1024GB)級升至PB(1PB=1024TB)、 EB(1EB=1024PB)、ZB(1ZB=1024EB)級,並仍在呈爆炸式地增長。 據悉,全球在2010 年正式進入ZB 時代,2012 年全球資料量達到5.2ZB,預計到2020年,全球將總共擁有35ZB 的資料量。 有一個形象的比喻可以説明人們理解這些資料的規模。 如果把35ZB 的資料全部燒錄到容量為9GB 的光碟上,其疊加的高度將達到233 萬公里,相當於在地球與月球之間往返三次。
其次,王偉平表示,「大」也體現在處理的資料類型多樣化,遠遠超出傳統資料格式和分析工具能處理的範疇。
以往資料大都以二維結構呈現,但隨著互聯網、多媒體等技術的快速發展和普及,視頻、音訊、圖片、郵件、HTML、RFID、GPS 和感應器等產生的非結構化資料,每年都以 60%的速度增長。 預計,非結構化資料將占資料總量的80%以上。
此外,他認為大資料還要求資料處理的即時性。 大資料的資料流程往往為高速即時資料流,而且往往需要快速、持續的即時處理,能在第一時間抓住重要事件發生的資訊。
如果從軍事領域看,指揮控制系統、天基支援系統、資訊處理系統,各種偵察、監視、探測系統的資訊量越來越大,大資料在指揮機構中的管理也變得空前重要和複雜。 如何對海量戰場資料進行存儲與深度分析,如何判別資料的真實性,資料來源的可靠性,確保資料傳輸的安全性,是未來戰爭雙方面臨的問題。
資訊化戰爭對大資料的要求
軍事理論界普遍認為,早在上個世紀90年代,資訊化戰爭開始崛起。 它是一種通過使用資訊化戰爭武器影響敵方資訊與資訊系統,保護己方資訊與資訊系統,從而取得戰場資訊優勢的作戰樣式。 它本質上是通過資訊作戰手段,以「資訊流」控制「能量流」和「物質流」,剝奪敵方的資訊優勢、保持己方的資訊優勢,從而奪取戰場制資訊權。
軍事評論員宋忠平向《中國科學報》記者解釋,傳統的資訊戰包括了網路攻防戰,常規作戰中的干擾與反干擾,還有刑偵系統下的偵測與反偵測等內容。 「資訊戰打的就是資訊流的戰爭。 從整個資訊流的轉換來看,誰控制了最真實的資訊流,誰就控制了這場戰爭的主導權。 」宋忠平說,「奪取制資訊權已經成為奪取制空權、制海權的先決條件,是未來戰爭勝敗的決定性因素。 」
但他也表示,傳統資訊戰在處理資訊以及資料方面遭遇到了各種挑戰。 首先是傳統資訊通道有限,無法一次獲取大量資訊。 同時,不僅僅是資料量大幅增加,資料形式包括了戰場感知資料、影像、視頻情報等各種類型,僅僅依靠現有資訊技術,不能及時高效地分析和處理這些資料。
據報導,伊拉克戰爭爆發當日,美軍駐卡塔爾和科威特前進指揮所由於無法處理保障機構提供的海量資料,不得不關閉設備,從而造成指揮所與部分突擊方向的通信聯繫幾乎中斷。
此外,宋忠平指出,傳統資訊系統的資料分享能力比較弱。 「傳統戰爭是一種離線狀態下的作戰方式,上級給下級分配任務,並在離線狀態下執行,最後向上級彙報一個戰果。 而且命令一般只能管一個軍一個師,因為他們往往是作為一個獨立的作戰單位。 這也導致了相關部門往往各自為營,影響協同作戰的效率。 」
在這樣的背景下,資訊化戰爭對大資料傳輸、存儲、分析產生了特殊的要求。
首先是資料處理的即時性要求。 資訊化戰爭中產生的海量資料最終要彙集到各級指揮中心和處理中心,這些資料來源源不斷地從各種感應器、情報機構以及資訊中心傳輸彙聚到一起,要對這些資料進行即時處理。 宋忠平認為,戰場所有資訊哪怕是一個單兵的資訊都需要通過大資料傳到指揮控制中心,以瞭解前線情況,特殊狀況下甚至可以對某個單兵的裝備下達命令。 因為,他可能正處在最有利的地形,可以獲取最大的優勢。
其次是資料融合。 宋忠平提出,通過使資料鏈的連路拉短,以前需要四至五級的管理才能下達命令,未來可能只需要三級管理完成,這樣才能有助於一體化作戰,而不是各個軍兵種單獨作戰,隨時隨地調整作戰指揮。
此外,在他看來,大資料時代,資訊防禦難度尤其加大,對於資料安全要求更高。 一般而言,資訊化戰爭對資料傳輸的資訊安全要求主要體現在解決防竊聽、抗干擾和防止虛假資訊欺騙的問題上。 未來恐怕需要一套新的防禦機制,以確保資訊安全。
由此可見,在大資料時代的資訊化戰爭中,各國軍事體系的對抗將在更大程度上依靠各種軍事資訊系統、軟體和資料,在正確的時間、正確的地點為正確的決策、指揮和控制提供正確的資訊。 而使資訊實現快速合理分發的前提,是要有對資料的統一調度和管理,讓最即時的戰場資訊傳遞到最迫切需要的部門。 隨著戰場資料量的增大,高效存儲與分析海量資料,從資料中發掘敵我態勢的變化,預測出最合理的作戰方案,使海量資料更好地為資訊化戰爭服務是軍事大資料處理的目標。
軍事資料採礦面臨挑戰
不過,王偉平指出,大資料時代面臨的一大挑戰是資訊的價值密度低。 無論是分析人員還是智慧系統都需要「大海撈針」,從海量資料中找到有用資訊。 「這也充分體現了資料採礦的重要性。 」他強調。
資料採礦是一個在海量資料中利用各種分析工具發現模型與資料間關係的過程,它可以説明決策者尋找資料間潛在的某種關聯,通過發現被隱藏的、被忽略的因素,就能夠在資料存儲和管理過程中,挖掘出重要的情報資訊,作為決策和行動的依據。
據宋忠平透露,在「9·11」事件發生前,情報研判人員是掌握了大量資料的,但卻忽視了其中有價值的情報。
因此,在「9·11」事件之後,美國國防部高級專案研究在次年的技術年會上,闡述了如何在統一集成的資料庫中應用資料採礦技術。
所謂新的資料資源就是「交易空間」。 如果恐怖分子要計畫、執行一次恐怖活動,他們必定會在資訊空間留下某種「資料腳印」。 也就是說,他們需要 「交易」。 這種交易的資料記錄,可以是通訊、財務、教育、醫療,也可以是旅行、交通、出入境、房屋等等其他一切資料記錄。 美國正是在「交易」空間中應用資料採礦技術,從而發現和追蹤恐怖分子的。
據瞭解,2002年,阿富汗境內的大毒梟準備為基地組織等恐怖分子提供資金時,美軍的情報分析人員正是通過資料採礦,把作戰方案庫裡的資料與有關基地組織情況庫裡的資金資料進行即時、自主關聯,從而指導美軍先敵一步採取行動。
那麼,如何從技術上提升資料採礦的能力。 王偉平告訴《中國科學報》記者,在入口處對資料品質進行把控是非常關鍵的。 也就是說,資料準備是資料採礦的重要前提,因為它直接影響到資料採礦的效率和精准度。 「如果品質參差不齊的資料統統進入通道,便很難再對品質不高的資料進行處理,他們將對有用資訊造成嚴重的干擾。 」
簡言之,在資料準備階段,需要對資料進行清洗,其次,選出需要分析的資料,縮小處理範圍。 而在資料預處理階段,包括了消除重復資料、消除雜訊、遺漏資料處理、資料類型轉換等,目的是把資料處理成適合於資料採礦的形式,並在資料選擇的基礎上對挖掘資料作進一步的約簡減少記憶體資源和處理時間,使挖掘更有效。
12下一頁