標籤:style blog http color os io strong 資料
本文首發自懂球帝
世界盃之前,在ITPUB上翻到一篇主題討論,關於『大資料、預測』,嗯,近兩年你在互連網上幾乎躲不開這幾個字眼。媒體的威力不可小視,當這種95%以上業內人士都說不清道不明的概念也能在街邊賣菜大嬸的嘴裡蹦出來的時候,你就知道,他和『小蘋果』『歐巴江南style』無異了。
回想起來,資料倉儲的概念也不過才誕生在90年代初期由Bill Inmon(資料倉儲之父)提出。在足球領域用資料來作為決策支撐的理念很可能在2000年之後,大批量的資料擷取,包括醫學、訓練場上的表現、熱成像攝影收集球員跑動資料(裡皮團隊)、包括商業資料OPTA這樣的資料運用也不過是近幾年才開始普及。 比如,看起來很絢麗的世界盃開賽前32支隊伍的奪冠預測圖滑鼠放在圖中某個節點、國家名稱、地圖地區上,左圖中即會顯示該國家隊在世界盃各輪比賽中獲勝的幾率。
示範地址 ,甚至作者把實現方式都開源了。 本質上,這種預測是基於FIFA曆來的官方比賽比分統計、排名資料彙集而成。看到這裡可能會有觀眾跳出來,嗤之以鼻:『足球是圓的!Everything can be happen!』
『Impossible is nothing!』
是的,足球確實是圓的,不可預知性是它最大的魅力,場面瞬息萬變,任意一個細節都會影響全盤戰局,這些都沒錯。但這在理科生的世界觀裡,可以將其抽象理解為『全盤戰局分解為若干個參數,
可統計與不可統計,
可預測與不可預測等等』,依照系統分析的角度來看,任意複雜的系統皆可按模組、功能分解至最後成為一個個小且簡單的『塊』。再來便是不同的排列組合拆解出來的『塊』,經過加工,將其關係化與資料化。 這裡有點繞,我們舉個栗子:(比如:阿根廷小組賽對陣伊朗,補時階段91"梅西的絕殺) 這張圖由以下資料構成:
第1、2列,為時間,90分29秒,
start_x,start_y為起腳射門的球場座標,
goal_y,goal_z為對應球門的座標最後三列分別為:左腳、個人能力的進球、力度強勁 這些統計資料的粒度非常翔實,倘若我說這種大資料能夠左右比賽,你們肯定會說我吹牛逼整噱頭。。。嗯,確實是的。
換種提問方式,那麼數字化、資料、軟體等給在足球領域能夠帶來足夠多的顛覆嗎?巨大顛覆性質的改變倒不敢說,但它實實在在衝擊了很多傳統足球領域的工作模式。它們具體能提供些什嗎?改變了什嗎?我們佔座留個坑,接著往下看。 一、電視機前的觀眾你們好,這裡是懂球帝TV你沒看錯,我們打算聊聊電視!嗨,懂球帝er們,別走~ 兄台留步,愛過~ 提到數字化、資料、軟體給足球屆帶來的顛覆,我第一反應…… 是
電視轉播(包括衛星訊號) 千萬別小瞧電視轉播,聽說過視頻球探嗎?(有種鍵盤俠的即視感)沒錯,他們就是坐在電視機前,閱讀大量比賽,發掘有潛力的球員並提交報告給首席球探分析,進行潛力判定,如為可塑之才就緊接著進入實地考察階段,直至最後操作轉會,一線/二線隊/預備隊進行職業比賽培養,最後出售。你沒聽錯,這很像在玩足球經理遊戲『FM』,事實上烏迪內斯實驗室便是為此成立的,他們挖掘了前南斯拉夫人——漢達諾維奇(斯洛文尼亞甲級聯賽的多姆紮萊隊),以4萬歐元的價格買入,8年後出售給國際米蘭,獲得了1200萬歐元的收入。
這一切歸功於烏迪內斯實驗室的創始人保羅·馬里諾,他1995年任職足球總監,擴大了球探的覆蓋面積,不止是早先傳統的口口相傳名聲在外的球員資源,還包括固定各大洲電視台的轉播,100多個海外衛星訊號,還有世界各地收集的比賽錄影,烏迪內斯實驗室負責值班監控,專人進行篩選,錄影編輯,提交報告。
圖表摘自於macca的雄文《從管理架構和決策方式解讀利物浦轉會操作》,有興趣可以前往圍觀。
可以看到,烏迪內斯這3年的轉會收入讓人垂涎欲滴,這也讓南美等球探網路不發達地區的球員們更加努力投入到比賽當中,因為他們的激情、活力會讓電視另外一端的球探們兩眼放光。
沒錯,電視、衛星訊號等數字化媒體是一種巨大的顛覆。
『老濕,這段看起來好像不是很強的樣子,你還可以更厲害一點嗎?』
二、手抄資料?!
『資料告訴我們如何防守,如何快速反擊』——拉法·貝尼特斯
前利物浦主帥,現任那不勒斯教頭的貝尼特斯被尊稱為戰術大師,也被戲稱『大濕』;因為當你在電視機前看到他的時候他幾乎都是在拿著戰術筆記本寫寫畫畫著些什麼,開口所及的話題幾乎都是資料、分析、戰術,針對對手布置有效打擊。
還有,他的膝上型電腦,這即便是莫拉蒂,也不敢亂碰,因為大師真的會發怒的。上面有他收集的各式各樣的資料,甚至,貝尼特斯還主導了一款戰術板類的應用開發,沒記錯的話這款應用程式名稱叫Golball Coach,順帶八卦一下,穆裡尼奧也整了一款同類型的軟體,叫做
mourinho tactical board 『穆裡尼奧的戰術板
』,早期的時候甚至高調的稱作mourinho special board 可能太高調了影響銷量吧,後來便把Special改掉了,兩款都是公開發行的應用,似乎穆帥的軟體價格要更貴一點,40~50歐元,貝帥的則是5歐元左右。切爾西助教法利亞在球員們上場前會在場邊拿著iPad比劃一番,估計就是用這個軟體部署的戰術跑位、對手的布局、戰術變化點、以及軟肋等等。
『課間作業,猜猜這是什麼紙條?』 我們回到標題,手抄資料是什麼時候開始的?我們回憶下,大夥津津樂道的2006年世界盃小紙條的故事:1/4決賽德國與阿根廷隊的120分鐘廝殺得難分難解,以至於進入十二碼決勝負的生死關頭。在十二碼大戰開始前,以嚴謹聞名天下的日耳曼民族這時體現了他們的民族素養,德國隊教練組悄悄給門將萊曼遞來一張小紙條,在那之後萊曼像信了春哥一樣每輪十二碼都判斷出正確方向,同時成功撲出了兩粒十二碼協助德國隊晉級四強。賽後德國隊教練組和萊曼也揭秘說,紙條上寫的正是阿根廷隊每個十二碼手的罰球特點及方向,而萊曼也正是憑藉這這張可歌可泣的紙條成功的將德國戰車送進四強。
近倆賽季常看英超的球迷們肯定能發現,右側的資訊圖在十二碼的時候出現:傑拉德過往5次罰十二碼的分布圖 如果樣本足夠大,假設有傑拉德職業生涯裡所有十二碼的資料分析,那確實是能夠分析出:1、十二碼手射上下左右的方向趨勢,更喜歡上角還是下角。『撲救方向的選擇』2、發力習慣,爆射或是穩妥的推射。『步點節奏』3、是否會用踩步點的節奏停頓騙門將先移動重心(如:巴洛特利)。『可以反騙』4、射失率,射失十二碼的分布圖。『關鍵球的選擇上,罰球手的本能出世他更傾向於選擇穩妥的路線』5、以上的習慣,分布在比賽的各個時間段,是否會有不同?『如上半時,下班時,補時,加時賽,十二碼決戰』6、支撐腳的腳趾頭方向是否是慣騙?『正常情況下,射門方向與支撐腳的腳趾頭所指方向相同,:D 不信的童鞋可以去球場試試』 這樣的資料樣本具備客觀分析價值,內容翔實,球隊的分析師們在十二碼大戰前就可以透過資料分析,整理出一份簡明扼要的並且對門將有所協助的『小紙條』了。 當然了,在2004~05年期間貝尼特斯便已經僱人在做這樣的事情了,伊斯坦布爾之夜十二碼大戰便可體現(貝帥的自傳裡提到),或許在這之前早已有人這麼幹了,但具體時間以及資料所涵蓋範圍等細節便不得而知了,如果你知道更多關於十二碼的小故事,歡迎回帖爆料。
三、球迷們的狂歡,李菊福們的盛宴李菊福:有『理』有『據』,讓人信『服』…… OPTA很有可能是最早進行大規模資料擷取的供應商了,即便是這樣,那也不過是從1996年開始的,而且,開始的時候只是靠幾名朋友在倫敦酒吧裡看著電視手工填入比賽的基礎資料而已。 最開始的統計粒度估計很粗糙,詳細的資料擷取是近10年來才開始見到的,到底是球迷們先開始關注翔實的資料呢?還是資料公司先提供出來的?這是個先有雞or蛋的問題。無論如何,這總歸是好事,不止是球隊分析師、教練們會主動去購買這些資料,連媒體站們也會買回來提供給球迷觀眾們討論分析侃大山,給足球記者、寫手們做為分析的支撐依據,記者&寫手們撰稿所彙集而成的專欄反哺媒體網站,透過這種良性迴圈,媒體站們博得較高的曝光率及使用者後,再通過廣告擷取收入。 比較有名的媒體站如Whoscored、squawka、fourfourtwo stats zone、國內的有搜達、懂球帝等等,他們的資料來源幾乎都來自於OPTA,用IT術語來說,只是前端展現的方式不同,大家的側重點不同,扯得有點遠了,對此不再做展開。 我們來看看,現有的媒體站給我們球迷們提供了什麼。 比如,在英超賽季後段,利物浦與曼城的比賽當中我們能透過知道,26~46分鐘內,曼城球員的平均站位元影像(一般來說,名字越大說明各項比賽資料表現好,如:搶斷攔截更多,傳球更多,對抗更多,射門更多,存在感更多)幾乎一眼就看出,曼城的火力集中在右路,而在比賽的場面上確實反映了納瓦斯、席爾瓦的右路頻頻殺至底線。 納瓦斯的傳球路線,紅色為MISS,橙色的為KEY PASS,為傳球,為傳中。納瓦斯從右路頻頻插入禁區,共傳出三次關鍵傳球,而且傳中都在禁區肋部,相當危險。 我們再來看看費爾南蒂尼奧的表現: 費爾南蒂尼奧上半場的傳球(左),與下半場(右)對比,下半場竟然沒有任何一腳傳丟100%的傳球成功率,這中場休息室裡發生了什麼讓巴西人如此繃緊神經。可以推測曼城主教練佩萊格裡尼在中場休息時嚴肅指出巴西人的問題,強調他的紀律,下半時必須把前場的球權交給席爾瓦,自身做好傳遞齒輪的工作。 再來對比席爾瓦的上下半場傳球對比圖,西班牙的前腰確實離禁區更近了,而且經常換位,下半場時他幾乎是MVP級的表現,每個進球甚至每次極具威脅的進攻都由他發起。這說明什嗎?佩萊格裡尼看出球隊的問題,換下上半場發揮還算出色的納瓦斯, 換上防守時攻擊力更強的米爾納,他防守時擅長身體對抗/不惜體力的奔跑持續給予右路壓力,還記得上面提到的強調費爾南蒂尼奧的紀律嗎?讓巴西人更穩妥的處理球,解放席爾瓦,讓西班牙大腦輻射禁區前沿,這在下半場起到了絕好的效果。 我們轉頭看另外一邊,紅軍教頭羅傑斯在賽季後半段喜歡首發中後衛薩科不是沒有原因的,對陣曼城一役的上半時裡他的傳球成功率是100%,小心翼翼的出球,穩妥給到隊友腳下,後防線穩固且不易被挑戰,在心理對抗上,失誤較少的後衛會讓對手的前場逼迫陷入消極。 我們再換一場比賽來看: 利物浦對陣西漢姆一役,上下半場判若兩人的斯特林,上半時只有1次過人成功,寥寥無幾的9次傳球6次成功,向前的傳遞全部失敗了。牙買加小將面對鐵鎚幫擺出的大巴似乎也沒太多辦法,但
反觀
下半時,1次搶斷,
34次傳球31次成功,幾乎全部到位,還有將
3次關鍵傳球送入禁區,兩次射門均命中目標,似乎變了個戲法換了個人似的。其實這得益於羅傑斯中場休息時的換人,並非說盧卡斯替換掉庫蒂尼奧後有多麼出色的表現,這屬於戰術上的改變,巴西後腰中規中矩的攔截與傳接球,讓出了衝刺的空間,斯特林回撤改變角色為前場自由AMC後便如魚得水了。 說到這裡,這節課也差不多要結束了,不知道大家對足球領域的資料是否有了更多的理解,看球聊球的時候有更多可探討的空間了嗎?透過資料輔佐驗證你的想法,針對比賽一探究竟,如果你們喜歡的話,圍繞著世界盃,或許還有下一堂課哦。