오늘부터 이후, 또 다른 월드컵 대회 공식적으로 개막, 세계의 팬 들과 비 팬 들 또한이 불타는 열정, 혈액 급증 좋은 시간을 즐길 것 이다. 선명 하 고 맥주를 가득, 빛나는 화면 준비, 그리고 모든 사람의 국가 대 한 사랑 이며 아마도 어떤 비현실적인 기대 피치를 보고 있다. 현재 월드컵 통계 뜨거운, 브라질 세계, 경제 효과 높은 30.http://www.aliyun.com/zixun/aggregation/19145.html 3.7 백만 사람들의 총에 알리다 것으로 예상 된다 " > 3 십억; 파르니 스타 카드와 같은 주변 제품 전문, 견적 스티커에서 수익 높은 영국 회사는 월드컵 기간 동안 총 매출액에서 84 백만 파운드에 도달 기대 하면서 혼자 브라질에 £ 89.1 백만으로 있을 것입니다.
하지만 몇 가지 중요 한 주제, 통계 결과 및 번호 것 부족, 즉-수이 월드컵의 마지막 우승자. 우리가 알아낼 수 얼마나 많은 팬 들 직접에서 브라질으로 갈 것입니다, 밖으로 얼마나 많은 영국인 TV, 그리고 얼마나 많은 열렬 한 팬 스타 카드를 수집 앞 좋은 피자를 씹는 것입니다 하지만 우리가 누가 우승 것입니다 예측 하는 데이터를 사용할 수 있습니다? 바이어스를 방지 하려면 데이터 기반 모델 월드컵 타이틀을 예측할 수 있습니다 성공적으로 골드만 삭스 등 지지자의 회사 결정을 느끼면서 회의론 관점에서 배우게 됩니다.
회의론 자: 아니, 그것은 불가능합니다.
사람들에 대 한 왼쪽된 플레이어
즉, 축구 도전 스포츠 이며 정확 하 게 결과 예측 하는 분석 방법 사용 하기 어렵습니다. 이코노미 스 트는 지난해 보고, 축구에 "구를 이론"를 적용할 쉽지 않다. 야구에 더 측정 개별 이벤트에 비해, 축구 운동장에서 22 플레이어 이동 하 고 끝 없는 방법으로 서로 결합 해야 합니다. 축구는 어떤 요소가 고려 되어야 하 고 끊임없이 결과를 얻이 필요 판단에 도전 하 게 자연 동적 특성이 있습니다.
어려움, 하지만 이것의 고차에도 불구 하 고 우리는 최근 보고 농구, 같은 동적 요소에 현재 카메라 시스템은 복잡 한 데이터를 균열, 농구 팀의 코치에 게 할 수 있다 플레이어의 필드는 정확도에 피치에도 계절 마다 각 게임 매초; 불가능 하지 않습니다. 분석의 유사한 방법 축구;의 분야에서 할 수 있습니다. Opta Prozone 등 회사는 놀이터 포함 게임, 그들은 통과 하는 방법 및 득점의 기회는 플레이어의 위치에 표시기의 범위를 추적 하기 시작 했습니다. 일반적으로, 게임 당 약 2000 데이터 이벤트가 있습니다.
하지만 데이터의 상대적인 가치를 볼 수 있다. 팀 관리자 성공 사례를가지고 그들은 플레이어 선택에 대 한 원시 데이터에 의존 때 상황을 실패 하 고. 먼저 성공 사례 보고: 아 스 날 관리자 아르센 벵 거 감독은 게임에서 사람들의 우수한 성능을 발견 했다 그와 함께 비에이라를 교체 하기로 결정 했다. 하지만 실패는 동일: 퍼거슨 훔치는의 스탐의 현재 번호는 좋은 그것 전에, 그리고 그것을 제거 하기로 결정. 그러나, 나중에 데이터를 보여 자신의 가치를 증명 하기 위해 뛰어난 성능 가진 이탈리아에 스탐.
문제의 핵심은 반면 어떤 선수는 빠른 실행 또는 실행 긴, 하 고 누가 가장, 훔치는 좋은 축구는 여러 값의 단순 합계 데이터 설명할 수 있습니다. 데이터는 과거를 반영 하 고 선수의 미래 성과 현재 포괄적인 표시기의 결과 계속 됩니다 증명 하지 않습니다.
과학자: 그래, 우리 할 수 있다.
월드컵의 결과 예측, 골드만 삭스 선수 관련 특성의 까다로운 분석을 현명 하 게 피할 하 고 대신 보다 일반적인 접근을 채택 했다. 그들은 월드컵에 각 국가 대표팀의 성능 및 ELO (즉, 경쟁의 수준)의 그들의 현재 순위 고 예측된 모델을 했다. 그들은 그들의 방법을 다음과 같이 설명 했다:
각 이벤트의 결과 완벽 한 회귀 분석에 기초 하 고 1960 년부터 모든 공식 국제 대회에 대 한 참조 정보로 사용 됩니다-즉, 아군을 포함 하지. 이 우리 약 14000 예측된 지표 사용 모델 계산 계수 평가를 제공 합니다. 회귀 분석에서 변수 주간 게임에서 각 참가자에 대 한 목표의 수 있습니다. 축구 경기의 모델링에 문학을 바탕으로, 특정 상대에 대 한 일치 하는 특정 팀 목표 수 푸아송 분포 (는 일반적인 이산 확률 분포)를 다음과 같이 가정 합니다.
그들의 모델 브라질이 우승 비율에 대 한 astonishing--48.5%를 찾습니다. 그들은 브라질을 3: 1로 아르헨티나를 이길 기대는 결승전에서 아르헨티나에 14.1%와 비교. 브라질 팀 같은 높은 평가, 다양 한 우수한 ELO 시스템 순위, 올해 다른 행사 및 호스트의 장점은 월드컵의 강한 실제 성능 등의 요소를 얻을 수 있다-1930 년부터 모든 월드컵 대회에서 호스트 국가 팀 30% 헤라클레스 컵을이 겼 다. 모델, 브라질 우승의 집 앞이 올해의 65% 기회가 있다; 유럽의 상위 팀의 일은 보다 좋은 고 역사 보여줍니다 그들은 아메리카 대륙에서 월드컵을 우승한 적이 있다.
그러나, 모델 과거 참조 지표에 전적으로 의존 하 고 명확 하 게 미래의 불확실성을 반영 하기 위해 실패 합니다. 골드만 삭스는 이전 성능에 따라 2012 런던 올림픽에서 영국의 성능에 대 한 예측을 비슷한 분석 모델을 사용. 그들은 실제로 영국 결국 65 메달 총 29 골드 메달을 수상 하는 동안 30 금메달 65 메달의 총 승리 영국 기대 합니다.
스티븐 호킹, 골드만 삭스의 예측 분석의 다른, 서로 다른 방법으로 생각 영국에 가장 큰 올해, 많은 데이터를 고려. 골드만 삭스의 컴퓨팅 모델에서 영국의 성능이 올해 실망 또는 그룹 일치에 대 한 자격을 불가능 되며 영국 사기 낮은 않도록 호킹의 결론을 믿고 가장 좋은 것 같다. 추가 제안, 호킹 영국 최고의 걸릴 4-3-3 모양과 그 게임의 시간 수에 있어야 주위 3 시 오후 그리니치 평균시에서 가능한 많은 대머리 또는 금발 선수와 함께 (때문에 그런 선수 높은 득점 기회)는 주장 한다. 또한, 그는 프리 킥 또는 페널티 킥을 했다 선수 3 단계 실행 하 고 사이드 킥 (어느 것이 10%에서 득점의 기회를 증가)와 왼쪽 상단 또는 오른쪽 상단의 (지역 84% 득점) 목표에 공을 넣어 하려고 플레이 제안 했다. 그러나, 호킹이 이미 데이터는 승인 한다 축구 게임 모든 지침을 줄 수 있습니다. 모든 후, 잉글랜드의 성능을 실제 자유 투에 아주 나쁜 되었습니다.
너무 많이 말을, 큰 데이터 수 우리는 월드컵의 결과 예측? 답변을 얻을 수 있는 유일한 방법은 다음 일련의 이벤트에 대 한 감시 하 여 만약 브라질 상단에 그것을 만들 수 있는지입니다. 물론, 그것의 적-잡기-치킨 형벌 총격전에 돌파구를 만들기 위해 영국 팀의 능력에 대 한 관심 또한 지불할 수도 있습니다.