85 회 아카데미 시상식 2 월 24 일 현지 시간 미국, 가정 지출 결국 것입니다 오스카 김에서에서 개최 됩니다? 데이비드 로스 차일 드 마이크로소프트 리서치의 최근 오스카 결승에서 데이터를 분석 하 여 오스카의 궁극적인 소유권을 예측 했다.
데이비드 로스 차일 드의 블로그에 그의 최신 예측을 볼 수 있습니다. 데이비드 로스 차일 드-Excel 응용 프로그램을 개발 하기 위해 Microsoft 팀과 함께 일을 예측 노력의 일환으로, 오스카 상을 오스카의 모든 24 카테고리에 대 한 실시간 예측을 제공 하는 예측 (오스카 예측), 투표 용지.
데이비드 로스 차일 드가 제공 하는 승리 확률 정보 중 일부:
최고의 영화상: "탈출에서 테헤란" (아 르고), 93.9%를 우승의 가능성.
최고의 감독 상: 스티븐 스필버그 (Steven Spielberg) (영화 "링컨"), 83.7%를 우승의 가능성.
최고의 배우 상: 다니엘 하루-루이스 (다니엘 일 루이스) (영화 "링컨"), 99%를 우승의 가능성.
최고의 배우 상: 제니퍼 로렌스 (제니퍼 로렌스) ("행복 라인 뒤에 있는 구름") (실버 라이닝 각 본), 70.7%를 승리.
물론, 이러한 수치만 예비 예측, 데이비드 로스 차일 드 말했다: "나는 올해의 수상의 일부에 대 한 예측의 확신 하지만 예측은 100%, 아카데미 시상식에서 최종 결과 기대." "
최고의 감독과 최고의 남성 "링컨"의 확률 각각 83.7%와 99% 이다.
제니퍼 로렌스 "행복 선 구름 뒤 에"에 의해 영화 여왕 승리의 확률은 70.7%
지난 1 년, 데이비드 로스 차일 드 올바르게 예측 정확도 98% 이상의 미국 50 개 주와 컬럼비아, 지구의 50 51 자치 읍 면의 대통령 선거 결과 예측을 범용 데이터 기반 모델을 사용.
데이비드 로스 차일 드 말했다: "나는 오스카 수상에 빛나는 접근은 정확 하 게 예측 하는 정치를 포함 한 다른 것 들과 같은 예측." 가장 효과적인 데이터에 초점을 먼저 만들고 다음 통계 모델을 어떤 특정 년의 결과 의해 방해를 받지 않습니다 모든 모델 테스트 및 보정에 따라 기록 데이터, 그리고 우리가 환자 모델 외부 샘플 뿐 아니라 과거의 결과의 결과 정확 하 게 예측 한다는 되도록 모델링. 우리가 만드는 모델 아니라 과거 예측을 미래를 예측 하는 데 사용 됩니다. "과학은 동일 합니다, 하지만 데이터는 가장 유용한 증명 하는 것은 매우 다른," 라고 말합니다. "
한 정복 수 표. 127 백만 거의 예측할 수 없는, 또한 쉽게 미만 6000 표, 오스카 투표 같은 덜 복잡 한 예측의 경우에 이길 수 있다 대통령 선거 예측된 모델 생각 하지만 미국 대통령 선거 오스카 투표에 스 탁 대조.
"난 일반적으로 4 개의 서로 다른 유형의 데이터에 초점: 폴링 데이터, 시장 데이터, 기본 데이터 및 사용자 생성 데이터 예측" 데이비드 로스 차일 드 말했다. 정치 예측, 난 지난 선거 결과, 의무와 경제 바람개비 같은 기본 데이터를 사용 합니다. 기본 데이터에서 기준을 설정 하 고 이러한 두 가지 유형의 데이터를 흡수 하 고 더 많은 선거 정보를 포함 시장 및 폴링 데이터를 예측 이동. 2012 대선 예언 되었다 때 적은 수의 사용자가 만든 데이터를 사용 하지만 Xbox 라이브 데이터 추가 중요 한 이벤트의 실시간 분석에 핵심 역할을 했다. "
"오스카 수상 가족에 대 한 투표 필요가 없습니다 그리고 기본 박스 오피스 반환 영화 등급 데이터 계산 되지 않습니다," 고 말했다. 난 더 중요 한 요소 이다, 시장 데이터를 예측 걱정 하 고 일부 사용자에 의해 생성 된 데이터를 사용 하 여 얼마나 많은 어워드 등 영화의 내부와 다른 카테고리의 관련성을 이해 하는 데 도움이 됩니다 원 영화 "링컨"? "데이비드 로스 차일 드 말했다입니다.
"때마다 주요 것 들에 대 한 생각 되는 새로운 영역에 초점을, 그리고 확인 내 예측은 더 의미 있는," 데이비드 로스 차일 드 강조 했다. "우선, 내가 가장 관련 예측을 결정할 것입니다. 오스카 수 상자에 대해서 나 모든 24 카테고리에 대 한 확률을 승리와 총 상을 주류 영화의 모든 범주에 대 한 예측에 집중 해요. 둘째, 모든 내 예측된 결과 실시간으로 업데이트 됩니다. 연구 관점에서 실시간으로 예측을 업데이트 하는 것이 중요 하다 고 우리 예측 초기 및 최종 이벤트 사이 발생 한 다른 이벤트의 가치를 배울 수 있습니다. 이러한 이벤트는 오스카 속성에 서곡. 마지막으로, 특정 필드에 기록 데이터를 모델로 하 고 모델을 지속적으로 업그레이드 하 여 예측의 정확도 보장. 또한 우리가 하는 모든 것까지 가능한, 분야의 독립을 보장 하 고 측정 가능한 자연의 모든 문제를 확인 하는 것입니다 강조 하 고 싶습니다. 보다 효율적인 예측 방법을 생산 하 고 다양 한 많은 분야에서 문제를 적용 하는 연구 했다 그것은 학계와 세계에 귀중 한 것입니다. "
(책임 편집기: Schpeppen)