빅 데이터 시대에 우리는 전체 데이터, 더 이상 샘플 데이터를 원한다. 샘플 분석 100 년 미만 대 한 개발 되었습니다 그리고 데이터와 기술 제한 됩니다 시간에 몇 가지 특정 문제를 해결 했다. 인구 조사의 경우 일반적인 통계 8-10 년이 걸릴 하 고이 이번에 데이터는 완전히 부정확 하 고 효과. 따라서, 샘플링의 통계적 방법에 조건 하에서 제안 했다.
그것의 고유의 특성이 샘플링 분석: 절대 임의성 및 세부 관찰의 태만. 샘플링의 목적은 최소한의 데이터와 더 많은 정보를 얻을 것입니다. 절대 임의성: 우리 우리 샘플, 하지만 사람들이 항상 같은 일에 대해 다른 의견을가지고 있기 때문에 이렇게 어려운 때 절대적으로 무작위 있이 필요가. 임의성에서 이탈, 샘플링 결과의 오류 비율 증가 크게. 세부 관찰의 방치: 거시적인 분야에서 샘플링의 역할 미세한 분야에서 손실 되었습니다. 으로 경제 프린지 이론, 샘플에는 특정 값에 도달 하면 개인에 정보가 된다 더 적은 더 적은.
통계 샘플링 분석에서 매우 중요 한 포인트는: 샘플링 분석의 정확도 샘플링 임의성의 증가 함께 크게 증가 하지만 샘플 수량 증가에 관련이 없는.
때 우리는 지금 http://www.aliyun.com/zixun/aggregation/13584.html를 수집할 수 있습니다 "> 대량 데이터 샘플링은 우리에 게 의미가 없다." 많은 수에서 데이터를 수집 큰 회사만 할 수 있는 뭔가가 이며 많은 기업 들이 그것을 할 수 있다.
큰 데이터 임의의 분석 없이 모든 데이터를 사용 하 여 메서드를 나타냅니다. 클라우드 컴퓨팅의 출현, 저희가 수집 대규모 데이터 인프라를 제공 합니다, 그리고 클라우드 컴퓨팅 빅 데이터 분석을 통해 예측, 것입니다 결정을 더 정확 하 게, 더 많은 숨겨진 데이터 값을 출시, 큰 역할.
이 문서는 인터넷 (http://www.hed236.com)의 공유 작성, 표현 반드시 링크를 두고, 감사 합니다!