큰 데이터 나이 및 샘플링 분석의 차이점

출처: 인터넷
작성자: 사용자
키워드: 빅 데이터 시대 우리 차이

빅 데이터 시대에 우리는 전체 데이터, 더 이상 샘플 데이터를 원한다. 샘플 분석 100 년 미만 대 한 개발 되었습니다 그리고 데이터와 기술 제한 됩니다 시간에 몇 가지 특정 문제를 해결 했다. 인구 조사의 경우 일반적인 통계 8-10 년이 걸릴 하 고이 이번에 데이터는 완전히 부정확 하 고 효과. 따라서, 샘플링의 통계적 방법에 조건 하에서 제안 했다.

그것의 고유의 특성이 샘플링 분석: 절대 임의성 및 세부 관찰의 태만. 샘플링의 목적은 최소한의 데이터와 더 많은 정보를 얻을 것입니다. 절대 임의성: 우리 우리 샘플, 하지만 사람들이 항상 같은 일에 대해 다른 의견을가지고 있기 때문에 이렇게 어려운 때 절대적으로 무작위 있이 필요가. 임의성에서 이탈, 샘플링 결과의 오류 비율 증가 크게. 세부 관찰의 방치: 거시적인 분야에서 샘플링의 역할 미세한 분야에서 손실 되었습니다. 으로 경제 프린지 이론, 샘플에는 특정 값에 도달 하면 개인에 정보가 된다 더 적은 더 적은.

통계 샘플링 분석에서 매우 중요 한 포인트는: 샘플링 분석의 정확도 샘플링 임의성의 증가 함께 크게 증가 하지만 샘플 수량 증가에 관련이 없는.

때 우리는 지금 http://www.aliyun.com/zixun/aggregation/13584.html를 수집할 수 있습니다 "> 대량 데이터 샘플링은 우리에 게 의미가 없다." 많은 수에서 데이터를 수집 큰 회사만 할 수 있는 뭔가가 이며 많은 기업 들이 그것을 할 수 있다.

큰 데이터 임의의 분석 없이 모든 데이터를 사용 하 여 메서드를 나타냅니다. 클라우드 컴퓨팅의 출현, 저희가 수집 대규모 데이터 인프라를 제공 합니다, 그리고 클라우드 컴퓨팅 빅 데이터 분석을 통해 예측, 것입니다 결정을 더 정확 하 게, 더 많은 숨겨진 데이터 값을 출시, 큰 역할.

이 문서는 인터넷 (http://www.hed236.com)의 공유 작성, 표현 반드시 링크를 두고, 감사 합니다!

관련 문서

연락처

이 페이지의 내용은 인터넷에서 가져온 것이므로 Alibaba Cloud의 공식 의견이 아닙니다.이 페이지에서 언급 된 제품 및 서비스는 Alibaba Cloud와는 관련이 없으므로이 페이지의 내용이 골칫거리 인 경우 저희에게 알려주십시오. 우리는 5 일 근무일 이내에 이메일을 처리 할 것입니다.

커뮤니티에서 표절 사례를 발견한 경우 info-contact@alibabacloud.com 으로 관련 증거를 첨부하여 이메일을 보내주시기 바랍니다. 당사 직원이 영업일 기준 5일 내에 연락 드리도록 하겠습니다.

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.