2013 년 6 월 19 일, 우려의 메시지를 밀어 일반적인 계정에 "유가 일찍 알고" 마이크로 편지의 저자: "유가 일찍 알고 우정 팁: 다음과 같은 분석의 오일 가격, 6 월 22 일의 이른 아침 석유 가격 또는 100 위안/톤에 대 한 최대 (70%의 확률), 증가. "다음 날, 유가 유가, 증가를 계속 하는 것으로 알려져 되 고 주어진 0.1 원/리터, 6 월 21 일의 상승, 유가 일찍 뉴스 NDRC의 석유 가격 업그레이드 통지 발표 이미 알고.
유가 되었습니다 알려져 선, 이후 석유 가격 조정 정보를 예측 하는 시간에 앞서 3 일 그들의 예측된 정확도 비율 95%를 초과 했습니다! 이것은 큰 데이터 응용 프로그램의 일반적인 예는 나가 중국에 방문 하는 큰 데이터 응용 프로그램의 좋은 예로 보는 무슨 이다.
대용량 데이터에 대 한 시작 하는 지난 1 년, 클라우드 컴퓨팅, 인터넷의 것 들, 3D 인쇄, 세계에서 화제가 되고있다. 하지만 큰 데이터 입니까? 큰 데이터의 특성은 무엇? 우리가 큰 데이터를 어떻게 신청 합니까? 그것은 우리의 삶에 어떤 변화를 가져올 것 이다? 이러한 문제의 토론 실시 되어, 많은 기업, 큰 데이터를 사용 하 여 엔터프라이즈 IT 건설, 기업 운영의 혁신을 실현 하는 방법을 생각 하는.
큰 데이터, 바이 두의 정의: 큰 규모를 달성 하기 위해 적절 한 시간에 현재 주류 소프트웨어 도구를 통해 캡처, 관리, 처리, 및 비즈니스 의사 결정 더 긍정적인 목적 정보를 데이터 정렬에 관련 된 데이터의 양을 말합니다.
가트너는이 정의 제공합니다. "빅 데이터" 거 대 한, 높은 성장 율 및 새로운 처리 모델을가지고 더 많은 의사 결정 능력, 통찰력 발견 및 프로세스 최적화 기능을 필요로 하는 다양 한 정보 자산 이다.
IBM의 4V 설명 큰 데이터 기능의 현재 산업에 의해 허용: (1) 볼륨을 데이터 볼륨은 거 대 한. TB, PB 수준으로 점프, (2) 다양 한에서 데이터 형식은 수많은입니다. 또한 웹 로그, 비디오, 사진, 지리 정보, 인터넷에서 등만만 전통적인 서식 데이터입니다. (3) 값, 낮은 밀도, 높은 상업. 비디오, 예를 들어 연속 중단된 모니터링 프로세스 유용할 수 있습니다만 2 초간. (4) 속도, 빠른 처리입니다. 1 두 번째 법률입니다. 이 마지막 점은 일반적인 데이터 마이닝 기술부터 근본적으로 다르다.
단순히 큰 데이터를 이해 하는 것이 4 개의 기능에 따라, 전체 볼륨 또는 홀로그램 데이터 큰 데이터를 해석할 수 있습니다. 대형 또는 큰 프로젝트에만 건설 될 것 같은 데이터 응용 프로그램 그리고이 차이 무엇이 및 전통적인 데이터 창 고?
빅 데이터 시대의 동향에 대 한 통찰력 Schoenberg에 의해 주어진 3 개의 큰 데이터 기능을 첫 번째 데이터 과학자 중 하나 큰 데이터의 더 나은 이해 우리에 게 있습니다. Schoenberg의 큰 데이터 기능 3 개의 단어에서 기술 될 수 있다: 더, 더 혼란, 보다 관련성이 높은.
자세한 내용은 여기, 연구 개체 자체에 대 한 더 많은 치수 정보를 고려 하는 관련 고객 결제 데이터를 뿐만 아니라 고객의 위치 정보, 공부 뿐만 아니라 속도 예측 밖으로 고객의 연구에서 연산자 같은 전통적인 기업 내부 정보 보다는 개체 SNS 온라인 연설에도 정보 고에 추가 되었습니다. 그래서 큰 데이터 풀 (그리고 누가 전체 금액은 정의할 수 있습니다?) 될 필요 없다. 하지만 점차적으로 증가 하는 "" 더만.
더 혼란은 수집 데이터 잡음의 더, 문제, 데이터 차원의 큰 소요의 예측된 결과의 연구에도. 이 인터넷 "시행 착오" 생각의 사용을 요구 하 고 끊임없이 공부 가능한 컬렉션에서 및 소음, 반복된 연습, 가장 유용한 "작은 데이터입니다." 밖으로 Amoy에 대용량 데이터의 형성에서 데이터 처리 응용 프로그램 초기에 위에서 언급 한 석유 가격, 개발자 경험 중 하나는 지속적인 알고리즘 조정, 소음 제거의 SNS 텍스트 정보 처리의 컨텍스트에서 포함 하 여 다른 주제 석유 가격 간섭에 작은 데이터 세트 더 정확 하. 예를 들어 택시 가격의 토론에 관련 된 큰 V는 택시 가격 상승, 다음 석유 가격 또한 높아야 말했다. 인간의 두뇌 신속 하 게 이러한 언어, 택시 요금의 질문에 따라 판단할 수 있는 그리고 기계 이해 하기 어렵다. 이러한 문장에서 상승 유가 대 한 정보를 얻을 경우 전체 오일 가격 판단을 방해.
관련은 데이터 및 연구 개체의 개발의 더 나은 예측 간의 상관 관계의 발견 이다. 어떻게 Google의 엔지니어 예측할 수 있는 인플루엔자 이전 미국 공식 건강 부의 보기 좋은 그림 이다. Google의 데이터 엔지니어 병리학, 그리고 그들은 독감의 원인이 무엇 인지 알 수 없습니다 하지만 그들은 독감에 대 한 몇 가지 정보를 표시 하 여 인플루엔자의 임박한 발병을 예측할 수 있습니다.
위의 세 가지 기능과 예제에서 큰 데이터 응용 프로그램, 그냥 국가 전략, 기업 전략 같은 큰 응용 프로그램을 통해 정확 하 게 수 수많은 고 우리의 삶에 밀접 하 게 "작은 응용 프로그램"에 관련 된 개발, 실제 시장의 응용 프로그램에 아래로 걸어 높은 제단에서 홍보를 계속.
그러나, 점차적으로 우리의 일상 생활에 큰 데이터에 우리가 또한 알고 있어야 어떤 기술 개발은 규범적인 (시스템), 기술, 응용 프로그램 및 지속적으로 서로 일반적인 개발 프로세스에 대 한 협력 합니다. "프리즘 게이트" 사건 최근 난리는 사람들이 큰 데이터의 멋진 이해 하자. 6 월 17 일, Weibo에 저자가 쓴이 문장: "눈 Snowden 사건의 끝에는" 데이터 오른쪽 "공용 보기에 누가 살고 싶다 1984 년 빅 브라 더의 규칙의 밑에? 일부 빅 브라 더, 되 고 싶어 하지만 사람들은 지난 세기. 큰 데이터 또는 첫 번째 개발 중단점의 첫 번째 장애물 점차적으로 나타납니다. "
따라서, "규범적인 (시스템), 기술, 응용 프로그램"을 달성 하기 위해 가능한 한 빨리 일치 해야 수도 모든 개 업자의 책임. 대용량 데이터 기술 조작 하는 제조 업체는 기본 규범 연구 및 응용 프로그램 탐색기 경험을 축적 하 고 기본 이론 응용 프로그램을 심화 하는 과정의 건설에 참여 수에 더 참여할 수 있습니다. 관련 부서 국가 정보의 방향 짊어지고 큰 데이터 규범 (시스템)의 건설에 큰 중요성을 첨부 해야, 모든 후, 이것이 하지 어떤 산업 이나 기업 수 혼자 완료.
큰 데이터의 작은 응용 프로그램은 우리의 삶에 난 류, 석유 가격을 일찍 알고는 좋은 예입니다,이 탐사, 생활 밀접 하 게 우리의 건강에 관련 된 생각 일찍 알고, 여행 일찍 알고, 일찍 알고, 일찍 알고 주식 교통... 그것은 까지입니다.