바이 수 있습니다 무엇 인지 우리에 대 한 우려, Taobao 수 우리가 좋아하는 것에 대 한 통찰력,이 행복 인지 걱정? 큰 데이터는 관통 모든 산업 및 비즈니스 기능 영역으로 오늘, 중요 한 생산 요소가 되 고. 최근 출판 저널 자연 및 기술 발굴 및 대량의 데이터를 사용 하 여 생산성 성장의 새 풍조와 소비자 잉여의 heralds 나왔다.
더 큰, 더 큰만
큰 데이터를 정의 하는 위키백과: 대용량 데이터 또는 거 대 한 양의 데이터를 많은 양의 데이터, 큰 정보, 의미 큰 규모에 관련 된 데이터의 양을 차단 하 고, 관리 하 고, 처리 하 고 인간으로 구성에 적절 한 시간 내에 정보를 읽을 수 있도록.
체스 챔피언 카스파 로프 려 컴퓨터를 위해서 IBM 팀 600000 석사, 인간의 두뇌 수 없습니다 이러한 모든 게임을 기억 하 고 효과적으로 사용 하 여 큰 데이터의 게임의 거의 100 년을 수집 했다. 1997 년에, 체스 그랜드 마스터 카스파 로프, IBM의 깊고 푸른 컴퓨터 위험 프로그램에 먼저 분실 되었다 히트의 뉴스. 인간의 뇌를 때 려는 컴퓨터의 능력에 비밀 깊고 푸른 컴퓨터에 대용량 데이터 저장 하는 게임입니다. 과학자는 인간 두뇌의 범위 저쪽에 있는 게임의 큰 수에서 가장 적절 한 단계를 찾을 수 있습니다 하는 AI 게임 소프트웨어를 개발 했습니다.
어떤 사람들 4v:volume (대용량) 다양 한 (다양 한), 속도 (고속), 값 (낮은 밀도)로 큰 데이터의 특성을 일반화합니다. 작년의 "더블 11" 섹션을 검토 하자, 하루 Taobao 몰 188 백만 거래에 도달, 총 매출에 도달 기록 35.019 십억 위안. 이러한 트랜잭션을 미친 큰 데이터를 온라인 쇼핑의 하루를 형성 합니다.
이러한 레코드는 먼저 데이터의 크기에 반영 됩니다. 첫째로, 우리는 높은-정의 영화는 약 1GB의 용량, 그리고 1024 GB는 TB, 그리고 다음 1024 TB, PB는 종종 큰 데이터 도달 PB 크기 순서, 표시 되는 데이터 볼륨이 너무 커서 상상; 알고 둘째, 데이터, 트랜잭션, 판매자의 정보, 구매자의 정보, 다양 한의 다양성 택배 정보, 지불 정보, 다양 한 산업 데이터 체인을 구성, 셋째, 속도 의해 생성 된 데이터는 매우 빠른, 검색 결과의 속도 또한 빠른 필요, 찾을 항목, 검색의 수백만 있는 상품의 클래스 속도의 전통적인 기술에 의해 달성 되지만 1 초. 마지막으로, 그것은 설명 될 필요가 대용량 데이터의 내용을 공부 하 고 광산, 큰 데이터는 자동으로 하지 않을 경우 객관적인 세계, 하지만 자사의 값 밀도의 진정한 하 고 완전 한 반영은 매우 낮은, 비록 결과가 유용. 대규모 감시 비디오에서의 스트리트 뷰, 예를 들어 범죄자 수 있습니다 단 몇 초 남아 있다.
큰 데이터 나이
빅토르 메이어-sch? nberger, 영국에서 큰 데이터 전문가, "는 큰 데이터 나이", 처음으로 인류는 빅 데이터 시대에 빅터 Maire Schoenberg 했다 주장 제목의 책을 썼다. 2000 년에, 그는 추정만 약 1/4의 정보는 디지털화, 다른 3/4 신문, 책, 필름, 테이프의 형태로 아직도 했지만 2007 년 인간 이상의 300 바이트의 데이터, 300 십억 기가바이트의 정보를 동일한 저장 했다 하는 동안. 빅 데이터 시대 생활, 일 및 생각에 사람들에 게 큰 변화를 가져왔다.
첫째, 데이터의 형식으로 표시 됩니다 원래 관계형 데이터 (예: 스프레드시트) 더 비 관계형 데이터 형식으로 (사용자 의견 등 분산된 저장으로 원래 중앙 집중식된 스토리지에서 데이터 저장소 모드, 대용량 데이터 다른 로컬 스토리지 서버, 인터넷 액세스에에서 저장 되는 소위 클라우드 스토리지를 구성 합니다.
둘째, 데이터 처리 방식에 근본적인 변화, 사람 뿐만 아니라 컴퓨터를 사용할 수 네트워크 뒤에 클라우드 플랫폼에 의존 해야 합니다 데이터 처리, 클라우드 컴퓨팅, 대용량 데이터를 효과적으로 처리. 대형 데이터 처리에 우리 3 흥미로운 변화를 볼 수 있습니다: 작은 디지털 시대 사람들이 데이터를 얻기의 어려움에 제한에 사용할 수 있습니다 무작위 샘플링 데이터 샘플을 얻을 수 및 다음 예제 데이터 분석 및 예측에 기반. 일단 샘플 편견 결과 결과 큰 오류를 만들 수 있습니다.
빅 데이터 시대에 모든 데이터를 쉽게 얻을 하 고 더 이상 필요 없는 샘플 수 없습니다. 알리바바, 예를 들어 모든 구매자에 게 서 데이터를 얻을 수 있습니다 그리고 그것은 쉽게 계산 거래 금액의 "싱글" 그 날 수 있다, 어떤 영역이 가장 활성화 되며 거래 매체를 통해 실시간으로에서 방송할 수 알아낼. 이것은 대용량 데이터의 전체 데이터 모델, 데이터 처리의 범위는 전체, 아니 샘플입니다. 두 번째 변화는 더 이상 맹목적으로 데이터의 정확성을 추구 합니다. 다양성, 풍부 및 대용량 데이터 (어떤 처리 하는 동안 많은 수에서 생산 되는)의 역학, 데이터의 정확성을 강조 하기 위해 필요는 없습니다. 복잡 한 데이터를 함께 혼합 될 것, 그것은 사용, 또는 심지어 일부 잘못 된 데이터를 하지만 아무 관계가 있다, 이것은 겉보기에 쓸모 없는 큰 데이터의 특성 데이터의 더미 포함 무제한 비즈니스 기회.
바이에 사람들이 그 어느 때 보다 "감기", "발열" 및 다른 키워드를 종종 의미 거기 인플루엔자의 발생 되며 심지어 어떤 독감, 대용량 데이터의 힘은 예측할 수에 대 한 검색, 그것에 대해 생각 합니다. 세 번째 변화는 인과 관계가 아니라 데이터 간의 상관 관계에 집중 하는 것 이다. 예를 들어 데이터 거래 하루 고양이 쇼핑몰을 파고에 의해 메트로 커피 기계 구매자의 구입, 애완 동물 식품의 구매 비율이 높은 것, 사업 로얄 개밥을 구입 하는 것이 좋습니다 기회를 잃게 될 것 이다 발견. 커피 기계와 개밥 사이의 인과 관계가 없습니다 그러나 본질적인 상관 관계 있다. 데이터 간의 상관 관계는 큰 데이터 및 비즈니스 기회를 추구 하는 가맹점에 포함 된 값입니다. 큰 데이터의 관련성은 우리가 필요가 없습니다 "왜" 복잡 하 고 복잡 한 데이터를 얼굴에 공부 만큼 우리가 인지 무엇 "은" 충분히 우리에 게 알려줍니다.
마지막으로, 큰 데이터 나 디지털 과학자 들의 숫자와 데이터 마이닝 업계 스 폰 됩니다. 간단히 말하면, 데이터 마이닝 분석 하 고 특정 알고리즘을 사용 하 여 데이터를 계산 하 고 우리가 필요한 지식과 정보를 얻는 프로세스입니다. 전통적인 통계 분석은 알려진된 범주에 따라 데이터를 분류 한 다음 귀중 한 데이터에 대 한 것입니다. 주어진된 분류 불합리 하거나 잘못 된 경우 다음 통계 결과 생성 하지 최상의 결과. 데이터 마이닝 "클러스터링" 라는 메서드를 사용 하 여, 인공 분류, 필요 하지 않습니다 하지만 데이터를 "클래스"로 데이터의 자동 집계의 특성의 알고리즘 분석에 의해 그래서는 "클래스" 가능 한 한 많은 유사성 내 작은, "클래스" 사이의 유사성. 예를 들어 잠재 고객 대상 그룹, 다른 고객 기반과 중요 한 요소를 찾기 위해 데이터 마이닝의 많은 수에 대 한 필요의 디자인 설정 되지 않은 사전에 인위적으로 그래서 사람들이 모든 종류의, 다양 한 직종, 보험 사업이 다룹니다. 수 있도록 "데이터 자체에 대 한 이야기" 마케팅을 개발 하기 위해 현지 조건에 적응 하기 위해서는 계획, 손익 분기점, 보험 회사에 대 한 더 많은 이익을 만들 수의 과학적인 계산.
큰 데이터 배당
그것은 데이터 인류를 위한 중요 한 자산이 될 하 고 석유와 금 보다 재사용 가능한 개발을 위한 더 중요 한 자원이 될 것입니다 주장 되었습니다. 나는이 보기에도 동의 한다. 최근, 미디어는 "3 마리" 보고 함께 보험 뉴스를 구입, 이것은 예제를 저장 하는 큰 데이터 배당. "세 마리" Alibaba, Tencent와 Ping을 사용 하 여 큰 데이터, 네트워크 보험 회사 공용의 설립의 장점을 파악 하 보험 3 회사 앤 온라인, 이것은 겨냥 한 보험 소비자의 정확한 위치에 대 한 큰 데이터를 사용 하 여 인터넷 금융 혁신에 이정표와 정밀 마케팅, 주요 목표는 소비자의 수. 그것은 큰 데이터 기술의 사용 시장 점유을 보험 회사의 미래는 매우 중요 한 링크 있을 것입니다 볼 수 있습니다.
또 다른 유용한 응용 프로그램 큰 데이터 통신 사기에 대하여 감시를 사용 하는 것입니다. 통신 사기는 오늘날의 사회에서 주요 질병 경우 통신, 금융, 인터넷, 공공 보안 및 기타 당사자 통신 사기를 제거 하는 최대 전적으로 가능 하다 그들의 큰 데이터를 공유 하는 녹 채의 이익을 포기 하. 우리가 분석 하 고 당사자의 대용량 데이터를 발굴, 통신 사기 상관 관계의 데이터 요소를 찾아 다음 경찰 관련 데이터 표시 되 면 데이터 체인에 따라 신속 하 게 사기를 찾을 수 있습니다 다음 동적 모니터링 모델을 설정 합니다.
주식 전문가의 큰 데이터 개념 주식 배당 적립 싶어요. 큰 데이터에 대 한 배당은 어디에? 큰 데이터, 대용량 데이터 기술 기업 및 대형 데이터 값 파는 (즉, 생각을 제공 하는 데이터 과학자)의 소유자. 엄마 윤 말했다: 세계의 미래는 데이터의 세계. 빅 데이터 시대 정부, 보건 의료, 교육, 문화 및 사회의 다른 지역에에 모든 것을 산업, 농업, 상업, 기술에서 동요는 그리고 사람들의 생활은 점점 더 데이터에 의해 변경 되 고 있습니다. 말할 수 있는, 큰 데이터 석유, 금, 누가 누가 지휘 하이츠, 향상 된 경쟁력을 잡고 충분 한 데이터를 마스터 또한 마스터 미래 보다 더 귀중 한 자원.