큰 데이터, 기름, 새로운 에너지, 새로운 생산 요소와 거 대 한 경제 자산, 변환의 주요 시대 여 생산성 성장의 새 풍조와 소비자 잉여의 도착을 예 고의 미네랄 카테고리에 곧 될 것입니다. 그것은 국가, 기업 운영의 마법 무기, 미래의 취임식의 핫 스폿 및 선진국에서 세계화 경쟁의 다음 라운드에서 아마도 날카로운 무기를 관리 하는 수단 이다.
2013은 큰 데이터의 해 라고 합니다.
어떤의 가장 저명한 빅터 Maire Schoenberg의 큰 데이터 나이 큰 변화 생활, 일 및 생각 (절 강 출판사에 의해 출판)에 대용량 데이터에 대 한 책의 20 개 이상의 종류가 있다.
Schoenberg 큰 데이터 나이의 개발 동향에 대 한 통찰력을가지고 첫 번째 데이터 과학자 중 하나 큰 데이터 응용 프로그램의 전향적 연구 출판 되었음: 이코노미 스 트에 이르면 2010 년 이며, 그의 컨설팅 클라이언트 포함 마이크로소프트, HP, IBM로 알려진 등 최고의 글로벌 기업 "빅 데이터 비즈니스 응용 프로그램에서 첫 번째".
아래, 우리는 맥락의 Schoenberg "빅 데이터 시대"에 따라, 큰 데이터의 의미를 이해.
세계의 본질은 데이터
돼지 독감 발발 2009 년에서 전에 주에 Google의 엔지니어 전표 성격에서에서 유행 성 독감의 확산을 예측 했다. 구두 스트립 배포 또는 의사를 조사 하 고, 그들은 특정 검색어의 빈번한 사용 사이의 링크에 초점을 맞춘 시스템을 설정 (와 같은 "기침 및 발열에 대 한 치료는", 등) 검색의 수십억에 지시 받은 매일, 그리고 독감 확산 됩니다의 적시 결정. CDC 독감 발발 후 2 주까지 확인할 수 없습니다.
큰 데이터 기반으로 Google의 판단: 제품 및 서비스의 가치 또는 통찰력을 얻기 위해 특정 방식으로 데이터의 엄청난 금액의 분석.
경제 통계의 전통적인 원리 샘플 표현, 손전등, 처럼 세계의 이해는 명확 하 게 돌, 조각의 발 볼 및 정보 통계의 큰 데이터 나이 같은 큰 샘플 크기, 랜 턴 같은 포함, 정확한 세부 사항에 되지 않을 수 있습니다 하지만 전체 환경과 어디에도 빛 날 수 있는 인간을 기반으로 합니다. 가장 원시적인 겉보기 하 찮은, 쓸모 없는 정보를 매우 아니다 정확한, 적절 한 분석 후 오른쪽 우리 가까이 가져옵니다.
취미, 웹 페이지, 종종 본 프로그램, 그리고 소득 견적을 분석 하 여 중국-영국 생활 라이프 스타일 인물 더 가능성이 높은 혈압, 당뇨병과 우울증의 수백을 확인 했다. 신청자는 피를 제공 하지 않아도 및 소변 샘플,이 순수 데이터 분석은 단지 5 달러, 125 달러 인당; 하기 보험 회사
사이트 콘텐츠 설정은 뉴스, 그리고 데이터의 편집 감도 인기에 대 한 경험이 풍부한 기자 보다 더 많은 공개 보다는 데이터에 따라 다릅니다.
온라인 교육 회사는 깊이 모든 데이터 수집, 예 학생의 강의 비디오 재생 부분과 명확 또는 디자인 과정에 호소 팀을 찾아 연구...
폐품 사냥 처럼 이며이 데이터의 잠재적인 가치 그것의 가장 기본적인 사용 보다 훨씬 데이터 과학자의 손에 의해 구했다는. 데이터 자체 음성 발송 하 고 우리에 게 놀라움을 가져. 큰 데이터의 도움으로, 우리는 본질적으로 세계 정보 구성입니다 실현.
"빅 데이터"의 진정한 의미는 처리 데이터 마이닝
대상에 습격 한 사람이 저장 하 고 관리자에 게 화가 나 서 말했다, "내 딸이 고등학교, 그리고 보내는 그녀는 쿠폰 베이비 코트와 침대, 그녀 임신을 장려 하는"? "몇 일 후, 사과 하는 관리자 호출 될 때, 남자는 조용한:" 내 딸은 8 월에, 나 몰랐다 완전히 사건, 그리고 말을 미안 해요. "원래, 대상의 분석 팀 발견 임신 여성 향수 무료 유제를 살 것 이다 다음 마그네슘, 칼슘, 아연 및 다른 양분, 20 종류의 관련 된 것 들 보다 정확 하 게 소매를 만들 수 있습니다 보다 더 살 것 이다 3 개월 예측 예정 날짜, 고객 유치에 해당 쿠폰을 보내."
빅 데이터 시대에 우리는 미래를 예측할 수 있습니다. 고 대에 날씨를 예측할 수 있는 사람은 자주 신들으로 간주 하 고 소지 및 대량 정보의 분석은 그들이 지금 무엇 필요.
큰 데이터 그냥 데이터의 크기, 그것은 키 큰 데이터 마이닝 프로세스를. 특정 도구 수집 및 개발 데이터, 그리고 세트의 해커와 양적 분석 데이터 과학자입니다.
기술 성숙, 공공 부문과 민간 기업 과거에 축적 된 "정크" 데이터의 양이 갱신 될 가능성이 높습니다. 예를 들어 마이크로 주민과 기업의 스마트 그리드 건설, 교통 사고 및 범죄 데이터 경찰의 배포 가이드를 가이드를 사용 하 여 소득, 가이드 철도를 민간 항공 배포 승객 데이터를 사용 하 여, 역학 예방, 등등에 대 한 데이터를 제공 하는 인터넷 키워드의 사용의 배포 가이드를 소비와 세금 데이터를 사용 합니다.
월마트-마트는 큰 데이터 선수 이다. 각 고객의 바구니, 구입, 시간 또는 심지어 구입의 일에 있는 항목의 분석, 후 연구팀은 발견 맥주 가장 자주 기저귀를 함께 구매 하 고 팝 타르트 계란 타르트 계절 허리케인의 도래 하기 전에 구입 했다. 그래서 월마트-마트 맥주와 기저귀를 번들 하 고 허리케인 경보 후 계란 타트와 손전등을 함께 넣어. 과거에는, 본부 직원 아이디어와 데이터 수집 그들을 확인 하는 데 필요한, 그들은 귀중 한 예측 수 이제 충분히 B 나타납니다 있는 나타납니다. 그들은 더 이상 어려운 원인-효과 관계를 추구 하 고 사물의 관계를 그들의 관심을 차례.
데이터 수집에서 개인 정보를 포함 하 고
어느 날 아침 경찰 하 워드 마르코스의 집, 그는 녹색 모자를 쓰고 그의 아내를 발견 하기 때문에 위를 그의 아내를 찔 러 하려고으로 돌진. 경찰 하 워드, 제어 하기 시작 하 고 하 워드 잘못 한 소리 쳤 다: "나는 아무것도 하지 않았다!" "이것은 영화 마이너리티 리포트에서에서 장면입니다. 무제한 대용량 데이터 분석 시나리오를 이어질 수 있습니다 죄는 사람의 미래 행동의 예측에 근거 하 여 판단 이다.
향후 데이터 혁명 전례 없는 혁신과 도전 기업 및 국가의 개발 모델을 하 고 전략적 높이에서 이해 되어야 한다. Holdren, 대통령의 과학 기술 자문 위원회의 회장, 슈퍼 컴퓨팅 및 인터넷에 대 한 지출의 미국 역사, 같은 큰 데이터 프로그램 미국의 혁신, 연구, 교육 및 국가 방위에 지대한 영향을 미칠 것 이라고 말했다. 모든 입법과 계획은 미국에 있다 그것에 해당 하는 데이터베이스 및 정보 관리 시스템. 2012 년 3 월에서에서 미국 프로그램을 실행 하는 "큰 데이터 개발 연구" 200 백만 달러를 투자할 것 이라고 발표 했다 추출, 저장, 분석, 공유 및 대용량 데이터의 시각화를 촉진 하기 위하여. GE는 또한 400 과학자를 고용 글로벌 소프트웨어 및 분석 센터 샌 프란 시스 코, 1.5 십억 달러를 투자 합니다. 오픈 소재 거래, 순환, 오픈 산업 혁명로 데이터 순환 시대의 추세에 대 한 필요는.
하지만 큰 데이터의 오용 또한 위험할 수 있습니다, 그리고 산발적 데이터 집계, 위기는 발현 하지만 고 본 그는 예측 알고리즘 우리가 아픈, 있을 수 있습니다 지불에 사라지는 저지른 범죄의 가능성 뿐만 아니라 개인 정보를 공개 것입니다 불가능 하 게 그것 우리 건강 보험, 구매에 대 한 대출 돈, 또는 심지어 범죄를 저지르고 하기 전에 체포를 사전. 너무 많은 데이터에 의존 하는, 우리는 또한 조절: 결정 인간 보다는 기계에 의해 이루어집니다 데이터의 볼륨이 너무 큰 때문에.
큰 데이터는 모든 문제에 대 한만 병 통치 약 Zhou, 번역기와 교육 및 정보 큰 인물의 나이에 대학교의 교수를 말한다. Feng Jinming, 하버드 대학에서 방문 학자 큰 데이터 보완, 대체 하지, 전통적인 경제 통계는 지적 한다. 가져온 데이터 샘플링, 같은 절차에 따라 조사 및 집계 경제 분석 및 정책 수립에 중요 한 역할을 계속 됩니다. 가로 보기, 경제 성장, 과세, 무역, 소득 분배 통계의 주요 이점의 다른 지역에서 전통적인 통계적 방법 및 가격, 인플레이션, 실업, 소비 및 통계 장점의 다른 측면에서 큰 데이터.
즉,이 책은 대용량 데이터의 빛, 세상을 조명 하는 어떻게의 풍부한 예 고 엄격 하 고 철저 하 게 서술 프레임 워크는 대용량 데이터의 기술적 측면에 대 한 이해. 큰 데이터의 지식을 우리에 게 희망과 신뢰 미래에 당연 Asiainfo, 광대역 자본의 회장 이라고 그것은 "가장 큰 데이터 책 봤어요."
(책임 편집기: 유산의 좋은)