그림: 장 Fangman
이 텍스트 줄을 읽고 잠시 있을 때:
시 나 20000 microblogging 보냈습니다, 그리고 애플은 47000 응용 프로그램 다운로드, Taobao 60000 제품을 판매 하고있다, Renren은 300000 방문, 바이 900000 검색 쿼리 생성.
2010 인쇄 판 브리태니커 백과 사전, 최대 58.5 k g 32 볼륨. 그러나, 그것의 전체 콘텐츠를, 또한 설치 된 하지만 4 G u 디스크. 이러한 관점에서 올해 3 월에 발표 했다 백과 사전 Britannica 출판사 이상 버전, 전체 디지털 콘텐츠를 인쇄할 수 없습니다.
광대역의 탄생과 함께 모바일 인터넷, IoT, 소셜 네트워크와 클라우드 컴퓨팅, 큰 데이터 나이 실수로 후손. 얼마 전, Feng 사이 큰 데이터 산업 공원 조용히 산시 성 시안-시안 새로운 지구에 정착 큰 데이터 산업의 발전은 "테스트 물."
글로벌 데이터 볼륨 2 년 마다 2 배 속도로 성장
광고 문화 및 창조 산업에 종사 씨 호, 명확 하 게 기억, 전, 12에서만 가정용 컴퓨터의 20 GB 하드 드라이브 용량, 80GB, 120GB, 250GB, 500GB 호스트 저장 공간의 지속적인 확장의 요구에 맞게 신속 하 게 변경. "2 TB는 하드 드라이브의 사용할 수 있습니다 오늘 그리고 모바일 저장 장치에 의해 백업 됩니다. "
통계, 모니터링 IDC (국제 데이터 회사)에 따라 2011 글로벌 데이터 볼륨에 도달 1.8ZB (1ZB와 1 조 기가바이트, 1.8zb는 또한 모바일 하드 디스크의 1.8 십억 1 TB), 그리고이 숫자는 증가 하 고 2 년 마다, 세계적으로 2020 년으로 예상 된다 35ZB 데이터 볼륨, 성장 거의 20 배 번의 총을 있을 것입니다.
데이터 규모의 급속 한 확장 때문에 다양 한 산업에서 데이터의 축적은 점점 더 거 대 한 데이터 형식을 더 복잡 한, 처리 능력의 모드 "무한대" 개념을 접근 하는 그런 의미에서 나타날 것입니다 "큰 데이터" 전통적인 데이터 관리 시스템을 넘어 간 되었다.
첫 번째는 데이터, 산업 국가 부의 완전 한 컬렉션의 개념 및 대용량 데이터의 4 개의 특성을 표현 하는 소프트웨어 서비스 장관 알 버트 찬, "두 번째는 구조화 된 데이터, 반구조적된 데이터, 구조화 되지 않은 데이터 및 비디오 데이터를 포함 하 여 총의 90% 이상에 대 한 현재 회계에서 다른 종류를 포함 하 여 더 많은 종류 세 번째 요구 사항을 빠르게, 그리고 그것은 두 번째 레벨의 목표와 함께 실시간으로에서 처리 해야 합니다. "
'마지막으로 값 밀도 "거짓말, 첸 웨이 생각, 공존,"어디에 나 금, 이며 사방 모래", 그래서 큰 데이터의 목적은 중요 한 데이터를 분석 및 다양 한 산업에 대 한 진정한 지혜를 제공 하는 발굴을 통해 데이터의 대규모 컬렉션에서 지식 검색을 유용 하 고 잠재적으로 쓸모 없는 데이터의 많은 함께" 21 세기는 말할 수 있다 ' 기름에서 드릴 데이터 ' 시대. "
"현재, Sina Weibo 같은 일부 미디어 플랫폼, 예를 들어 대화형 데이터를 받아, 25 백만 이상 있다 마이크로 블로그 정보 많은 귀중 한 정보는 매일 게시 하지 발굴 되어," 중국 전자 및 정보 산업 개발 연구소 차장 엔지니어 등 다 수의 뒤에, 구조화 되지 않은 데이터에 리 6 월 대화형 데이터의 거 대 한 축적에서 큰 데이터 기술의 사용 발견 동향, 향후 예상 정보를 찾을 수 있으며 훌륭한 사회 및 상업적인 가치를 생산.
작은 사과 뒤에 큰 데이터: 데이터의 합계는 데이터의 값 보다 훨씬 더 가치가 있다.
"가지고 있기 때문에 데이터의 저장, 분석, 응용 프로그램 및 비즈니스 운영의 다른 측면 아니 스테레오 타입, 산업의 잠재적인, 혁신적인 공간 개발은 매우 큰" 산시 성 사이 '는 새로운 지구 관리 위원회 부국장, Feng 사이 신청 관리 위원회 감독 류 Yubin 재생 "작은 사과 큰 데이터 뒤 에" 간단한 비유:
예를 들어, 특정 생산 지역 애플 출력, 설탕 콘텐츠 및 다른 데이터를 겹쳐, 그리고 인터넷 및 "피드백"는 유일한 "정체성"의 실시간 모니터링, 성장 과정에서 각 애플 애플 추적을 주고 다른 수단을 통해 애플의 특정 품종의 최적 성장에 필요한 공간 지리 정보 데이터 산시 성에서 사과 산업의 발전을 복용 데이터 수집, 경우 충분 한 질량, 큰 데이터에 통합 될 것입니다.
이 데이터를 생성할 수 있습니다 먼저 값 데이터 대 여 서비스 및 잠재 고객을 통해 "이 비즈니스 모델 구현 데이터의 값 보다 훨씬 더 큰 데이터의 합계 값." "
둘째, 그룹 분석, 데이터 마이닝 및 클라우드 컴퓨팅으로 다른 과학적인 방법을 사용할 수 있는 경우 분산된 스토리지 및 다른 수단 및 수행할 수 있는 심층 분석 데이터 서비스의 예측 "는 애플은 최고의 품질, 더 나은 시장 응답, 내년, 생산 판매 구입 선호 하는 애플에 대 한 시장 됩니다 있을 것입니다 변경", 이런이 종류의 데이터를 깊이 파고와 소비자 행동 예측, 분석 통계학자의 권한 예전, 미래에 몇 분 정도 완료 수 있는 시간을 보낼 수 있습니다.
데이터 축적 및 국가 있는 다른 장소에 비해, 그것은 산시 사과 산업의 발전에 대 한 의사 결정 지원 서비스를 제공 하 고 unsalable 제품 및 농부의 혜택을 피하기 위해 과일 재배의 생산을 안내 하는 정부 및 업계에 대 한 결정으로 될 수 있습니다.
마지막으로, 신뢰할 수 있는 데이터 및 분석 방법의 설립이 가능 하다 세 번째 구축 데이터 서비스 공급자에 대 한 데이터 정렬, 필터링, 분석 및 처리 서비스에 대 한 더 많은 데이터 홀더, 고도 1 일이 베이, 비슷한 개발을 제공 하기 위해 파티 큰 데이터 분석 플랫폼 Taobao 및 다른 전자-상거래 거래 플랫폼, 같은 제 3 자 데이터 공유 거래 플랫폼.
큰 데이터 산업 레이아웃, 차이나 유니콤에에서 큰 산업 전기 가격을 구현 하 산시 이상 400000 원 전기를 저장 하는 하루 8000 캐비닛 프로젝트
서쪽 짠 새로운 지구에 계획 25 평방 킬로미터 정보 산업 단지, 첫 번째 대규모 데이터 처리 및 서비스 전문 공원에 중국-- 산시 성 및 2017, 전국 대규모 데이터 처리 및 서비스 산업 클러스터의 핵심으로 서쪽의 완성을 위해 노력 하 고, 2020 년 말에 의해 큰 데이터 산업 공원 깨달을 것 이다 50 십억 위안 출력 값 산시 성, 산업과 무역 부 부국장 Cai Suchang 말했다.
서버, 약 30, 000 원의 비용 하지만 유지 관리를 사용 하 여 각 구매에 대 한 바이 회사 비용 30, 000 원 이상, "이 경우 우리는 데이터 센터 에너지 절약 소비 되도록 계속 있다." "바이 기술 위원회 회장 첸 샹 말했다.
그것은 이해는 산시 성 큰 데이터 산업 레이아웃, 프로젝트 집계, 재정 지원, 인프라 건설 관련 정책, 산업 전기 가격에 큰 산업 기획의 실시를 포함 하 여 그리고 네트워크 수수료 면제를 공식화 했다. "전기 가격 현재 데이터 회사의 비용의 약 75%를 담당, 공원에는 3 명의 연산자와 국가 인구 정보 처리 및 백업 (사이 '는) 센터와 다른 프로젝트 정착, 중국 Unicom 프로젝트 8000 장 예를 들어, 1 일 400, 000 위안 이상의 전기 비용의 비용을 줄일 수 있습니다, Liu Yubin 도입.
큰 데이터의 도전 그냥 "하드웨어" 수준 아니다. "100 년 전, 의사, 의학의 모든 분 지를 이해할 수 있지만 오늘 의사는 질병 증후군, 3000 마약, 1100 시험 방법의 광대 한 지식을의 약 10000 종류를 직면 하 고" 말했다 우 Hequan, 국가 정보화 자문 위원회, 공학의 중국 아카데미의 학회 회원의 부 이사 큰 데이터 산업 데이터 분석 도구 및 산업 분석, 이해 하 고 같은 혁신적인 재능은 부족, "대용량 데이터 마이닝 개발 및 보안 및 개인 정보 보호, 동시에 중국 또한 부족 해당 법적 보호, 데이터 공유의 실현을 촉진 메커니즘 혁신에 대 한 필요 합니다." "
(책임 편집기: 유산의 좋은)