최근에, 내가 참석 어떤 대학 세미나, 심포지엄의 정부 부처 및 기업 훈련 활동에 반환, 테마는 큰 데이터, 요즘, 주요 국내 신문 및 잡지도이 뜨거운 주제를 논의 하 고 하지만 난 발견 그 중국 사회 "빅 데이터" 개념에 아직도 일부 부정확 한 이해 또는 오해, 심지어 개념 특히, 국가 차원에서 큰 데이터의 전략적 중요성 과소평가 되 고 심화 될 해야 합니다.
작은 데이터를 큰 데이터
"대용량 데이터" 기술의 새 풍조는 하지만 역사적 현상 또한 점차적으로 형성, 특정 포인트는 정보 저장소의 증가 함께 인간으로 점차 실현 오프닝, 통합 및 데이터의 분석을 통해 새로운 지식을 발견 될 수 있는 및 새 값 생성, 따라서 데 려 "큰 기술", "큰 이익", "큰 정보"와 " 큰 개발 "및 다른 새로운 기회. 1980 년의 나이에 다시 큰 데이터 날짜 생각 하지만 단어 "데이터" 우리의 전통적인 이해에서 다르다.
"데이터"의 전통적인 의미에서 "수에 따라", 의미 하지만 정보 시대, "" 단어의 의미는 확장 하 고, 데이터를 입력 한 후 뿐만 아니라 참조 "숫자", 하지만 또한 총칭 모든 정보 텍스트, 사운드를 포함 하 여 컴퓨터에 저장 된 비디오 등. 더 중요 한 것은, 정보 기술의 진보와 함께 폭발, 특히 뉴 미디어, 데이터 수집, 보존, 유지 보수, 사용 및 기타 작업의 출현 후에 수가 되고있다 크로스-절단 현상 및 과제.
큰 데이터의 "큰" 아니다 표면, 그러나 그것의 잠재적인 "훌륭한 가치"의 "큰 수 용량". 우리 새로운 도구의 출현 때문에 과거에는 우리가 작은 데이터에서 큰 가치를 찾을 수 있는 보여 많은 보기가 있다. 미국에서는, 예를 들어 범죄 데이터와 교통 사고 데이터의 년의 20 개 이상 동일한 지도를 지도 이며 교통 사고 및 범죄 행위의 높은 지역에서 그리고 둘 다의 주파수에서 중복의 높은 학위를 찾을 놀. 이것은 법무부, 공동 미국 고속도로 안전 서비스 그리고 교통 사고 율과 범죄율 감소, 공통 관리 데이터의 "검은 반점"를 통해. 예를 들어 일부 학자는 최근 200 년 대통령의 세탁, 화이트 하우스의 이상에의 한 전자 기록 만들었고 분석, 몇 가지 새로운 결론. 이러한 데이터는 모두 정통 작은 데이터입니다. 이 작은 데이터는 수평에서 수직 축적에 시간의 일정 금액은 상세한 레코드 단위 및 다른 데이터 통합으로 생산할 수 있는 큰 가치를 보여줍니다. 이 관점에서 큰 데이터 또한 space-time의 2 차원에서 개체에 대 한 "홀로그램" 데이터로 이해 될 수 있다. 이 "홀로그램", 또한 "멀티 소스"로 표현 하는 큰 데이터의 시대에, 즉, 있다 동일한 개체 데이터 레코드에 서로 다른 방향으로, 서로 간에 데이터에 여러 소스.
또한, 전통적인 작은 데이터는 여전히 글로벌 데이터 기술 투자의 분포에서 절대 시작을 차지합니다. 따라 여 국제 데이터 그룹 (IDG), 2012, 작은 데이터 분석에 글로벌 투자 도구 34.9 십억 미국 달러, 그리고 큰 데이터 분석 도구 Hadoop 투자만 130 백만 미국 달러, 1% 미만의 전. IDG는 전통적인 작은 데이터 소프트웨어 기업 및 단체의 요구의 95%를 충족을 마칩니다. 현재, 산업 개발의 최신 동향은 "큰", "작은" 데이터 분석 도구 "구름" 마이그레이션 및 통합 하는 경향이.
큰 데이터의 전략적 중요성
큰 데이터의 의미는 "맥주와 기저귀"의 이야기에 국한 되 고 멀리는 우리가 지금 데이터 마이닝 및 정밀 마케팅을 통해 많은 보도에 양념. 사실, 데이터 마이닝, 빅 데이터 분야의 최전선에서 이지만 대신 기계 학습. 데이터 마이닝 숨겨진된 역사 법 및 데이터의 미래 동향 및 의사 결정자에 대 한 참조를 제공 합니다 특정 알고리즘을 통해 데이터의 많은 수의 자동 분석을 말합니다. 그러나 상승 기계 학습, 컴퓨터 알고리즘의 덕택으로, 데이터 마이닝에 비해 알고리즘 고정 되지 않습니다, 하지만 자체 조정 매개 변수 즉, 그것은 수 계산, 작업, 수 즉, 기계를 제공 하 여 "피드" 데이터, 기계 같은 학습 개선, 향상을 통해 사람들 더 정확한 마이닝 및 예측 기능을 확인 합니다. 이 기술은 "기계 학습" 이라는 것 때문입니다. 그것은 본질적으로 우리 인간 사회는 급속 하 게 움직이는 정보화 시대에서 정보 지식을 통해의 나이에 의미 하기 때문에 큰 데이터 혁신적인 현상 이라고 왜 근본적인 이유 이기도 합니다.
사회 형성에 큰 데이터의 영향 및 국가 전략의 중요성을 설명 하기 위해 하나 또는 두 개의 예제를 인용 수 있습니다.
이 년, 온라인 교육의 물결 강타 미국 교육 부문, 새로운 지능형 학습 플랫폼 혁신과 많은 초기 성공 되었습니다-첨단 분야에서 투자의 초점이 되고있다. Coursera, 유명한 온라인 교육 회사의 플랫폼을 통해 무료로 과정을 열고 프린스턴, 버클리, 듀크, 홍콩 폴 리 테크닉를 포함 하 여 전세계 30 개 이상의 대학과 계약에 도달 했습니다. 이 학교는 지금 동시에 배우고 세계 각국 사람들의 수천의 수백을 허용 하는 과정을 있다. 전 세계 학습자 수 뿐만 아니라 동시에 같은 교사 들 하지만 또한 같은 숙제, 학생 처럼 같은 성적 및 시험을 받을. 일부 학교는 값 본와이 지능형 학습 플랫폼의 잠재력, 심지어 그들의 자신의 독립적인 플랫폼을 구축에 투자를 시작 그리고 2012 년 5 월에에서 하버드와 MIT 발표 그것은 비슷한 플랫폼을 개발 하 고 무료로 세계에 개방 하는 달러의 10 억의 60 백만 투자할 것입니다.
이 학습 플랫폼의 광범위 한 관심사 및 미국에서 강렬한 토론을 자극 하고있다. 이유는 플랫폼은 렌즈, 비디오 너무 간단 하지만 학습자의 학습 행동 수 있습니다 자동으로 받기를, 유도 및 평가, 따라서 교사 얼굴--얼굴 통신 지침의 부족을 만들기 때문입니다. 예를 들어 마우스 클릭을 기록 하 여 컴퓨터 수 있습니다 슬라이드 시간에 숙박을 기록, 검토 한 후 잘못 된 답변에 당신을 판단, 다른 응답의 다른 지식 포인트를 다른 사람 그래서 지식 포인트를 반복 하거나 강조 하 고, 필요로 하는 무슨을 표현 발견 어떤 종류의 프레 젠 테이 션 또는 도구를 배우는 경우에 가장 효과적입니다.
그것은 큰 데이터 플랫폼은 강한 볼 어렵다입니다. 개별 학습 행동의 데이터 장애, 보이지만 그룹의 행동 선물 데이터에는 순서와 법률 데이터를 어느 정도 축적 때. 수집 하 고 많은 양의 데이터를 분석, 순서와 법률, 요약 하 고 다른 학습자를 대상으로 도움을 제공할 수 있습니다. 하버드 대학 및 MIT 세계에 그들의 학습 플랫폼을 열고 무료입니다, 그리고 목적은 또한 더 많은 학습자 연구, 더 많은 데이터와 데이터를 수집 하 게 하 고 싶지, 그들은 세계의 학습자의 행동 패턴을 공부 하 고 더 나은 지능형 학습 플랫폼을 구축.
데이터 기반 지능형 나이
이전 예제에서는 데이터의 기초는 조직의 부와 혁신, 되는 큰 데이터 실제로 영리 사회를 만드는 것입니다 보여줍니다. 어떻게 우리가 우리를 향해 이동 하는 스마트 사회를 이해 합니까?
이 문제를 이해 하는 열쇠, 인지 정보, 지식 또는 지성, 우리의 시간에, 그것은 캐리어로 데이터의 존재입니다. 데이터는 객관적인 세계의 기록 그리고 때 배경 데이터, 정보, 정보는 지식, 소스 정보는 법에서 정제 된 지식에 상승, 지식 정보의 기초, 컴퓨터, 네트워크 수를 사용 하 여 특정 지식 자동 차별, 인간 서비스에 대 한 조치를 취할 기계 지능 생산 됩니다. 현재, 과거에 인간의 기록의 범위 확대, 우리는 지금 무엇을 기록 하기로 고 미래에 우리는 어떤 시대와 지능형 시대 향해 우리의 진행을 촉진 것입니다 데이터 분석의 증가 능력을 기록 하지 않는 결정을 입력 해야 합니다. 지능형 나이의 특성은 그 유비 쿼터 스 컴퓨터와 네트워크 작동 하 고 지적인 사람 처럼 인 간에 봉사. 즉, 점점 더 많은 작업 컴퓨터 또는 로봇에 의해 대체 됩니다. 또한, 정확한 계산 및 예측, 사회 전체 수 처럼 수많은 크고 작은 기어 베어링, 연동, 일치 하는 치아, 데이터 최적화, 다양 한 작업, 협력을 통해 일상적인 관리 원활한 수 도킹, 사회 운영의 비용 감소 될 수 있다 크게.
위 예제를 다시 아니에요 어떻게이 지능형 학습 플랫폼 교육 산업에 영향을 미칠 것입니다 상상 하기 어렵다. 학교 가장 중요 한 교육 자료, 좋은 학교는 매우 부족 한, 가까운 장래에,이 지능형 플랫폼의 인기 때문에 엘리트 학교 될 것입니다, 즉, 제대로 처리 하는 경우, 중국의 부족 교육 자원의 효과적으로 완화 곧 것입니다. 개인에 대 한 학습과 평생 학습 수 있을 것입니다, 그리고 예를 들어 고 등 학생 시도 대학 과정, 캠퍼스를 두고 하거나 학생 들과 수업을 참석 하는 온라인 플랫폼에 로그온. 이들은 교육자 년 탐험 있을 꿈입니다. 하지만 동전의 면은 중국의 교육 산업 더 치열 한 글로벌 경쟁 및도 전에 직면. 과거에는, 학생 들은 학교에 대 한 경쟁 하 고 전 세계 학생 들을 위한 학교 수 경쟁 하는 미래에. 선진국에서 일류 대학 생존 및 개발 도상국에서 일반 대학의 쑤 셔 것입니다, 그리고 어떻게 일반 대학 학생 들을 유치 해야? 것입니다 그들은 거절? 교육 비디오 및 다른 학습 자료를 얻을 수 있는 최고의 이후 무료, 교사의 역할 필요 하지 조정할 수? 조정 하는 방법? 이 문제는 큰 데이터 시대의 주요 과제입니다.
지능형 학습 플랫폼은 교육 분야에서 큰 데이터 추세의 그냥 스프레이. 그것은 큰 데이터 인간의 사회 개발의 모든 측면에 영향을 미칠 것입니다, 모든 산업의 변화를 최적화, 그 역할은 제한 하기 어려운 말을 해도 과언이. 또 다른 인기 있는 용어, "스마트 도시", 예를 들어 보자. 최근 몇 년 동안, 둘 다 국내외에서 모두 지능형 도시 건물의 물결 사용 되었습니다. Guo Wei, 중국 디지털 보드의 회장에 따르면 국내 지혜 시에에서 선도적인 회사: 현재, 중국에서 60 개 이상 도시 구축 지능형 도시 "12-5" 계획에, 그가 믿는 그 스마트 도시 중국의 경제의 지속 가능한 개발을 위한 주요 원동력 될 것 이다. 하지만 더 높은 관점에서 지능형 도시 건설은 사실 도시의 포괄적인 데이터 관리의 큰 문제: 첫째, 데이터 이전,이 수집 되지 않습니다 장소에서 데이터를 수집 하는 주로 사물의 인터넷의 기술을 사용 하는, 두 번째는 시스템 통합;의 작업은 효과적으로 도킹 하는 다른 시스템의 데이터를 확인 하는 것입니다 우리 또한 사용 하 여 데이터 시각화의 기술을 공개 하 고 숨겨진된 지식을 대규모 데이터 표시 데이터에 지능 직관적인 방식으로 시의 관리자, 의사 결정자 및 대 중에 전달 될 수 있습니다. 즉, 데이터 수집, 통합, 분석, 디스플레이에서는 지능형 도시, 지능형 도시, 미래 핵심 데이터 기반 도시 되며 큰 데이터는 지혜 시의 뇌입니다. Guo 웨이 또한 지능형 도시 건설 정보 기술 사회 거 버 넌 스의 문제를 해결 하기 위해 사람들의 행복 지 수는 큰 데이터 및 값의 적용 하지 그래서 간단한 비즈니스 지역에서 서만 증명을 개선의 사용은 밖으로 지적 했다.
사회 형성 발전, 기업 혁신 가속화 및 선도 하는 새로운 경제 붐, 나 또한 지적 책 큰 데이터: 오픈 데이터를 큰 데이터도 수 있다는 투명 한 정부를 시작 하는 날카로운 무기 오는 데이터 혁명. 이것은 오늘 중국에 대 한 진짜 현실 이다. 그리고 이러한 전략적 고려 사항 때문에 정확 하 게 2012 년 3 월에에서 미국 연방 정부 발표 큰 데이터 연구 및 개발 작업, 그리고 큰 데이터는 인터넷의 역사에서 언급 한 국가 전략으로 높은 슈퍼 컴퓨터의 발사에 거 대 한 투자.
정부가 할 필요가
첫째, 정부 기관, 산업 단체 및 데이터 거 버 넌 스, 데이터 거 버 넌 스 위원회, 큰 데이터 관리 국, 데이터 거 버 넌 스의 초점 등의 협조 작업에 특별 한 데이터 관리 기관 설립 대기업 데이터 정 및 데이터의 품질의 일관성입니다. 대용량 데이터 시대에 다른 시스템과 통합된 메타 데이터 정의 대 한 필요성 간의 데이터 통합은 지금 중국 뿐만 아니라 세계에 대 한 도전. 각 필드 및 업계 데이터 표준을 잘 설립, 승수 효과가 있을 것 이다. 단일 엔터프라이즈의 경우 미래의 경쟁 노동 생산성 경쟁 보다는 오히려 지식 생산 속도, 데이터 분석 생산 가치 실현 가능성이 더 조각화를 배포 상업 과정에서 각 링크, 반환 데이터 마이닝 투자 또한 불확실성, 하지만 기업 지도자는 비전을가지고 있어야 합니다, 데이터 관리는 가능한 한 빨리 함께 작동 준비 하는 큰 데이터 시대에 기업의 경쟁력을 강화. 또한, 데이터 거 버 넌 스 조직의 머리는 조직의 수석 리더십 이어야 한다, 그렇지 않으면 표준 사전 수 없습니다 전체 상황에도 전체 산업 또는 조직 개선 수 있습니다.
둘째, 데이터를 엽니다. 키 데이터 증가를 통합, 하지만 무료 통합의 전제 조건 데이터의 개방 이다. 다른 당사자 무료로 사용 하는 개방형 데이터 원본 데이터와 인터넷에 다운로드 가능한 전자 형식에서 관련된 메타 데이터를 참조 합니다. 오픈 데이터와 오픈 데이터는 두 개의 서로 다른 개념, 공공 정보 수준, 조각, 오픈 데이터베이스 수준의 조각 이다. 개방 반드시 의미 하지 않는다 무료, 수수료의 형태로 기업 데이터를 열 수 있습니다. 개방 상태는 또한 레이어는 그룹, 조직, 사회 전체로 열려 있을 수 있는 있다. 큰 데이터의 시대에 개방형 데이터의 중요성은 혁신, 지식 경제, 네트워크 경제 발전을 촉진 하기 위해 자유롭게 흐름 데이터 생성의 가장 중요 한 데이터를 수 있도록 뿐만 아니라 알고, 시민의 권리를 충족 하 고 벌금 형식 변환 및 업그레이드에 광범위 한에서 중국의 경제 성장을 촉진에 뿐만 아니라.
셋째, 격려 및 지원 데이터를 기반으로 혁신 및 기업가 정신. 정책 지원의 전통적인 방법 선도적인 위치로 정부와 큰 데이터 산업 단지를 설정 하 고 편리 하 게 제공 수 있습니다 또는 효과적, 신진 기업에 대 한 현금 지원 하지만 더 효과적인 방법은 전체 사회의 힘을 동원 하. 예를 들어 데이터 오픈 소스 커뮤니티, 유사한 시민 단체의 지원을 통해 프로그래머의 협회 등 민간 단체의 건설 확산 및 대중화의 새로운 기술 및 사회 전체에 새로운 아이디어를 신속 하 게 홍보; 데이터 사용 및 혁신, 사회 전체 의견을 개방형 데이터 기반 응용 프로그램 개발 대회를 개최 되는 예를 들어 큰 지원 부여 주최는 정부, 기업, 자금 보상을 최고의 응용 프로그램을의 일정 금액으로 서 민간 부문의 창조적인 힘 영감 수도 있습니다.
4, 우리 사회 전체에 데이터 문화를 홍보 해야 합니다. 데이터 문화 사실을 존중 하 고, 합리를 옹호 하 고 정밀도 강조의 문화가 이다. 인정, 다시 역사를 찾고, 중국은 현상까지 데이터 문화의 부족 국가 우려, 중국 데이터의 신뢰성은 약한, 품질이 낮은, 데이터 정의의 일관성 있는 명백한 사실 이기도 합니다. 이와 관련, 정부에서에서 재생 해야 선도적인 역할 우선, 의사 결정, 하지만 여전히 효과가 있지만, 대용량 데이터 시대에 공공 의사 결정을 위한 가장 중요 한 기초 데이터 보다는 개인적인 경험 및 장, 과거 깊이 질량의 시스템이 될 것입니다, 작업 방법, 방문 하는 필드를 실현 하기 위해 데이터 거 버 넌 스의 개념을 홍보 공개 과학적 분석 결과 시스템에 의해 수집 된 데이터는 더 중요 하다. 정부는 증가 데이터의 규칙의 여론 선전, 공무원, 일반 교육 시스템으로 데이터의 지식을 넣어 고 "를 사용 하 여 데이터, 데이터 관리, 데이터를 사용 하 여 결정을 내릴 데이터 혁신을 사용 하 여" 전체 사회에서 문화 분위기와 시대의 특성을 형성 하기 위해 노력 한다.
마지막으로, 우리는 개인 데이터 보안 개인 정보 보호 법안을 단계 해야 합니다. 어떤 기술 양 날 칼, 큰 데이터도 예외는 아니다. 빅 데이터 시대에 효과적으로 데이터 개방을 추진 하면서 시민 들의 개인 정보를 보호 하는 방법 큰 도전 것입니다.
새 해 그냥 개막 했다, 중국 정부가 공식화 하 고 큰 데이터 관련 정책, 역사적 기회를 포착 하 고 중국 사회와 진행의 발전을 촉진 하는 특정 조치의 도입의 관련 부서를 희망. 2013 년에 중국의 큰 데이터 년 될 것입니다.
(책임 편집기: 유산의 좋은)