늦은 80 초 90에서 흥미로운 문구 널리 회람 되었다 국내외에서: 우리 지식의 신선한 물에 대 한 갈망 하지만 데이터의 바다에서 포장 되어있습니다. 이 문장을 생생하게 혼란과 무력의 광대 한 숫자 앞에서 사람들을 묘사 한다. 바로 그 때, 월마트, 세계의 비즈니스 거 인, "맥주와 기저귀 이야기"에서 그것의 광대 한 무역 데이터베이스. 미국인의 광대 한 숫자에 숨겨진 행동의 패턴을 밝혀 추론: 영 아버지 세 25-35 자주 그들의 아기에 대 한 작업, 그리고 30%-40% 후 기저귀를 구매 슈퍼마켓에 갈 사람들이 자신에 게 맥주 몇 병을 구입. 이 간단한 고객 행동 모델에 의해 영감, 월마트-마트는 상품의 레이아웃을 조정 하 고 판매의 상당한 증가에 따른 프로 모션 가격, 플롯. 현상을 과학적으로 지역 사회, 확장 "맥주와 기저귀 이야기" "협회 규칙 수집", 차례 차례로, 불완전, 시끄러운, 퍼지, 임의의 데이터를 암시적으로 알려진 사람에 게는로 정의 됩니다, 큰에 포함 되어 있는 지식과 정보를 추출 하는 과정의 눈길을 끌었다 데이터 마이닝입니다.
수요는 성공의 원천이, 서 부 개발 국가 데이터 마이닝의 폭풍우. 비즈니스 커뮤니티는 월마트의 급속 한 발전의 비밀을 발견 하 고 소송을 따라 있다. 통신 업계는 또한 끓는, 그들은 얼굴에서 가장 긴급 한 문제를 해결 하기 위해 애쓰고 데이터 탭이 예리한 무기를 사용 하는 회사. 업계는 또한 생산 및 관리 데이터의 산에서 관리 하는 의사 결정의 규칙을 밖으로 파고에 의해 행동.
지금, 세계는 "빅 데이터" 시대를 입력 하고있다. 미국 인터넷 데이터 센터 포인트 데이터는 인터넷에 1 년, 50%로 성장할 것입니다 2 년 마다 두 배로. 대용량 데이터 처리 및 분석을 통해 발굴 되 고 값은 모든 생을 유혹 하는 솔로몬의 보물 같은. 어떻게이 새로운 첨단 기술 세상을 바꿀 미래에? 세계의 빅 데이터 시장 배치 어떻게 인터넷 트롤을 것입니다? 어떤 잠재적인 하지 아직 개발 되었습니다 큰 데이터에 대 한?
기술 거 인 도박 큰 데이터
"중국 시장의 잠재력은 거 대 하 고 중국 빅 데이터 분야에서 세계의 나머지 부분 보다 더 빨리 성장할 것 이다 의심의 여지가 있다."
-보 이드 데이비스
큰 데이터의 상업적 가치 더 명백한 되는 때, 큰 데이터 전략적 레이아웃 및 데이터 개발의 인터넷 거 인에 점점 더 많은 기업 조인 기존 데이터 웨어하우스 만족 하지 것 이다.
경쟁 하기 위해 돈을 레코딩
큰 기술 기업으로, 그것은 돈을 구울 필요가 있다. 구글, 아마존, 마이크로소프트는 그들의 글로벌 네트워크가 작동 되도록 무거운 가격을 지불 해야 합니다. 올해 1 분기에 통계에 따르면,이 세 가지 기술 회사의 자본 지출 도달에 $4.6 십억, 약 65%에 의해 성장 했다. 특히, 구글, 그것의 "큰 데이터 제국", 불타는 돈을 위해 미친입니다. 2013 년 혼자, Google의 이상 2012 년에 $2.3 십억 조, 통계에 따르면 빅 데이터 증가에 지출.
월스트리트 저널 보고 5 월 8 일 올해 Google VCs 아이언 건강, 암 환자 데이터 공급자, 큰 데이터 회사에서 $130 백만 조 투자를 발표 했다. 그것은 Google VCs에 의해 만든 제약 소프트웨어 산업에서 가장 큰 투자 것입니다.
Google VCs는 의료 데이터 필드 대기업 포트폴리오의 중요 한 부분입니다. 그들은 이미 DNAnexus와 기초 의학, 종양을 치료 수 있도록 큰 데이터 분석 도구를 사용 하는 동안,에 대 한 검색 세계의 첫번째 게놈 데이터베이스를 구축 하기 위해 노력 하는 사람에 투자 했다.
그리고 그냥이 4 월, 그것은 거 대 한, 인텔, 또한 큰 데이터 소프트웨어 신인 Cloudera에 그것의 $740 백만 조 투자 발표 국제 다른 가장 큰 단일 투자 만든 인텔 데이터 센터 영역에서. 로이터에 따르면, 인텔 18% 계산에서 740 백만 미국 달러의 투자와 투자 준비 됩니다 Cloudera 4.1 십억 미국 달러의 평가에 나열.
레이아웃 중국 시장
구울의 IT 거 인 두 뒤에 돈을 큰 데이터 시장에 대 한 수요 이다. 세계의 빅 데이터 시장, 2012 년에서 시장 조사에서 투명성 이라는 미국 비즈니스 정보 서비스 회사에 의해 간행 된 보고에 따르면 $6.3 십억 조에 도달 했습니다. 이것은 강한 성장 모멘텀, 40%의 평균 연례 성장으로, 젊은 시장, 시장 규모는 2018에 50 십억 달러에 도달할 것으로 예상 된다.
업계 전문가 들은 지적 2012 및 2013는 통신, 금융, 의료, 미디어, 문화 및 다른 분야의 성능에 큰 데이터, 충분 하지 않으면 하지 되고있다 기업 투자의 중요 한 방향, 다음 큰 데이터 응용 프로그램 기업 투자의 주류에서 2014에 있을 것입니다. 중국, 세계에서 두 번째로 큰 경제에 대 한 큰 데이터 웨이브는 또한 강하다. 사용 하면서 큰 초기 단계에서 중국에서 그것은 또한 중국의 빅 데이터 시장은 거 대 한 잠재력을가지고 의미 합니다.
그것의 중국에 초점을 맞추고 디 컨설턴트, 산업 및 시장 개발, 2013 년에 중국의 큰 데이터 가리키는 응용 프로그램 응용 프로그램 시장 조사 중국의 큰 데이터 업계의에 백서 출판 시장 2015 년, 14.496 십억 위안을 도달할 것으로 예상 될 것입니다 어디 도시, 스마트 통신, 금융 3 대형 데이터 응용 프로그램 시장 2013 년부터 2015 년까지 연간 복합 성장률 도달 한다 114.4%, 97.3%와 104.1% 각각. 목표의 많은 it 업체 쉽게 방대한 양의 데이터에서 더 많은 비즈니스 가치를 발견 하는 모든 규모의 기업이 보다 효율적이 고 사용 하기 쉬운 대형 데이터 솔루션을 구축 하는.
리더로 서 큰 데이터 세계에서 그것은 가능성이 그 국제 그것 거 무시이 유혹 큰 케이크를 허용할 것 이다. 한 달 후에 인텔과 Cloudera 그들의 협력을 발표 했다 두 회사에서 임원 중국에 나타났다. 양쪽 모두 그들은 중국의 큰 데이터 기술 및 산업 발전을 더욱 촉진 되며 중국 시장 및 사용자가 더 나은 서비스 제공을 발표 했다. 그 중 Cloudera 조직을 설정 하는 비즈니스 중국에 올해 9 월 계획 이다, 비즈니스 직접 판매, 전문 서비스, 고객 지원, 교육 및 연구와 개발 작업을 다룰 것입니다.
"중국 시장의 잠재력은 거 대 한, 중국과 관련 된 경제 현상의 많은 거 대 한, 그리고 거기 때문에 의심의 여지가 있다는 세계에서 가장 큰 모바일 사업자 및 세계에서 가장 큰 은행." 같은 시간에 우리 또한 중국 되었습니다 많은 혁신적인 큰 데이터 응용 프로그램, 그리고이 거 대 한 잠재력은 우리는 큰 데이터 필드에 중국 성장 것 이다 세계의 나머지 보다는 빨리 생각을 볼 수 있습니다. "인텔의 이전 연습 및 대용량 데이터 기술 및 응용 프로그램의 개발을 장려 하는 중국의 산업 환경 뿐만 아니라 중국의 큰 데이터 산업 및 시장, 성공" 보 이드 데이비스, 부사장 겸 데이터 센터 소프트웨어 일반 관리자의 Intel Corporation 데이터 센터, 국제 금융 매일와 인터뷰에서 말했다. Cloudera 중국 시장 확대와 함께 작동 하도록 우리의 결정에서 핵심 요소가입니다. "
왜 국제 시장 조사 기관인 IDC 예측 A 또한 설명 합니다 그것은 거 대 중국 시장 가치. 기관의 예측에 따르면 2020 글로벌 새롭고 복제 정보 40ZB (ze 바이트 약어, 1ZB에 대 한 일보 = 10 조 바이트), 것입니다 2012 년, 중국에서 데이터의 양을 8ZB, 있을 것 이다는 12 시간 비교 데이터 볼륨, 최대 22 시간의 성장 중국의 2012 년을 도달 한다 그 또한 중국의 큰 데이터 및 데이터 분석을 위한 거 대 한 기회를 의미할 것입니다 21 %13 %에서 2020 년 2012 년부터 중국의 데이터의 글로벌 점유율을 증가할 것입니다.
큰 데이터 개발 필요 "징계"
"실제로, 데이터 분석 및 처리의 값은 몇 가지 실용적이 고 좋은 결과 보다는 너무 많은 데이터 수집 및 광산 생산을." "
-kord 데이비스
회사를 위해 큰 데이터 마케팅에 참여에 나서고, 금도 아니다 모든 위험 무료. 대상 공사, 미국 체인 스토어 그룹 4 월 29 일 올해 밥 DeRodes로 임명 새로운 최고 정보 책임자 최고 정보 책임자, 베스 야 곱, 데이터 유출 후 사임 대체 하.
데이터 마이닝 양날의 칼
2013의 끝에, 목표는 총 110 백만 사용자 정보 했다 새, 40 백만 사용자의 신용 및 직불 카드, 그리고 70 백만 추가 사용자 데이터를 포함 하 여 인정 했다. 그것은 데이터 누출 거의 대상의 1797 매장 또한 다음 2007 미국 백화점 소매 업체 TJX COMPANIES9000 백만 신용 및 직불 카드 데이터 유출 사건 큰 데이터 유출 사건 후 미국에서 커버를 보고.
데이터 때문에 누수를, 2014 년 2 월 1 일, 현재 대상 오프셋 $44 백만 조, 또는 실제 비용에서 $17 백만 조 보험 보상 추가 지출 수십억 달러의 61 백만 생성 했다. 회계 연도 2013-2014, 대상 백화점 당기 순이익은 520 백만 달러, 2012 46% 크게 감소 하는 961 백만 미국 달러의 같은 기간에 비해 같은 기간의 1.47 달러에 0.81 달러, 2012 미국 달러에서 주당 순이익 희석의 4 분기에 매출액 5.3% 감소 에 $2.152 십억 조, 미국에 동일 매장 판매 회계 연도 2012, 데이터 유출 때문에 동일한 기간에서 2.5% 했다.
대상의 경우 큰 데이터의 양 날 칼의 다른 측면입니다. Kord 데이비스, 큰 데이터 윤리의 저자: 균형 위험 및 혁신, 말했다: "실제로, 데이터 분석 및 처리의 값은 몇 가지 실용적이 고 좋은 결과 보다는 너무 많은 데이터 수집 및 광산 생산을." "
때문에 과도 한 데이터 마이닝, 엔터프라이즈의 행동 고객 불만 발생 했습니다, 고발 및 법적 소송 고객에 의해 강평 된다. 데이터 개인 정보 보호 관리 솔루션 공급자 TRUSTe A 조사 인터넷 사용자의 그 1/3을 발견 2013 년 9 월에에서 발표 한 회사의 웹 사이트를 사용 하 여 개인 정보 보호에 대 한 중지 이유 또는 완전히 회사와의 거래를 종료.
법적 규범은 또한 필요
결과적으로, 일부 기업은 큰 데이터 "자기"를 시작 했다. 예를 들어 노드 스 트 롬, 고급 미국 체인 스토어 고객 스마트폰을 사용 하 여 저장소의 WiFi 서비스에 연결할 때 구매자의 정보를 유클리드 기술 회사에서 센서를 사용 합니다. 하지만 법 이상 Nordstedt에 의해 사용 되는 개인 정보 보호 옹호에서 비판을 촉발 했다.
그러나, 개인 정보 보호 및 정보 보안, 기업 자기만의 문제는 명확 하 게 희망 찬 생각입니다. 올해 1 월, 미국 대통령 바락 오바마 데이터 회사의 잔인 한 성장을 효과적으로 법적 규제와 여론의 게임으로 제약 될 수 바라고 큰 데이터 및 개인 정보 보호 문제에 대 한 자세한 연구를 수행 하는 대통령의 고문 지시. 대통령의 과학 및 기술 자문 위원회는 또한 큰 데이터와 개인 정보 누출 사이 관계의 기술적인 측면을 탐구 하는 연구를 실시.
마이클 워커는 덴버, 미국에서 관리 파트너 시스템 통합 업체 및 정보 기술 서비스 공급자 로즈 비즈니스 기술입니다. 그는 지금 초안을 작성 한 행위의 12 페이지 코드 데이터 분석 및 데이터 과학자의 행동을 규제 하는 사용에는 데이터 과학자의 책임 및 역할에서 모든 것을 망라.
"회사는 또한 두 사용 데이터 정보 및 개인 데이터의 오용의 위험을 이해 하는 시작 됩니다. "일단 기업 들이이 아이디어를가지고 시작, 그들은 아주 많이 하 고 싶습니다 불필요 한 문제를 일으킬 수 없습니다 그들을 규제 하는 행위의 코드," 워커는 말했다. "
마이클 워커 말한다 데이터 과학자도 그들의 행동으로 의사 또는 변호사 징계를 도덕적 코드의 수를 사용 해야 합니다. 이 위해, 그는 관리 하 고 이러한 데이터 과학자의 행위를 규제 하 고 고객의 개인 정보를 보호 하기 위해 데이터를 분석 하는 사람들에 대 한 지침과 규범의 세트를 개발 했다.
슈퍼 인공 지능 미래를 구성
"대용량 데이터 인간 세계의 진정한 복원으로 미래에 어떤 시점에서 정의할 수 있습니다 그리고 우리의 욕망의 만족을 지속적으로." "
-화 진 펭
인기 영국 드라마 "까만 거울"는 같은 생각-도발 음모: 마사의 남자 친구 재는 소셜 미디어 팬, 거의 매일 트위터, 페이 스 북 같은 웹사이트. 모두 최악의 재 죽 었 다. 화산재의 장례식에서 마사의 친구 사라 애쉬를 사용 하 여 복원 "인생 트랙" 그는 소셜 미디어에서 떠난에서 재 수 그들은 말했다.
그래서, 데이터 분석 및 마이닝을 통해 인터넷 세계에서 화산재의 통계 비교 및 재 조직 다음 법을 발견, 모델 생성, 마지막으로 정확한 실현 마사 쪽 매우 강력한 등장 "예측", "큰 데이터 + 클라우드 컴퓨팅" "재건된 사람", 심지어 성격을 생각 하는 로봇 수 및 자동차 사고 때문에 성급 하 게 죽으면 [0.6% 자본 연구 보고서]. "로봇 재" 수 얘기에 반응 하 고 "진짜 재" 같은 생활 사람에서 배울
미래에, 큰 데이터 나타납니다 우리 같은 파괴적인 변화를?
올해의 바이 큰 데이터 회의 학회는 현재 베이징 항공 우주 대학 대통령 Huaijin 펭의 연설 과학의 중국 아카데미의 회원을 열어 "슈퍼 인공 지능: 대용량 데이터의 미래" 인공 지능의 미래 가능성에 도달할 수 있습니다 찾을 것으로 보인다.
슈퍼 인공 지능 달성, 화 진 펭은 먼저 "crowdsourcing" 개념을 언급 했다. 이것은 제프 하 우, 유선 제프 Hau에 잡지에서 기자로 2006 년 6 월에에서 제안 했다. "Crowdsourcing"의 제프 Hau의 정의: "는 회사 또는 조직 이전 자유롭고 자발적인 방식 중립 (및 일반적으로 대형) 대용량 네트워크에 그것의 직원에 의해 수행 되는 작업을 아웃소싱 했다." Crowdsourcing 작업은 일반적으로 개인에 의해 수행 하지만 협력 하 여 둘 이상의 사람을 필요로 하는 작업을 포함 하는 경우에 오픈 소스 사용 하는 개별 생산의 형태를 취할 수 있다. "
화-펭 가정는 현재 우리가 큰 데이터를 할 수 있는 소프트웨어 개발, 그래서 큰 데이터 크롤링 시 나 Weibo, 바이 색인, 바이 바 등 Taobao 트랜잭션 데이터를 읽을 수 있고 발견 그 사용자의 다양 한 감정과, 곡선의 요구 소프트웨어 개발자는 다음 운영자에 게 구름, 그리고 사용자 컴퓨터 모델링, 소프트웨어에 대 한 이러한 사용자의 동작에 따라 다양 한 행동, 그래서 생산 소프트웨어에 의해 생성 된 다양 한 구름에 참여 하도록 계획 그리고 소프트웨어 모델을 개발 하기 위해 이러한 데이터의 프레 젠 테이 션에 따라.
이것은 고도로 정밀한 인터랙티브 데이터 마이닝 기술, 제공 된 가능한 모든 솔루션 및 저장 문제. 큰 데이터 소프트웨어의 미래는 고유의 형태 되지 않습니다 하지만 상수 데이터에 따라 자동으로 슈퍼 생태에서 변화, 홍보, 하지만 몇 가지 기능을 구현 하는 그들을 위해 그리고 홍보, 사용자의 요구는 자연스럽 게 노출 되도록 알고리즘 엔지니어에 의존 하는 제품 관리자에 의존 하지 않을 수 있습니다.
같은 대형 데이터 소프트웨어를 생성할 수 있습니다 사실이 라면, 가슴 큰 데이터의 현재 정의 완전히 전복 될 것 이다 보기를 입력 합니다. "빅 데이터는 미래에 어떤 시점에서 정의할 수 있습니다: 인간의 세계, 그리고 우리의 욕망, 우리가 뭔가 대해 결정을 그것에 의존 하 고 우리가 직접 우리가 할, 원하는 것을 얻을 그것에 의존 하는 지금 우리의 행동 우리의 결정의 일부가 되는 일단의 지속적인 만족의 진정한 복원. "
전체 육군 중국 큰 데이터에 대 한 준비
-인텔 회사 데이터 센터 부사장 사장 겸 데이터 센터 소프트웨어 부서 총괄 매니저 보 이드 데이비스 인터뷰
Cloudera 회사 공동 창립자, 회장, 수석 전략가 마이크 올 슨
국제 금융 신문: 왜 인텔과 Cloudera 선택 서로 다른 전략적 파트너로?
보 이드 데이비스: 우리 기술 달성 하 고 경제 발전을 촉진 하기 위해 최선을 다하고, Hadoop은 매우 기본적인 기술, 새로운 방법을 나타내는 정보를 사용 하 여의 경제 발전을 촉진 사용할 수 있습니다. Cloudera과 협력 함으로써, 인텔은 우리의 성장 전략에 맞춰 우리의 칩을 더 잘 맞게 Hadoop 등 큰 오픈 소스 데이터 소프트웨어 플랫폼을 함으로써 프로세스에 참여할 수 있다.
마이크 올 슨: 사물의 인터넷의 시대 거 대 한 될 것 이다, 용량, 사용 그리고 우리를 캡처 및 데이터를 분석 하는 강한 능력을가지고 보다 훨씬 큽니다. 이 분야에서 글로벌 리더로, 인텔과 Cloudera의 협업 칩에 더 많은 혁신을 일으키 다 것입니다 하 고 더 많은 비즈니스 사용자가 도움이 될 것 입 소프트웨어 할 위험 큰 데이터 산업 및 응용 프로그램의 개발을 운전할 수 있습니다 제어 및 데이터 분석.
국제 금융: 중국의 현재 큰 데이터 산업 및 시장의 주요 매력은 무엇입니까?
마이크 올 슨: 중국의 의료 산업, 스마트 시티, 지능형 교통, 금융 서비스, 통신, 등, 보이고 있다 기회의 많은 중국의 빅 데이터 시장에서 광범위 한 관점에서 인터넷은 또한 거 대 한 성장 엔진 것, 더 많은 산업 및 분야, 관련 응용 프로그램 포함할 수 있습니다 믿습니다. 교통 및 제조 등 그것은 사물의 인터넷 큰 성장 효과 가져올 것 이다 또는 더 큰 시장 기회를 만들 생각.
국제 금융: 큰 데이터 응용 프로그램은 중국 시장에서 직면할 것 이다 도전 독특한 무엇입니까?
보 이드 데이비스: 빅 데이터에 응용 프로그램 모델, 중국 및 세계의 나머지는 상대적으로 비슷한, 주요 차이점은 중국의 인구 이며 경제, 시장 및 기업의 크기 보다 큰. 따라서, 기업 및 정부 지도자 상상력과 창의력, 최대한 발휘 하 고 더 지속적으로 개선 하 고 새로운 서비스와 경험을 만들기 위해 데이터의 방대한 사용 하도록 해야 합니다. 또한, 관련 법령 및 규정 및 정책 과제 목표는.
국제 금융 신문: 어떻게 우리는 빅 데이터 시대에 사용자 데이터의 보안을 보호 해야 합니까?
보 이드 데이비스: 데이터 개인 정보 보호 정책 또는 개인 정보 보호는 많은 산업, 특히 금융 부문의 또는 의료 산업에 중요 한. 구글, 페이 스 북, 야 후 그냥 큰 데이터 플랫폼을 개발 하기 시작 하 고, 보안은 안 좋은 일 하 고. 하지만 지난 몇 년 동안 데이터 보안의 수준, 개인 정보 보호의 수준을 매우 신속 하 게 개선 하 고 관련된 보안 기술, 금융 서비스 및 의료 산업 사용자는 배포 및 응용 프로그램의 많은. 인텔, 우리 오픈 소스 프로젝트, 코뿔소 그리고 그것의 보안 및 암호화 기술 플랫폼 전반에 걸쳐 아주 잘 하고있다. Cloudera에 대 한 데이터 보호를 위한 또한 긴밀 하 게 통제 될 수 있는 보안에 초점을 맞추고 있다 센 프로젝트도 있습니다. 이제 우리의 협력 더 나은 데이터 보안 및 개인 정보 보호 기능을 얻을 수 있습니다. 데이터 보안 업계 전반에 걸쳐 모든 제조 업체는 항상 목표에 대 한 노력에 대 한 필요는, 우리의 노력은 지난 5-6 년 보다 더 많이 만들었습니다.