빅 데이터 시대 비즈니스 기술 의료, 정부, 교육, 경제, 인문 및 사회의 다른 지역에서에서 미국 사회의 모든 측면을 동요 했다 그리고 삶의 모든 생 업에서 transformative 세력을 양산 하고있다.
미국에서 큰 데이터 풀 스윙에 성장 했다. 정부 부처, 그것 기업, 소매, 전통 산업, 무슨 큰 데이터 가져올 수 있는-비록 이러한 "초기 단계"로 간주 됩니다-미국에서와 같은 건강 관리, 인터넷 및 소프트웨어 및 하드웨어 회사 모두 보여주는 큰 데이터 나이 비즈니스 기술 건강 관리, 정부에서에서 미국 사회의 모든 측면 동요 했다 교육, 경제, 인문 및 사회의 다른 영역.
기본 및 분화 배경의 중요성 때문에 현재 과학 및 학술 커뮤니티도 예측 했다 큰 데이터, 기술 및 개념 자체는 악명 높은 실리콘 밸리의 피해자 되지 않도록 것 "기술 성숙 곡선". 이 곡선 후 새로운 기술이 탄생, 뉴스 미디어와 학술 회의 대 광고, 추세 하단에 떨어질 것 이다, 많은 신생 개발의 특정 단계까지 불안정 하 게 될 다시이 곡선 클라우드 컴퓨팅은 폭발 하 고 경험, 큰 데이터는 매우 가능성이 "탈출"을 보이고 있다.
이유 중 하나는 현재 미국에서 "빅 데이터"의 개념은 데이터 (TB)의 많은 수 및 많은 양의 데이터, 또는 소위 "4 V" 간단한 개념을 다루는 기술 보다 훨씬 더 하지만 그것은 사람들이 대규모 데이터를 기준으로 할 수 있는 커버 이러한 것 들 소규모 데이터에 근거 하 여 달성할 수 있다.
그래서 변화는 피할 수 있을 것입니다. 큰 데이터의 숙달의 정도 경제적 가치의 근원으로 변환할 수 있습니다.
빅터 Maire Schoenberg, 빅 데이터 시대의 저자 기초와 큰 데이터 나이에서 발생할 수 있습니다 값 변경에 대 한 그들의 판단의 결과 업계 및 미디어 사람들의 수를 강조 하기 위해 지난 달 중국에 왔다. 리포터의 질문에 대 한 응답, 빅터 이다 우리가 논의 하는 사업 회사의 양식을 지금 이전 빅 데이터 시대의 패턴 이므로 기존 패턴에서 패턴을 찾는 빅 데이터 시대에 문제가. 우리는 새로운 사고를 사용 하 여 새로운 비즈니스 모델, 기업 간의 사회적 관계, 정부, 사업 및 다른 관계를 포함 한 모든 것을 측정 해야 합니다.
큰 데이터의 과학적 사회적 가치는 여기에 구현 된다.
변경 된 정치 정부
미디어의 약간 과장 하지만 크게 사실 케이스는 뒤에 미국 대통령에 게 올해는 오바마의 성공적인 재선 수십 회원의 데이터 분석 및 발굴 팀은 중요 한.
팀은 이미 존재 하 고 2008 년에 오바마 캠페인에서 역할을 했다. 이 시간, 그들은 마지막 사람의 크기 5 배 이상 시간 보내게 하 고 더 광범위 하 고 심층적인 데이터 마이닝 했. 그것은 오바마 고정 효과적인 유권자, 광고 및 모금에 역할을 할 수 있습니다. 그것은 미스터 오바마 거의 두 배 그의 라이벌 미트 롬니 제기로 일반 시민에서 많은 돈을 제기 했다는 밖으로 변합니다. 한 조사에 따르면 오바마 팀 첫 100 백만 달러, 작은 기부금 보다 250 달러, 그리고 돈 같은 금액을 인상 롬니 팀에서에서 98%,이 비율이 31%입니다.
캠페인 팀 대변인 벤 LaBolt의 낱말에서:는 오바마 팀은 "핵 코드"-데이터 미트 롬니 물리칠 수 있는 가장 근본적인 장점입니다. 더 많은 "극단" 오바마의 승리에 대 한 이유는 경제, 외교 정책 또는 여성 문제, 아니라 큰 데이터를 이기려면 인수입니다.
물론,이 인수는 무리, 하지만 그것은 여전히 볼 수 있습니다 미국 정치 또는 과학 및 기술의 성장 영향으로 정치인, Xu Zixuan, 누가 미국에서 많은 정치인 지금 소셜 네트워크에 큰 중요성을 첨부는 최근 살롱에 게, 오는 데이터 혁명의 저자에 따르면 데이터 마이닝 및 데이터 분석에서 혜택을 기대 하고있다. 하지만 데이터 혁신 시민, 정부, 사회 다양 한 도전과 변화, 사람들에 이미 깊이 뿌리.
하지만 소셜 미디어 분석 "빙산의 일각" 빅 데이터의 유일한 부분입니다.
현재 인식된 범주, 대용량 데이터, 데이터 자체의 가치 사슬에서에서 기술과 생각 세 가지 측면은 핵심 경쟁 도메인, 소셜 미디어 분석 데이터 분석 기술 수준 하위 도메인, 또한 전통적인 데이터 마이닝 카테고리 새로운 변종으로 간주 될 수 있다.
데이터 필드에서 선도적인 위치를가지고, 미국 큰 했다 어디 정부 차원에서 변화가 너무 분명 그들은 심지어 국가 전략적 수준에서 오바마 행정부에 데이터의 가치를 제기 했습니다 이러한 세 가지 수준에서 진보 발표 2012 년 3 월에에서는 "빅 데이터 연구 및 개발 계획." "백악관 성명 공개적으로 말했다:" 크고 복잡 한 디지털 데이터 세트 로부터 지식과 아이디어를 추출 하는 능력을 개선 하 여 우리는 과학의 속도 가속 및 공학, 국가 안보를 강화 하 고 교육 연구를 변경할 수 있도록 약속 드립니다. "
이 계획, 국립 과학 재단, 국립 보건원, 에너지 부, 국방부의, 사역의 방위 고급 연구 프로그램, 지질 조사 등 6 연방 부서는 200 백만 달러 투자 계획 액세스, 조직 및 디지털 데이터의 많은 수에서 발견 정보 수집 향상을 출시 될 것 이라고 발표 했다 진행 중인 연방 정부 계획 기회와 큰 데이터의 과제를 해결 하 고 업계와 함께 작동 하도록 계획에 대 한 자세한 내용은, 대학 지역 사회, 비영리 단체 및 관리자 큰 데이터에 의해 생성 하는 기회를 활용 하 여 연구.
건강의 국가 학회, 인간 유전 가변성 연구의 데이터 세트를 무료로 만들 것입니다 국제 천 사람 게놈 프로젝트에 의해 시작 액세스 및 연구원, 국립 과학 재단 그리고 건강의 국가 학회에 의해 사용 핵 과학 및 기술 도구를 개선 하기 위해 대용량 데이터에 대 한 공동 입찰을 실시 한다 큰 데이터 집합의 넓은 범위에서 중요 한 정보를 추출 하 고 관리, 분석 하 고 그것을 시각화 하는 능력을 효과적으로 개선, 국방부 약 $250 백만 년 일련의 혁신적인 방법으로, 지 각, 인지 및 의사 결정 지원의 결합을 통해 대규모 데이터를 사용 하 여 목표로 하는 다양 한 군사 부서에서 연구 프로젝트에 투자할 계획 큰 데이터의 의사 결정 능력을 강화, 미국 에너지 부는 확장 가능한 데이터 관리와 시각화 연구소 (SDAV) 데이터를 효과적으로 관리, 그들의 생물 학적 및 환경 연구 프로그램, 미국 핵 데이터 프로그램 및 다른 연구 결과 홍보 과학자 수 있도록 설정 하는 달러의 25 백만 보낼 것입니다...
오바마의 지 정부 여, 결과로 400000 연방 정부 원래 데이터 집합 완전히 2009 Data.gov 이후 개설 되었습니다. Data.gov는 새로운 "오픈 소스 정부 플랫폼"의 채용을 발표 했다 데이터를 관리 하기 위해 코드 국가 개발자 들에 게 열려 있을 것입니다. 이 관점에서 국가 혁신 전략, 국가 안보 전략, 국가 ICT 산업 발전 전략 및 교차로 및 핵심 분야의 국가 정보 네트워크 보안 전략 큰 데이터 되고있다.
물론, 지금부터, 그것은 조금 과장 큰 데이터 변경 미국 정치 또는 정부, 하지만 다른 수준에, 미국 정부의 오픈 데이터 서비스 변환 세계의 최전선에 있다.
산업 및 산업 변경
큰 데이터 값 자체 인식 및 채굴, 기반-데이터. 우리는 디지털화는 단순히 아날로그 데이터의 변환 전 일상 생활, 생산 및 상거래의 현상 같지는 형태의 집계 분석 번역의 과정은 컴퓨터 저장 및 분석, 촉진 하기 위하여 이진 코드를 사용 하 여 데이터를 동일시 수 없습니다.
그것은 삶의 모든 산책-에서 변화의 힘을 형성 하고있다이 과정 때문에 큰 데이터 나이 새로운 기능: 대량의 데이터를 분석 하 여 가치 있는 제품 및 서비스, 또는 통찰력을 얻을 수 있는 전례 없는 방법.
일 슈투트가르트, 감독의 CAS의 컴퓨팅 연구소, 말했다, "대용량 데이터 미래에 가능성이 될 새로운 산업 및 큰 데이터 자체는 또한 네트워크에서 뿐만 아니라 인터넷 업계를 넘어, 생물 유전자 자체는 또한 큰 데이터, 각 종족의 유전 데이터 많은 학술 가치, 비즈니스 가치를 생산할 예정 이다. "이 같은 성명에 대 한 기준이 없다.
미국 시장, 인터넷 산업, 비즈니스 인텔리전스 및 자문 서비스에 자리를 차지 하는 경우에서 소매 업계는 대부분 혜택을 하지만 의료, 건강, 교통, 물류 및 심지어 생명 공학, 천문학 및 다른 분야를 시작 했습니다 "" 큰 데이터의 가치를 인식. 사실, 다양 한 산업 및 미국에 있는 응용 프로그램에서 큰 데이터 응용 프로그램 나타 났 있다.
인터넷 업계, 2008 년 초에 야 후 만들기 시작 했다 큰 데이터 기술, 데이터, 200PB 이상의 일일 분석 수 있도록 야 후 서비스 더 많은 사용자, 사용자와 고객에 더 가까이. 그것은 검색, 광고, 사용자 경험, 그리고 사기 디스커버리를 포함 한 야 후 그것은 시스템의 모든 측면을 함께 협력 하 여, 각 사용자에 대 한 깊은 이해를 얻기 위해 아마존에서 각 사용자의 구매 행동, 정보를 얻는 뿐만 아니라 또한 그들의 사이트에 모든 사용자의 동작을 기록 이러한 데이터의 효과적인 분석 아마존 고객의 구매 행동 및 환경 설정, 완전 한 이해를 가능 하 게 하 고 큰 혜택 상품, 재고, 창 고, 물류, 및 광고 비즈니스의 범주에 있다.
건강 관리 응용 프로그램은 또한 폭발 일자리는 큰 데이터를 암 치료를 지원 하 고 있다 환자 진동 모니터링을 스마트폰 애플 리 케이 션을 사용 하 여도 덴마크 암 협회를 사용 하 여 많은 연구 휴대 전화 사용이 발암 성 여부, 환자의 투숙 률 분석을 마이크로소프트 같은 회사는. 가장 주목할 만한 경우 Google에서 온 몇 주 전에 돼지 독감 발발 2009 년 때 엔지니어는 인터넷에 거 대 한 Google 출판 저널 자연에에서 돋보이는 종이. 그것은 공중 보건 관계자와 컴퓨터 과학자, 라고, CDC, 같은 구글 독감 확산 하 고 그들의 판단 했다 그래서 그것 2 주 독감 발발 후 할 수 없을 것 이라고 적시 말할 수 충격. 구글 5 비교 수 있었습니다 발견 0 가장 자주 미국 CDC의 데이터 항목에서에서 검색 2003 2008 년 온라인 검색 사람들이 독감 감염 여부를 확인 한 후 계절 독감 전송 중. 수학적 모델을 처리 한 후 그들의 예측 97% 공식 데이터와 상관. 그래서, 돼지 독감 발발 2009 년 구글 공식 데이터의 습관적 인 지연 보다 더 효과적이 고 시기 적절 한 표시 될 때. 공중 보건 기관에서 관리 매우 중요 한 데이터를 받았습니다.
소매 산업을 언급 해야 합니다. 사실, 월마트-마트, 테 스 코, 영국의 소매 거 대 한, 등 거 인 데이터에서 큰 혜택을 얻고 있다 하 고 따라서 그들의 산업의 장 수를 통합. 예를 들어 테 스 코, 되고있다 "십 대 임신"의 일반적인 경우, 세계에서 두 번째로 큰 소매 이해 어떤 사용자의 학교 아이, 등 손님, 패스트 푸드, 단일, 가족 등의 "카테고리" 전체가 있다. 그리고 이러한 분류와 같은 메일 또는 사용자의 승진에 보낸 편지 매우 개인화 될 수 있다, 매장 프로 모션 또한 주변 사람들의 기본 설정에 따라 수 있는 사업 활동의 수행을 바탕으로, 소비 시간을 더 타겟, 상품의 흐름을 향상 하기 위하여. 이것은 테 스 코, 테 스 코 한 시장 홍보 만으로 350 백만 년 파운드의 저장 수에 대 한 수익성 보상 이다.
또한, 에너지 업계에서 SaaS 소프트웨어 회사 Opower 데이터를 사용 소비자 전기에서 에너지 효율을 개선 하 고 주목할 만한 성공-미국에서 가정용 전기의 비용을 분석 하 여 전기를 사용 하 여 인접 이웃 비교 전력 회사의 번호로 opower 달성 서비스 되는 가족 전체 지역 또는 전기 소비 절약을 장려 하는 미국에서 비슷한 가족으로 동일한 수준에 그들의 전기는 보여주는 매달 마다 비교 보고서를 받게 됩니다. Opower의 서비스는 미국에 있는 가구의 수백만 덮여으로 보고 하 고 미국 소비자 전기에 대 한 1 년 500 백만 달러 저장 것으로 예상 된다.
언급 하는 가장 중요 한 것은 바이오 정보 업계. 바이오-정보-급성장 산업 이후 인터넷 산업 이며까지 인터넷에서 생성 하는 데이터를 초과 하는 것입니다: 인간 0과 1, 가상 세계를 만든 창조 자/c/t/g 4 요소와 생물을 창조 하 고 생활, 개발 및 멸종의 신비 모두 했다. 시퀀싱 기술의 발전, 게놈 넓은 시퀀싱 가격 감소 되었다 $ 오늘날의 수천 수십억 달러의 수백에서 10 년 전, 더 많은 사람과 종 DNA 정보를 얻을 수 있습니다. 개별 전체 게놈 정보 수집 가능 하 게 개별된 진단 및 치료 서비스. 빅 데이터 시대에 모든 것이 가능, 그리고이 변화의 모든 경험 되는.
값 및 판도 바꾸고 되 고의 생각
사실, 정보 변경, 20 세기의 끝부터 일어나 고 있다 하지만 그것은 기술에 초점을 맞춰 왔다 그리고 큰 데이터 나이 저희가 정보 자체에 초점을 시작.
데이터는 항상으로 분류 되었습니다 "정확" 하 게, 하지만 빅터 Maire Schoenberg는 "정확도와 강 박 관념은 프레임 및 전통적인 데이터베이스에 적용 되는 데이터의 5%만 정보 및 시뮬레이션 된 나이의 부족의 제품." 모호성, 비 프레임 데이터의 다음 95% 악용할 수 없습니다, 부정확, 수락에 동의 하지 않으면 우리는 세계의 창에서 결코 세트 발을 열 수 있습니다. "
즉, 큰 데이터 전체 샘플 시대에 대 한 간단한 알고리즘 작은 데이터와 복잡 한 알고리즘 보다 더 효율적입니다. 구글의 번역 시스템 잘 받았지만 IBM Candide 시스템, 무 겁 게 투자 했다 하지만-서로 다른 언어로 번역 된 문서의 페이지의 수십억의 수만의 고르지 못한 질에 오히려 재판 될 수 있다, 언어 자체 데이터 언어 잘 정확 하 게 3 백만 문장을 번역할 필요는 없습니다. 이 예제는 우리가 더 이상 필요가 전체 분석에 특정 데이터 요소의 부정적인 영향에 대해 걱정 하지만 오히려 수락 하 고 데이터의 과다에서 혜택 보다는 높은 비용에 모든 불확실성을 제거 의미 합니다.
큰 데이터의 과학적 사회적 가치는 여기에 구현 된다. 한편으로, 큰 데이터의 숙달 정도 경제적 가치의 근원으로 변환할 수 있습니다. 하지만 한 가지 문제는, 다른 한편으로, 큰 데이터 나이 세계의 모든 측면을 동요는, 의료, 정부, 교육, 경제, 인문, 및 다른 지역 사회의-간단한, 비즈니스 기술에서 아마존 우리가 원하는 서를 추천 하는 데 도움이 수, 구글 관련된 사이트를 정렬할 수 있습니다. 페이스 북 알고 우리의 환경 설정, 그리고 링크 드 수 있습니다 우리가 아는. 물론, 동일한 기술은 또한 질병을 진단, 치료, 추천도 잠재적인 범죄자 식별을 사용할 수 있습니다.
더 나은 유례는: "20 세기 석유 왕의 시대 라면, 21 세기 데이터-킹 시대, 21 세기 데이터의 값은 20 세기의 석유에 해당 될 수 있습니다." "그것은 주목할 만한 현재 인터넷 지향 기술 및 서비스의 기능 대규모 데이터 처리 및 마이닝 충분히 멀리, 미래 큰 데이터 발굴, 새로운 사업 형태, 새로운 기업 및 새로운 서비스의 많은 결과의 광대 한 수에서 더 많은 중요 한 데이터는 것입니다."
하지만 큰 데이터 변경의 힘 보다 더 많은입니다-핵심 명제는 그 많은 참조 응답, 아니라 최종 답변을 제공 합니다. 때문에 그것은 원인에 대 한 욕망을 포기 하 고 그냥 관계에만 초점을 무엇 인지, 왜-그것은 완전히 현실의 우리의 이해, 우리의 결정의 기준으로 근본적으로 도전 될 것 이다 그래서 고 대 시대의 연습 반전 모르고. 이 경우에, 큰 데이터 정보 기술 뿐만 아니라, 투명 한 정부를 시작, 산업 기업의 혁신을 가속 사회 변화를 리드 하는 날카로운 무기 분야에만 혁명은 인터넷의 발명과 같은 것입니다.
이 관점에서 생각 패턴 및 관리 변화에 혁신은 피할 수, 그리고 데이터 기반 기업 및 정부 가능한 되고있다.
미국에서 큰 데이터의 파노라마, 생활, 일 및 생각에 큰 변화가 일어나 고 있습니다.