큰 데이터는 단지 http://www.aliyun.com/zixun/aggregation/8302.html "> 데이터 웨어하우징 기술 또는 BI (비즈니스 인텔리전스) 업그레이드 버전, 아니라 혁명." 큰 데이터 선언문: 두려움, 의심, 큰 데이터는 큰 변화 이다.
때 첫 번째 세계 혁명, 우리는 데이터의 수를 줄이기 위해 하는 방법과 그것을 보관 하는 방법에 대해 생각 했다 하지만 더 많은 데이터를 수집 하 고 분석 하는 방법. 그 당시, 우리 데이터의 볼륨에 의해 위협 받고 두려워 했다 하지만 우리의 사업을 개발 하 고 우리의 정부 및 사회 이해를 추가 데이터를 찾고.
나중에, 낮은 비용 및 가격 감소 디스크 및 스토리지 드라이브에 분산된 처리 상품 서버 클러스터의 트렌드. 우리가 수집, 처리 하 고 지금까지, 오랜 시간에 대 한 큰 데이터 분석 되었습니다 비록 우리가 사용 하는 방법을 여전히 효율적인 고 경제학의 부족. 이 큰 변화는 우리가 항상 알고 싶 었 했지만, 이전에 관여 하지 않은 데이터를 하지만 그래서 지금 우리는 두려워할 필요가 없습니다.
정의 큰 데이터 나 대용량 데이터의 기본적인 정의 수집 및 높은-기술 분야에서 아주 좋은 이벤트 기반 데이터의 분석. 웹 사이트의 분석 기능 보다 훨씬 큽니다 인터넷에서 데이터를 파생을 해야 합니다. 그것은 또한 센서 데이터와 관련 하 고 대부분의 우리는 최근까지 센서 데이터에 대 한 삭제. 지금, 큰 가치와 그 데이터 비즈니스 운영 및 고객과 상호 작용을 이해 하는 데 도움이 됩니다. 나를 위해, 이것은 표준입니다 큰 데이터 라 할 수 있다입니다.
그러나, 이벤트 구동 데이터 집합 용량은 너무 큰 트랜잭션 데이터베이스 시스템 효율적으로 작동 하지 않습니다. Hadoop, 복잡 한 이벤트 처리 (CEP), 및 대규모 병렬 처리 (MPP) 시스템 등 대용량 데이터는이 더 큰 작업을 위해 특별히 개발 됩니다. 미래에 거래 시스템을 개선 하지만 그들은 항상 장애는 그들이 하지 설계 하 고 적용 해야한다.
2012: 큰 데이터 나이?
큰 데이터는 주류 과학에서 전문된 기술 변환 지 고 기술 기업 기업에 대 한 독점 기술에 그것 응용 프로그램. 가용성과 설치 기준의 완화는 큰 데이터 요구의 분야에서 과학 및 첨단 기술 기업 보다 더 높은, 큰 데이터로 그것의 주류 도구, IT 분야에 큰 영향 있다. 그 이유는 우리가 대용량 데이터 클라우드 기반 기술을 활용 하 여 웹 브라우저를 사용 하 여 게임 업계로 얻을 수 있는 마이크로소프트 같은 회사를 참조 하십시오.
더 나은 기업으로 큰 데이터를 통합, 우리 기술의 구체화를 실현 한다과 운영 비용을 줄일 수 있습니다. 순간, 많은 큰 데이터 도구 원유 또는 비싼, 또는 작업을 수행할 수 있어야 하는 전문된 기술자에 의해 지원 됩니다. 그러나,이 상황을 점차적으로 변화 하 고, 그리고 그것은 측면에서 큰 데이터 혁명의 밝은 미래를 보여줍니다.
Spreadmarts 큰 데이터를 하지 않습니다 하지만 그들은 또한 그들의 자신의 역할 큰 데이터를가지고 있고 스프레드시트 모델을 사용 하는 데 사용 우리 작업의 수는 다른? 스프레드시트 기술 하 고 분석, 하지만 확실히 큰 데이터를 Excel 큰 데이터 집합의 이전 정의에 부합 하지 않습니다 때문에. 2007 년까지, Excel 스프레드시트의 이상의 16, 384 행을 처리할 수 있습니다. 그러나, 그것은 여전히 큰 열 등 데이터는 비즈니스 데이터의 큰 볼륨을 처리할 수입니다.
물론, 대용량 데이터 분석의 결과 수 있습니다 추가 계산 되며 excel 논의. 사실, Microsoft Excel, 하 둡, 그리고 큰 기호 데이터 기술에 연결 된 데이터 웨어하우스 인터페이스에 첨부 파일을 개발 했습니다. 큰 데이터 작업은 Excel과 거친 편집에 따라 분석 후 사후 생산 처럼.
다른 한편으로, BI (비즈니스 인텔리전스) 및 DW (데이터 웨어하우스)는 보완, 대용량 데이터에 대 한 좋은 것은. 큰 데이터 작업 및 이전 보다 상호 작용의 더 넓은 범위를 커버 하는 데이터 집합에 통찰력을 제공 하기 위해 뒤로, 전통적인 기법을 수 있습니다. 우리는 완전히 새로운 환경에 친숙 한 도구를 사용 하 여 겉보기 불가능 하거나 임의의 것 들에 대 한 액세스를 달성 하기 위해 계속 수 있습니다.
자연 언어 처리와 자연 언어 처리 (NLP) hadoop에 대 한 큰 데이터 솔루션 생성 되었습니다. 솔루션 파이썬 프로그래밍 언어 라는 NTLK (자연 언어 툴키트) 집합이 포함 됩니다. 또 다른 예는 아이폰에 애플의 Siri 기술의 응용 프로그램입니다. 사용자만 siri 이야기 하 고 현장에서 전문가의 큰 팀에서 답변을 얻을 수 있습니다. 흥미롭게도, 큰 데이터 기술을 서 면된 작품의 큰 숫자를 처리 알고리즘을 이해 등 자연 언어 기술 향상 도움이 됩니다. 그 결과, 대형 데이터 사용 하기 쉽게 될 것입니다.
(책임 편집기: 유산의 좋은)