"인터넷 것 들의"와 "클라우드 컴퓨팅", IT 업계 용어 큰 데이터 떠오르고 있다. 오늘, 큰 데이터도 비즈니스와 금융 원, 큰 관심을 자극 하고있다 고는 큰 데이터는 데이터 응용 프로그램 및 의사 결정 지원에 대 한 효과적인 도움말을 제공와 인터넷의 피할 수 없는 개발 동향 그리고 클라우드 컴퓨팅 믿어진다. 큰 데이터 아직 정의 되지 않은 균일 하 게, 그리고 자주 많은 양의 데이터와 다양 한 형태의 데이터와 구조화 되지 않은 데이터를 것으로 간주 됩니다.
여기 우리가 먼저 몇 가지 개념, 구조화 된 데이터, 반구조적된 데이터 및 구조화 되지 않은 데이터 이해. 구조적된 데이터 그것 그것 년 동안 애플 리 케이 션을 지배 하고있다 관계형 데이터베이스에서 찾을 수 있습니다; 그리고 전자 메일, 워드 프로세싱 파일, 그리고 웹, 뉴스 발표의 많은 수를 포함 하 여 반 구조화 된 데이터, 콘텐츠, 구글과 바이 두 존재, 및 구조화 되지 않은 데이터 소셜 네트워크에서 널리 발견 되는 이유는 IoT, 기반 전자 상거래입니다. 소셜 네트워크, 모바일 컴퓨팅 및 신흥 센서와 같은 새로운 기술, 구조화 되지 않은 데이터에 데이터의 85% 이상 보고 됩니다.
많은 사람들이 생각 하는이 방대한 이기종 데이터 포함 거 대 한 부-이러한 구조화 되지 않은 데이터를 활용할 수 있는 사업, 통합 회사 의사 결정을 위한 기초 것 보다 포괄적이 고 정확한 과학, 스포츠, 광고 및 공중 보건의의 다른 지역에서; 데이터 기반 검색 및 의사 결정을 향한 추세 이기도합니다.
의 큰 데이터에 대 한 운전 요소는 대형에서 주로 기업, 구글, 아마존, 차이나 모바일, 알리바바, 저장 하 고 보다 최적화 된 방법으로 데이터를 분석 하는 등. 또한, 보건 의료, 지리적 공간 원격 감지 및 디지털 미디어 등 산업에 큰 데이터 요구 사항이 있습니다. 시장 조사 회사, 다음 10 년에서 2020 년에서 2009 년 44 시간으로 증가할 것으로 예상 하는 디지털 정보의 총 수에 따라 글로벌 데이터 사용에 대해 35.2ZB를 도달할 것 이다 (1ZB = 10 십억 TB).
큰 데이터 "4v + 1 c"의 특성을 선물 한다: (1) 다양 한, 다양 한 코딩 방법, 데이터 형식, 응용 프로그램 기능 및 여러 정보 소스를 유형이 다른 데이터를 통해 대규모 데이터에 의해 생성 된 장비의 다양 한 (2) 볼륨의 많은 수를 차이의 다른 많은 측면에서 큰 데이터 데이터 규모는 매우 큰, 인터넷에 현재 정보 흐름 보다 훨씬 더 큰, PB 수준 정상 될 것입니다; 그리고 (3) 속도, 인식, 전송, 의사 결정, 대용량 데이터, 실시간 데이터 처리의 제어 오픈 루프 "현재 결과"를 전통적인 데이터베이스 쿼리 메서드를 통해 매우 높은 수요 모든 값을 가질 가능성이 높습니다; (4), 데이터, 도착 하 고 활력과 데이터베이스에서 특정 시간과 공간 의미, (5) 복잡도, 데이터를 영구 저장소의 처리는 더 이상 큰 데이터 처리에 적용 새로운 방법은 통합된 액세스 및 다른 유형의 데이터에 대 한 실시간 데이터 처리의 요구를 충족 하기 위해 필요 합니다.
Apache Hadoop 큰 데이터 산업의 발전 뒤에 원동력 되 고 하이브 및 돼지 기술 자주 언급 된다. 같은 시간에 컴퓨터 도구 지식을 얻기 위해 설계 하 고 구조화 되지 않은 데이터의 광대 한 보물에서 통찰력 또한 급속 하 게 발전 하 고 있습니다. 이러한 도구의 개발 자연 언어 처리, 패턴 인식, 기계 학습 등 인공 지능 기술에서 발전에 의존합니다.
도구와 다음 1 년 또는 2에 큰 구조화 되지 않은 데이터를 처리 하기 위해 플랫폼의 많은 예견 수 있습니다. Hadoop의 일괄 처리 이외에 스트림 데이터 처리에 따라 방법 또한 실시간 데이터 분석의 응용 프로그램에서 역할을 재생할. 또한, 큰 데이터 붐 이해와 시각화의 요구에 도전 한다. 데이터 흐름에서 시각화 해석 되며 동시에 탐험, 데이터 과학자 들은 문제를 찾아서 DataSet의 새로운 기능을 탐구 하는 방법으로 시각화 됩니다.
큰 데이터의 높은 기술 임계값 때문에
그래서 경쟁의 분야에서 현재은 주로 데이터 저장, 분석 및 다른 분야 제조 업체의 전통적인 장점을. 오라클 대용량 데이터 기계 2012 년 1 월에에서 공식적으로 나왔다. IBM의 빅 데이터 필드에 장점은 전체, 그리고 로봇 "왓슨" 인간 기계 전쟁에서 승리는 대용량 데이터 분석 솔루션에 대 한 IBM의 보너스 포인트의 예입니다.
중국 시장이 신흥 분야에서 매우 중요 하다. 중국은 많은 인구 자료, IT 인프라는 또한 더 성숙, 데이터의 양을 상상할 수 있다. 대량의 데이터 또는 데이터에서 값을 충 동에 대 한 필요에 대처 하기 위해 시스템 업그레이드 이며 지능의 시대에 알리다 수 여부 낙천적 기회, 본 "데이터 혁신". (Liuyu 저자 단위: 과학 자동화의 중국 아카데미)
이 페이지의 내용은 인터넷에서 가져온 것이므로 Alibaba Cloud의 공식 의견이 아닙니다.이 페이지에서 언급 된 제품 및 서비스는 Alibaba Cloud와는 관련이 없으므로이
페이지의 내용이 골칫거리 인 경우 저희에게 알려주십시오. 우리는 5 일 근무일 이내에 이메일을 처리 할 것입니다.
커뮤니티에서 표절 사례를 발견한 경우
info-contact@alibabacloud.com
으로 관련 증거를 첨부하여 이메일을 보내주시기 바랍니다. 당사 직원이 영업일 기준 5일 내에 연락 드리도록 하겠습니다.