명확 하 게 정의 함으로써 대용량 데이터의 관련 개념, 기업 자신의 데이터 시스템을 제대로 계획 하 고 적절 하 게 전통적인 기술 및 새로운 기술 방법을 찾을 수 있습니다.
그것의 급속 한 발전으로 기술과 새로운 기술의 출현 업계는 일반적으로 많은 기본 개념 혼동 하 고 있습니다. 이것은 또한 오늘날의 가장 인기 있는 큰 데이터 필드에 있는 경우입니다. 구조화 된 데이터 및 구조화 되지 않은 데이터의 개념은 자주 인용 하지만 당사자는 종종 손상. 데이터의 개념의 혼란은 크게 기업 데이터 시스템을 명확 하 게 하 고 정확 하 게 계획에 영향을. 실제적인 일을 바탕으로, 몇 가지 핵심 데이터의 명확한 정의를 주고 저자 시도 관련 개념 고 간단한 분석.
데이터 기능으로 분류
구조화 된 데이터
정의: 현재, 그것은 특히 관계형 모델 데이터, 즉, 관계형 데이터베이스 테이블의 형태로 관리 되는 데이터. 대부분의 엔터프라이즈 비즈니스 데이터이 형식에 저장 됩니다.
간단한 분석: 전문적인 관점에서 관계 모델의 구조는 정확 하지만. 그러나, 그것은 현재 업계 상황에 대 한 관계형 모델 데이터를 정의 하는 가장 적합 한 대표 하기 때문에 명확 하 고 정확 하 게는 전통적으로 우리에 게 가장 친숙 한 비즈니스 데이터 이며 모호성이 없는.
반 구조화 된 데이터
정의: 반구조적 및 구조화 되지 않은 종종 언급, 모두는 실제로 다른 모든를 참조의 "비" 데이터 구조. 그러나, 더 명확 하 게 그것을 설명 하려면 관계형 모델, 응용 프로그램 로그 파일, XML 문서, JSON 문서 및 전자 메일 등의 기본 구조를 고정 패턴 되지 않은 그 "반 구조화 된 데이터"를 정의할 수 있습니다.
간단한 분석: 전문적인 관점에서 위의 구조와 반 구조화 된 데이터는 구조화 된 데이터, 하지만 제안 이다 아직도이 정의 사용 하 여 적절 한, 그렇지 않으면 큰 혼란의 원인이 됩니다.
구조화 되지 않은 데이터
정의: 모든 데이터와 반 구조화 된 데이터, 즉, 워드, PDF, PPT, EXL 같은 고정된 구조 패턴 없이 데이터 제거 문서와 그림 및 다양 한 형식의 동영상.
분석: 반구조적 및 구조화 되지 않은 데이터 사이의 구별의 중요성은 2의 처리 방법을 (를 포함 하 여 저장, 액세스 및 분석)은 현재 기업에서 다른. 대부분 구조화 되지 않은 데이터의 콘텐츠 관리 방법을 채택 하지만 반 구조화 된 데이터에 대 한 효과적인 관리 방법은 없습니다.
사실, 구조화, 반 구조화 및 구조화 되지 않은 데이터 차이 실제로 그냥 데이터 형식으로 정렬 하 고 오랜 역사를가지고. 엄밀히 말하면, 구조화 된 데이터와 반 구조화 된 데이터 모두에 기본적인 고정된 구조 패턴 (즉, 전문적인 의미에서 구조화 된 데이터)를 데이터입니다. 그러나, 업계에서 현재 상황은 그 관계 모델 데이터는 구조적 데이터로 별도로 정의 엔터프라이즈 데이터 관리에 대 한 바람직한 이며 특정 실용적인 의미가.
또한, 현재 널리 반구조적 및 구조화 되지 않은 데이터와 대용량 데이터 간의 중복 필드만 있다. 본질적으로, 두 가지는 반드시 관련이 없습니다. 업계는 단순히 반구조적 및 구조화 되지 않은 데이터, 대용량 데이터를 식별의 생각 때문에 큰 데이터 기술 반 구조화 된 데이터에 역할을 처음. 위의의 오해는 그것 올바르지 않은 날짜 형식의 개념으로 데이터 처리 기술을 혼동 하는.
Ii입니다. 데이터 처리 기술에 의해 분류
큰 데이터 (기술)
정의: 대용량 데이터는 최근 몇 년 동안, 생겨났다 개념 그리고 그것은 일반적으로 업계 4 V (큰 데이터 볼륨, 변화 속도의 빠른 속도, 낮은 값 밀도, 여러 유형의 다양 한) 기능에 의해 정의. 사실, 큰 데이터의 개념 해야 정확 하 게 큰 데이터 기술, 다른 데이터 형식 보다는 대규모 데이터를 SQL 시스템 또는 다른 새로운, 낮은-비용 처리 기법을 참조를 참조 하십시오.
분석: 큰 데이터의 업계의 정의 대부분의 혼란, 오해 많습니다: 여러 구조에 침투 하는 반면 큰 데이터 기술과 반 구조화 된 데이터에 함수는 먼저 지금 세미 structured/구조화 되지 않은 데이터와 함께 큰 데이터를 동일시 하는 큰 데이터 Hadoop, 해당; 사실, Hadoop 데이터의 양육에 큰 역할을 했다 하지만 큰 데이터 메서드를 사용 하 여 효율적으로 분석 하 고 특정 비즈니스 데이터를 저장 하는 많은 회사가 있다.
또한, 데이터를 정의 하는 방법을 관리 하는 콘텐츠 관리 방법? 일부 큰 데이터 인터넷 특성, 전통적인 기업에는 큰 데이터의 데이터 라고? 일부는 큰 데이터는 많은 양의 데이터를 정의 되지 않은 것을 말한다. 사실, 조심 분석, 또는 그것에 게 가장 정확한 데이터 처리 기술을 정의. SQL 시스템 및 콘텐츠 관리 기술, 대용량 데이터 기술 현재 콘텐츠 풍부 하다. 또한, 대용량 데이터 기술 낮은 비용을 강조 해야 합니다.
관계형 데이터베이스 기술
정의:이 데이터 형식 분류에서 관계형 모델에 비해 SQL 처리 시스템을 말합니다.
관계형 데이터베이스 기술을 여전히 엔터프라이즈 데이터 관리, 핵심 이며 간주 하 고 더 공부를 해야 큰 데이터 기술의 위치.
콘텐츠 관리 기술
정의: 주로 구조화 되지 않은 데이터를 기업에 의미 하지만 또한 조직, 관리 및 처리 방법에 대 한 액세스의 "콘텐츠" 특성에 따라 몇 가지 구조적된 데이터를 포함, 현재 관계형 데이터베이스 기술 이외에 가장 일반적으로 사용 된 다른 중요 한 기술 방법 및 도구.
분석: 현재, 구조화 되지 않은 데이터를 다루는 기업에 대 한 가장 중요 한 방법 이며 엔터프라이즈는 효과적인 관리과 구조 데이터의 활용.
다른 기술
정의: 기업 또한 같은 다른 데이터 관리 기술을 낮은 비용 분산 파일 시스템, MySQL 연맹, 대규모 메모리 데이터 관리 기술, 및 새로운 기술 Hadoop 및 SQL 시스템 (기록 데이터 관리), 큰 데이터 기술의 범위에 포함 될 수 있는 사이 채택할 수 있다.
MySQL 연맹 인터넷 산업에서 사용 되는 관계형 모델의 구조화 된 데이터를 사용 하 여 하지만 그것은 분산된 관계형 데이터베이스, 때문에 그것은 글로벌 일관성을 희생 그리고 완전 보장 완전 한 관계형 데이터베이스의 더 나은 expansibility를 가져옵니다. 따라서, 그것은 또한 대용량 데이터 기술에 속한다.
또한, 분산 파일 시스템 수 많은 작은 파일 관리 하는 기업의 새로운 방법, 하지만 또한 큰 데이터 기술에 속한다; 대규모 메모리 데이터 관리 기술을 저렴 한 비용 추가 저가 업그레이드를 달성 하지만 또한 대용량 데이터 기술에 속하는 거래 시스템의 능력은. 따라서, 대용량 데이터 기술 하지 그냥 반 구조화 된 데이터 구조화, 반 구조화 및 구조화 되지 않은 데이터 쪽으로 지향 이다.
따라서, 더 큰 데이터 데이터 형식 보다는 기술적 방법을 의미, SQL 시스템을 일부 신흥 데이터 관리 기술 뿐만 아니라 콘텐츠 관리 기술을 말합니다. 하지만 큰 데이터를 소위 "큰"는 관련된 표준. 큰 데이터 기술, Hadoop은 가장 중요 한, 단 하나 하지, 다른 NoSQL, 분산된 파일 시스템, MySQL 관계형 데이터베이스 연맹, 대규모 메모리 데이터 관리 기술.
큰 데이터 기술을 처리할 수 있는 데이터 형식에서는 기업 하지 않은 아직 처리 되 고 관리 되는 반 구조화 된 데이터의 초기 기능. 사실, 그것은 또한 구조화, 반 구조화 및 구조화 되지 않은 포함 하 여 모든 데이터 형식을 처리할 수 있습니다.
또한, 그것은 명백 하 게 하 고 큰 데이터 기술 낮은 비용 이어야 합니다, 그렇지 않으면 아무 발판은 취소 해야 합니다. 동시에, 관계형 데이터베이스 기술 여전히 엔터프라이즈 데이터 관리의 핵심입니다. 콘텐츠 관리 구성 하 고, 저장 하 고 현재. 구조화 되지 않은 데이터에 액세스 하는 주요 수단 이다 경우 낮은 비용 고려 사항, 뿐만 아니라 구조화 되지 않은 데이터 처리를 큰 데이터 기술의 도입 그것 참조 해야 콘텐츠 관리 기술 하지 아직 참여 하고있다 데이터 분석, 이미지, 비디오 분석 등의 분야에서 하지만 은행 및 기타 산업에 대 한이 상대적으로 먼 요구 해야한다.
엔터프라이즈 IT 인사 위의 개념을 명확 하 게 정의 해야 합니다, "구조", "반 구조" 및 "구조화" 세 종류의 데이터 형식을 나눌 수 있습니다. 동시에 기업 "관계형 데이터베이스 기술", "빅 데이터 기술", "콘텐츠 관리 기술" 등으로 데이터 처리 방법을 나눌 수 있습니다. 명확한 개념 정의 기초 하 여 기업만 제대로 그들의 자신의 데이터 시스템을 계획 하지 수 있지만 또한 찾을 수 있는 전통적인 기술 방법 및 새로운 기술 방법을 제대로.
(책임 편집기: 유산의 좋은)