정 및 대용량 데이터의 관련된 개념의 분석

출처: 인터넷
작성자: 사용자
키워드: 큰 데이터 대용량 데이터 대용량 데이터 기술 대용량 데이터 대용량 데이터 기술 구조화 되지 않은 데이터 대용량 데이터 대용량 데이터 기술 구조화 되지 않은 데이터 간단한 분석 대용량 데이터 대용량 데이터 기술 구조화 되지 않은 데이터 분석 현재

명확 하 게 정의 함으로써 대용량 데이터의 관련 개념, 기업 자신의 데이터 시스템을 제대로 계획 하 고 적절 하 게 전통적인 기술 및 새로운 기술 방법을 찾을 수 있습니다.

그것의 급속 한 발전으로 기술과 새로운 기술의 출현 업계는 일반적으로 많은 기본 개념 혼동 하 고 있습니다. 이것은 또한 오늘날의 가장 인기 있는 큰 데이터 필드에 있는 경우입니다. 구조화 된 데이터 및 구조화 되지 않은 데이터의 개념은 자주 인용 하지만 당사자는 종종 손상. 데이터의 개념의 혼란은 크게 기업 데이터 시스템을 명확 하 게 하 고 정확 하 게 계획에 영향을. 실제적인 일을 바탕으로, 몇 가지 핵심 데이터의 명확한 정의를 주고 저자 시도 관련 개념 고 간단한 분석.

데이터 기능으로 분류

구조화 된 데이터

정의: 현재, 그것은 특히 관계형 모델 데이터, 즉, 관계형 데이터베이스 테이블의 형태로 관리 되는 데이터. 대부분의 엔터프라이즈 비즈니스 데이터이 형식에 저장 됩니다.

간단한 분석: 전문적인 관점에서 관계 모델의 구조는 정확 하지만. 그러나, 그것은 현재 업계 상황에 대 한 관계형 모델 데이터를 정의 하는 가장 적합 한 대표 하기 때문에 명확 하 고 정확 하 게는 전통적으로 우리에 게 가장 친숙 한 비즈니스 데이터 이며 모호성이 없는.

반 구조화 된 데이터

정의: 반구조적 및 구조화 되지 않은 종종 언급, 모두는 실제로 다른 모든를 참조의 "비" 데이터 구조. 그러나, 더 명확 하 게 그것을 설명 하려면 관계형 모델, 응용 프로그램 로그 파일, XML 문서, JSON 문서 및 전자 메일 등의 기본 구조를 고정 패턴 되지 않은 그 "반 구조화 된 데이터"를 정의할 수 있습니다.

간단한 분석: 전문적인 관점에서 위의 구조와 반 구조화 된 데이터는 구조화 된 데이터, 하지만 제안 이다 아직도이 정의 사용 하 여 적절 한, 그렇지 않으면 큰 혼란의 원인이 됩니다.

구조화 되지 않은 데이터

정의: 모든 데이터와 반 구조화 된 데이터, 즉, 워드, PDF, PPT, EXL 같은 고정된 구조 패턴 없이 데이터 제거 문서와 그림 및 다양 한 형식의 동영상.

분석: 반구조적 및 구조화 되지 않은 데이터 사이의 구별의 중요성은 2의 처리 방법을 (를 포함 하 여 저장, 액세스 및 분석)은 현재 기업에서 다른. 대부분 구조화 되지 않은 데이터의 콘텐츠 관리 방법을 채택 하지만 반 구조화 된 데이터에 대 한 효과적인 관리 방법은 없습니다.

사실, 구조화, 반 구조화 및 구조화 되지 않은 데이터 차이 실제로 그냥 데이터 형식으로 정렬 하 고 오랜 역사를가지고. 엄밀히 말하면, 구조화 된 데이터와 반 구조화 된 데이터 모두에 기본적인 고정된 구조 패턴 (즉, 전문적인 의미에서 구조화 된 데이터)를 데이터입니다. 그러나, 업계에서 현재 상황은 그 관계 모델 데이터는 구조적 데이터로 별도로 정의 엔터프라이즈 데이터 관리에 대 한 바람직한 이며 특정 실용적인 의미가.

또한, 현재 널리 반구조적 및 구조화 되지 않은 데이터와 대용량 데이터 간의 중복 필드만 있다. 본질적으로, 두 가지는 반드시 관련이 없습니다. 업계는 단순히 반구조적 및 구조화 되지 않은 데이터, 대용량 데이터를 식별의 생각 때문에 큰 데이터 기술 반 구조화 된 데이터에 역할을 처음. 위의의 오해는 그것 올바르지 않은 날짜 형식의 개념으로 데이터 처리 기술을 혼동 하는.

Ii입니다. 데이터 처리 기술에 의해 분류

큰 데이터 (기술)

정의: 대용량 데이터는 최근 몇 년 동안, 생겨났다 개념 그리고 그것은 일반적으로 업계 4 V (큰 데이터 볼륨, 변화 속도의 빠른 속도, 낮은 값 밀도, 여러 유형의 다양 한) 기능에 의해 정의. 사실, 큰 데이터의 개념 해야 정확 하 게 큰 데이터 기술, 다른 데이터 형식 보다는 대규모 데이터를 SQL 시스템 또는 다른 새로운, 낮은-비용 처리 기법을 참조를 참조 하십시오.

분석: 큰 데이터의 업계의 정의 대부분의 혼란, 오해 많습니다: 여러 구조에 침투 하는 반면 큰 데이터 기술과 반 구조화 된 데이터에 함수는 먼저 지금 세미 structured/구조화 되지 않은 데이터와 함께 큰 데이터를 동일시 하는 큰 데이터 Hadoop, 해당; 사실, Hadoop 데이터의 양육에 큰 역할을 했다 하지만 큰 데이터 메서드를 사용 하 여 효율적으로 분석 하 고 특정 비즈니스 데이터를 저장 하는 많은 회사가 있다.

또한, 데이터를 정의 하는 방법을 관리 하는 콘텐츠 관리 방법? 일부 큰 데이터 인터넷 특성, 전통적인 기업에는 큰 데이터의 데이터 라고? 일부는 큰 데이터는 많은 양의 데이터를 정의 되지 않은 것을 말한다. 사실, 조심 분석, 또는 그것에 게 가장 정확한 데이터 처리 기술을 정의. SQL 시스템 및 콘텐츠 관리 기술, 대용량 데이터 기술 현재 콘텐츠 풍부 하다. 또한, 대용량 데이터 기술 낮은 비용을 강조 해야 합니다.

관계형 데이터베이스 기술

정의:이 데이터 형식 분류에서 관계형 모델에 비해 SQL 처리 시스템을 말합니다.

관계형 데이터베이스 기술을 여전히 엔터프라이즈 데이터 관리, 핵심 이며 간주 하 고 더 공부를 해야 큰 데이터 기술의 위치.

콘텐츠 관리 기술

정의: 주로 구조화 되지 않은 데이터를 기업에 의미 하지만 또한 조직, 관리 및 처리 방법에 대 한 액세스의 "콘텐츠" 특성에 따라 몇 가지 구조적된 데이터를 포함, 현재 관계형 데이터베이스 기술 이외에 가장 일반적으로 사용 된 다른 중요 한 기술 방법 및 도구.

분석: 현재, 구조화 되지 않은 데이터를 다루는 기업에 대 한 가장 중요 한 방법 이며 엔터프라이즈는 효과적인 관리과 구조 데이터의 활용.

다른 기술

정의: 기업 또한 같은 다른 데이터 관리 기술을 낮은 비용 분산 파일 시스템, MySQL 연맹, 대규모 메모리 데이터 관리 기술, 및 새로운 기술 Hadoop 및 SQL 시스템 (기록 데이터 관리), 큰 데이터 기술의 범위에 포함 될 수 있는 사이 채택할 수 있다.

MySQL 연맹 인터넷 산업에서 사용 되는 관계형 모델의 구조화 된 데이터를 사용 하 여 하지만 그것은 분산된 관계형 데이터베이스, 때문에 그것은 글로벌 일관성을 희생 그리고 완전 보장 완전 한 관계형 데이터베이스의 더 나은 expansibility를 가져옵니다. 따라서, 그것은 또한 대용량 데이터 기술에 속한다.

또한, 분산 파일 시스템 수 많은 작은 파일 관리 하는 기업의 새로운 방법, 하지만 또한 큰 데이터 기술에 속한다; 대규모 메모리 데이터 관리 기술을 저렴 한 비용 추가 저가 업그레이드를 달성 하지만 또한 대용량 데이터 기술에 속하는 거래 시스템의 능력은. 따라서, 대용량 데이터 기술 하지 그냥 반 구조화 된 데이터 구조화, 반 구조화 및 구조화 되지 않은 데이터 쪽으로 지향 이다.

따라서, 더 큰 데이터 데이터 형식 보다는 기술적 방법을 의미, SQL 시스템을 일부 신흥 데이터 관리 기술 뿐만 아니라 콘텐츠 관리 기술을 말합니다. 하지만 큰 데이터를 소위 "큰"는 관련된 표준. 큰 데이터 기술, Hadoop은 가장 중요 한, 단 하나 하지, 다른 NoSQL, 분산된 파일 시스템, MySQL 관계형 데이터베이스 연맹, 대규모 메모리 데이터 관리 기술.

큰 데이터 기술을 처리할 수 있는 데이터 형식에서는 기업 하지 않은 아직 처리 되 고 관리 되는 반 구조화 된 데이터의 초기 기능. 사실, 그것은 또한 구조화, 반 구조화 및 구조화 되지 않은 포함 하 여 모든 데이터 형식을 처리할 수 있습니다.

또한, 그것은 명백 하 게 하 고 큰 데이터 기술 낮은 비용 이어야 합니다, 그렇지 않으면 아무 발판은 취소 해야 합니다. 동시에, 관계형 데이터베이스 기술 여전히 엔터프라이즈 데이터 관리의 핵심입니다. 콘텐츠 관리 구성 하 고, 저장 하 고 현재. 구조화 되지 않은 데이터에 액세스 하는 주요 수단 이다 경우 낮은 비용 고려 사항, 뿐만 아니라 구조화 되지 않은 데이터 처리를 큰 데이터 기술의 도입 그것 참조 해야 콘텐츠 관리 기술 하지 아직 참여 하고있다 데이터 분석, 이미지, 비디오 분석 등의 분야에서 하지만 은행 및 기타 산업에 대 한이 상대적으로 먼 요구 해야한다.

엔터프라이즈 IT 인사 위의 개념을 명확 하 게 정의 해야 합니다, "구조", "반 구조" 및 "구조화" 세 종류의 데이터 형식을 나눌 수 있습니다. 동시에 기업 "관계형 데이터베이스 기술", "빅 데이터 기술", "콘텐츠 관리 기술" 등으로 데이터 처리 방법을 나눌 수 있습니다. 명확한 개념 정의 기초 하 여 기업만 제대로 그들의 자신의 데이터 시스템을 계획 하지 수 있지만 또한 찾을 수 있는 전통적인 기술 방법 및 새로운 기술 방법을 제대로.

(책임 편집기: 유산의 좋은)

관련 문서

연락처

이 페이지의 내용은 인터넷에서 가져온 것이므로 Alibaba Cloud의 공식 의견이 아닙니다.이 페이지에서 언급 된 제품 및 서비스는 Alibaba Cloud와는 관련이 없으므로이 페이지의 내용이 골칫거리 인 경우 저희에게 알려주십시오. 우리는 5 일 근무일 이내에 이메일을 처리 할 것입니다.

커뮤니티에서 표절 사례를 발견한 경우 info-contact@alibabacloud.com 으로 관련 증거를 첨부하여 이메일을 보내주시기 바랍니다. 당사 직원이 영업일 기준 5일 내에 연락 드리도록 하겠습니다.

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.