큰 데이터 모델링 9 주요 형태를 이해 해야

출처: 인터넷
작성자: 사용자
키워드: 데이터 마이닝 이해 수 통해

데이터 마이닝은 발견 하 고 자연 또는 인공 형태로 만든 지식 (또는 패턴) 데이터에서 새로운 비즈니스 지식을 사용 하 여 지식을 해석 하는 과정.

데이터 마이닝의 현재 양식 20 세기 http://www.aliyun.com/zixun/aggregation/16333.html에서 실천의 분야에서 태어난 "> 90 시대 분석 된 통합된 데이터 마이닝 알고리즘 플랫폼의 개발에 의해 지원 되는 형태가입니다. 아마도 데이터 마이닝 이론 보다는 연습에서 유래한 다, 때문에 그것은 이해 하는 과정에서 덜 눈에 띄는입니다. 후반에 선명한 DM의 개발 1990 년대 점차적으로 되고있다 데이터 마이닝, 성공적으로 적용 되 고 뒤에 점점 더 많은 데이터 마이닝 실무자의 표준화 된 프로세스.

선명한 DM 데이터 마이닝을 구현 하는 방법을 안내, 하는 동안 어떤 데이터 마이닝 인지 왜 그것은 그렇게 적절 한 설명 하지 않습니다. 이 문서에서 나는 데이터 마이닝 또는 "법률" (대부분의 개 업자에 게 잘 알려진)와 다른 친숙 한 설명에 대 한 내 9 개의 지침에 정교한 것 이다. 설명에 뿐 아니라 이론적으로, 데이터 마이닝 프로세스를 설명 하기 시작 합니다.

내 목표는 선명한 DM에 대 한 언급을 하지 하지만 신선-DM의 개념의 대부분은 데이터 마이닝, 이해에 중요 한 그리고이 문서 것입니다 또한 신선 DM의 일반적인 용어에 의존. 선명한 DM 프로세스의 시작에 불과입니다.

첫째, 목표 법: 사업 목표는 모든 데이터 솔루션의 소스.

데이터 마이닝의 정의: 데이터 마이닝은 비즈니스 산업 문제를 해결 하 고 비즈니스 목표 달성에 초점을 맞추고 있다. 데이터 마이닝 기술에 주로, 하지만 프로세스, 비즈니스 목표의 핵심입니다. 아니 비즈니스 목표, 데이터 마이닝 (여부 또는이 분명 하다). 그래서이 지침 또한 할 수 있다 데이터 마이닝은 비즈니스 프로세스.

두 번째, 지식 법: 비즈니스 지식 데이터 마이닝 프로세스의 모든 단계의 핵심입니다.

이 데이터 마이닝 프로세스의 핵심 기능을 정의합니다. 선명한 DM의 순진한 해석 비즈니스 지식 정의 되 고 비즈니스 지식을 각 단계의 핵심은 즉 데이터 마이닝 프로세스의 키 특성을 그리 워 하는 데이터 마이닝 과정의 최종 결과로 구현입니다.

이해의 용이성, 내가 사용 하 여 선명한 DM 단계 설명.

비즈니스 이해 비즈니스 지식에 기반 해야 합니다 그래서 데이터 마이닝 목표 사업 목표 (이 매핑은 또한 기반 데이터 정보 및 데이터 마이닝);의 매핑 이어야 합니다.

비즈니스 지식을 사용 하 여 비즈니스 문제와 어떻게 연결 되는지를;에 관련 된 데이터를 이해 하는 데이터 이해

데이터 전처리는 비즈니스 지식 셰이프 데이터를 사용 하 여 비즈니스 문제 제시 될 수 및 응답 (더 자세한 제 3 준비 법);

모델링은 그들 사이 사업 관련성을 이해 하는, 모델을 만들 예측, 모델 및 비즈니스 목표의 특성을 해석 하는 동안 데이터 마이닝 알고리즘의 사용

평가 비즈니스; 이해에 모델의 영향

구현 되는 비즈니스 프로세스에 대 한 데이터 마이닝 결과

즉, 비즈니스 지식 없이 데이터 마이닝 과정에서 모든 단계는 유효 하 고 단계에 없다 "순수 기술" 키를 누릅니다. 비즈니스 지식 지도 과정 유익한 결과 생산 하 고 인정 그 유익한 결과 수 있습니다. 데이터 마이닝은 반복적인 프로세스입니다, 그리고 비즈니스 지식 결과의 지속적인 향상을 운전의 핵심 이다.

"간격의 성능"이 뒤에 이유를 설명할 수 있다 (표시의 차이) (1990 년대에 데이터 마이닝에 앨런 몽고메리의 보기). 데이터 마이닝 목표 진짜 사업을 포함 하지만 데이터만 현실의 일부를 나타낼 수 있습니다 몽고메리 지적; 데이터와 실제 세계 사이의 격차 (또는 "간격") 있다. 데이터 마이닝, 비즈니스 지식이이 공백을 채울, 상관, 데이터에서 발견 하는 과정에서 비즈니스 지식 해석의 중요성, 데이터의 모든 누락 표시의 사용만 비즈니스 지식을 통해 구성 해야 합니다. 만 비즈니스 지식 비즈니스 지식 데이터 마이닝 과정에서 모든 단계를의 중심에는이 손실에 대 한 보상할 수 있다.

셋째, 준비 법: 데이터 전처리 데이터 마이닝의 다른 프로세스 보다 더 중요 하다.

이것은 데이터 마이닝의 유명한 격언, 데이터 마이닝 프로젝트에 가장 힘 드는 것은 데이터 수집 및 전처리. 비공식적으로, 그것은 최대 50%-80%의 프로젝트 시간 걸립니다. 간단한 설명 합계 될 수 있다 데이터 어렵다""로,이 "문제" 데이터 수집, 데이터 정리, 데이터 변환 및 기타 데이터는 작업 부하의 일부를 전처리의 완화를 자동 자주 사용. 자동화 기술 유익 하는 동안, 지지자는이 기술을 데이터 전처리에 관련 된 작업의 양을 줄일 수 있습니다 하지만 그것도 오해 데이터 전처리는 데이터 마이닝에 필요한 믿습니다.

데이터 전처리의 목적 쉽게 그것을 사용 하 여 데이터 마이닝 알고리즘과 같은 분석 기법에 대 한 서식이 지정 된 데이터에 데이터 마이닝을 변환 하는 것입니다. 그래서이 분석 탐구 해야 (를 포함 하 여 정리, 최대 최소 변환, 성장, 등) 데이터의 어떤 형태로 변화 문제 공간에 변화를 의미. 이것은 데이터 전처리, 중요 한 이유 고는 데이터 파는 쉽게 조작할 수 문제 공간, 그들을 분석 하는 옳은 방법을 찾을 수 쉽게 데이터 마이닝 프로세스에서 너무 많은 일을 걸립니다.

""이 문제 공간을 형성 하는 두 가지 있다. 첫 번째 방법은 데이터를 구문 분석할 수 있는, 예를 들어 대부분의 데이터는 완벽 하 게 서식이 지정 된 데이터 변환 마이닝 알고리즘 필요 데이터를 단일 테이블 형식 이며 기록 샘플입니다. 데이터 파는 알고 어떤 종류의 데이터 형성 알고리즘 요구 그래서 그들은 적절 한 형식으로 데이터를 변환 수 있습니다. 두 번째 방법은 데이터 파는 비즈니스 정보 및 데이터를 통해 알 수 있는 일부 지역에서는 일부 데이터 마이닝 문제 등 비즈니스 문제에 대 한 더 많은 정보를 포함 하도록 데이터를 사용 하는 것입니다. 지식의이 영역, 데이터 굴 착 기는 문제 공간을 조작 하 여 쉽게 적합 한 기술 솔루션을 찾을 수 있습니다.

따라서, 비즈니스 지식, 데이터 지식을 통해 데이터 마이닝 지식 근본적으로 게 데이터 전처리 더 편리. 데이터 전처리의 이러한 측면은 간단한 자동화를 통해 구현 되지 않습니다.

이 법 또한 설명 한다 의심 스러운 현상, 즉, 데이터 수집, 청소, 퓨전 및 데이터 웨어하우스를 작성 하지만 데이터 마이닝의 절반 이상을 차지 여전히 데이터 전처리 하는 것은 여전히 필수적 이다 다른 방법으로 작업 부하를 처리 하는 있지만. 또한, 선명한 DM 있듯이 전처리 단계, 기본 데이터 후에 유용한 모델의 반복 과정에서 필요한은 추가 데이터 전처리.

12 다음
관련 문서

연락처

이 페이지의 내용은 인터넷에서 가져온 것이므로 Alibaba Cloud의 공식 의견이 아닙니다.이 페이지에서 언급 된 제품 및 서비스는 Alibaba Cloud와는 관련이 없으므로이 페이지의 내용이 골칫거리 인 경우 저희에게 알려주십시오. 우리는 5 일 근무일 이내에 이메일을 처리 할 것입니다.

커뮤니티에서 표절 사례를 발견한 경우 info-contact@alibabacloud.com 으로 관련 증거를 첨부하여 이메일을 보내주시기 바랍니다. 당사 직원이 영업일 기준 5일 내에 연락 드리도록 하겠습니다.

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.