이해는 어떤 웹 데이터 마이닝

출처: 인터넷
작성자: 사용자

중간 트랜잭션 http://www.aliyun.com/zixun/aggregation/6858.html "> seo 진단 Taobao 게스트 클라우드 호스트 기술 홀

웹 마이닝의 목표는 웹의 하이퍼링크 구조, 웹 페이지 콘텐츠 및 사용 로그에서 유용한 정보를 찾아보기입니다. 웹 마이닝 많은 데이터 마이닝 기법을 사용 하 여, 전통적인 데이터 마이닝의 간단한 응용 프로그램 아니다. 지난 20 년 동안, 많은 새로운 마이닝 작업 및 알고리즘 되었습니다 발명 했다 연속적으로. 웹 마이닝 작업 마이닝 프로세스 중에 사용 데이터 범주에 기반 하는 세 가지 주요 유형으로 나눌 수 있습니다: 웹 구조 마이닝, 웹 콘텐츠 광업, 및 웹 사용 마이닝.

· 웹 구조 마이닝: 웹 구조 마이닝 웹 구조를 특성화 하는 하이퍼링크 (짧은 링크)에서 유용한 지식을 추구. 예를 들어 이러한 링크에서 우리가 무엇입니까 중요 한 페이지는 검색 엔진에서 사용 하는 중요 한 기술을 알아낼 수 있다. 우리는 또한 공통 관심사를 가진 사용자의 커뮤니티를 둘러볼 수 있습니다. 이러한 작업은 관계형 테이블에 아무 링크 구조를 없기 때문에 전통적인 데이터 마이닝에 존재 하지 않습니다.

· 콘텐츠 마이닝 웹: 웹 콘텐츠 마이닝 웹 콘텐츠에서 유용한 정보와 지식을 추출. 예: 웹 페이지의 테마에 따라 우리는 자동 클러스터링 및 분류를 할 수 있습니다. 예: www.g8g5.com,이 역 가장 큰 테마는 QQ 표현. 이러한 작업은 전통적인 데이터 마이닝의 작업 비슷합니다, 하지만 우리 포럼 회신, 목적, 제품 설명, 등의 다양 한 웹 페이지에서 유용한 정보를 추출 하 고 등 수 있습니다. 사용자 태도 악용 추가 분석으로이 정보를 사용할 수 있습니다. 이러한 작업은 또한 전통적인 데이터 마이닝 작업 하지.

· 웹 사용 마이닝: 웹 마이닝을 사용 하 여 각 사용자의 클릭을 기록 하는 사용 하 여 로그에서 사용자의 액세스 모드를 내. 이 작업은 또한 데이터 마이닝에 대 한 많은 알고리즘을 사용합니다. 중요 한 문제 중 하나는 클릭 스트림 데이터 마이닝에 사용할 수 있는 적절 한 데이터를 생성의 전처리에입니다.

대부분 검색 엔진 엔지니어의 검색 엔진을 디자인 하지만 또한 정의의 문제를 해결 하기 위해 주의를 또는 검색 결과의 큰 부분을 지불 하는 방법에 대 한 생각 때문에 검색 엔진 최적화 웹 데이터 마이닝과 관련 된 기술입니다.

저자: 항 주 시 십억 네트워크 기술 유한 회사

원래 부하: http://www.seo.com.cn/

관련 문서

연락처

이 페이지의 내용은 인터넷에서 가져온 것이므로 Alibaba Cloud의 공식 의견이 아닙니다.이 페이지에서 언급 된 제품 및 서비스는 Alibaba Cloud와는 관련이 없으므로이 페이지의 내용이 골칫거리 인 경우 저희에게 알려주십시오. 우리는 5 일 근무일 이내에 이메일을 처리 할 것입니다.

커뮤니티에서 표절 사례를 발견한 경우 info-contact@alibabacloud.com 으로 관련 증거를 첨부하여 이메일을 보내주시기 바랍니다. 당사 직원이 영업일 기준 5일 내에 연락 드리도록 하겠습니다.

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.