중간 트랜잭션 http://www.aliyun.com/zixun/aggregation/6858.html "> seo 진단 Taobao 게스트 클라우드 호스트 기술 홀
웹 마이닝의 목표는 웹의 하이퍼링크 구조, 웹 페이지 콘텐츠 및 사용 로그에서 유용한 정보를 찾아보기입니다. 웹 마이닝 많은 데이터 마이닝 기법을 사용 하 여, 전통적인 데이터 마이닝의 간단한 응용 프로그램 아니다. 지난 20 년 동안, 많은 새로운 마이닝 작업 및 알고리즘 되었습니다 발명 했다 연속적으로. 웹 마이닝 작업 마이닝 프로세스 중에 사용 데이터 범주에 기반 하는 세 가지 주요 유형으로 나눌 수 있습니다: 웹 구조 마이닝, 웹 콘텐츠 광업, 및 웹 사용 마이닝.
· 웹 구조 마이닝: 웹 구조 마이닝 웹 구조를 특성화 하는 하이퍼링크 (짧은 링크)에서 유용한 지식을 추구. 예를 들어 이러한 링크에서 우리가 무엇입니까 중요 한 페이지는 검색 엔진에서 사용 하는 중요 한 기술을 알아낼 수 있다. 우리는 또한 공통 관심사를 가진 사용자의 커뮤니티를 둘러볼 수 있습니다. 이러한 작업은 관계형 테이블에 아무 링크 구조를 없기 때문에 전통적인 데이터 마이닝에 존재 하지 않습니다.
· 콘텐츠 마이닝 웹: 웹 콘텐츠 마이닝 웹 콘텐츠에서 유용한 정보와 지식을 추출. 예: 웹 페이지의 테마에 따라 우리는 자동 클러스터링 및 분류를 할 수 있습니다. 예: www.g8g5.com,이 역 가장 큰 테마는 QQ 표현. 이러한 작업은 전통적인 데이터 마이닝의 작업 비슷합니다, 하지만 우리 포럼 회신, 목적, 제품 설명, 등의 다양 한 웹 페이지에서 유용한 정보를 추출 하 고 등 수 있습니다. 사용자 태도 악용 추가 분석으로이 정보를 사용할 수 있습니다. 이러한 작업은 또한 전통적인 데이터 마이닝 작업 하지.
· 웹 사용 마이닝: 웹 마이닝을 사용 하 여 각 사용자의 클릭을 기록 하는 사용 하 여 로그에서 사용자의 액세스 모드를 내. 이 작업은 또한 데이터 마이닝에 대 한 많은 알고리즘을 사용합니다. 중요 한 문제 중 하나는 클릭 스트림 데이터 마이닝에 사용할 수 있는 적절 한 데이터를 생성의 전처리에입니다.
대부분 검색 엔진 엔지니어의 검색 엔진을 디자인 하지만 또한 정의의 문제를 해결 하기 위해 주의를 또는 검색 결과의 큰 부분을 지불 하는 방법에 대 한 생각 때문에 검색 엔진 최적화 웹 데이터 마이닝과 관련 된 기술입니다.
저자: 항 주 시 십억 네트워크 기술 유한 회사
원래 부하: http://www.seo.com.cn/