웹사이트 로그 파일 분석 및 분석 방법 에센스

출처: 인터넷
작성자: 사용자
키워드: 웹사이트 분석 웹사이트 데이터 웹 사이트 로그

중간 트랜잭션 http://www.aliyun.com/zixun/aggregation/6858.html "> seo 진단 Taobao 게스트 클라우드 호스트 기술 홀

웹 사이트의 로그 로그 분석, 우리는 사용자 및 분석할 수 있습니다 우리가 사용자 웹사이트와 웹사이트의 건강에 거미의 기본 웹 사이트를 방문 하는 검색 엔진 스파이더의 동작 데이터를 볼 수 있습니다. 웹 로그 분석에서 우리는 주로 거미 동작을 분석할 필요가 있다.

거미 크롤링 및 수집에서 과정, 검색 엔진을 할당 합니다 해당 리소스 수량을 특정 무게 웹사이트. 검색 엔진 친화적인 웹사이트 스파이더 수 있도록 신속 하 게, 정확 하 게 종합적으로 쓸모 없는에 리소스를 낭비 하지 않고 귀중 한, 사용자와 같은 콘텐츠를 크롤 링 전체 이러한 자원의 사용, 예외의 콘텐츠를 액세스 한다.

그러나, 사이트 로그에서 데이터의 양이 너무 크기 때문에, 우리가 일반적으로 필요가 웹 사이트 로그 분석 도구를 사용 하 여 보기. 일반적인 로그 분석 도구는: 광 로그 분석 도구, 웹 로그 exploer.

로그의 분석에서 우리는 매일 로그 파일의 내용을 분석 필요: 방문 수, 체류 시간, 크롤링 금액, 카탈로그 크롤링 통계, 페이지 수 통계, 거미 액세스 IP, HTTP 상태 코드, 거미 활성 크롤링 시간, 거미 크롤링 경로, 등등. 우리가 콘텐츠는 분석할 필요가 많은 일 로그 파일: 거미의 수 방문 추세, 시간 추세, 전체 크롤링 추세, 카탈로그 크롤링 추세 유지, 기간, 거미 활성 주기를 크롤 링.

살펴 봅시다 사이트 로그 분석 하는 방법?

웹사이트 로그 데이터 분석 및 해석:

1, 방문, 수 유지 시간, 크롤링 금액

이러한 세 가지 항목에서 우리가 말할 수 있는: 크롤링 크롤링 체류 시간과 숙박 당 평균 시간 단일 페이지, 페이지 당 평균 수.

평균 크롤링 당 페이지 수 = 총 크롤링/방문 수

단일 페이지 크롤링 중지 = 모든 숙박/크롤

숙박 당 평균 시간 = 총 체류 시간/방문 수

이러한 데이터에서 우리는 거미의 활성도, 선호도, 크롤링 깊이 볼 수 있고, 방문 수, 체류 시간, 높은 크롤링, 평균 평균 크롤링 페이지의 총 수 유지 시간을 나타내는 사이트 더 인기 있는 검색 엔진 처럼. 그리고 단일 페이지 크롤링 체류 시간을 사이트 페이지 액세스 속도, 더 이상 시간, 나타내는 더 느린 웹 사이트에 액세스, 검색 엔진 크롤 링 포함 더 불리 한, 우리, 웹 페이지의 속도 증가 하려고 한다 쇼를 크롤 링 더 많은 크롤러 자원을 포함 단일 체류 시간을 줄일.

또한, 이러한 데이터에 따르면 우리는 또한 통계 사이트 성능의 전반적인 추세, 시간의 기간에 대 한 같은: 거미의 수 방문 추세, 시간 추세, 크롤링 추세를 유지.

2, 카탈로그 크롤링 통계

로그 분석을 통해 우리 스파이더가 크롤 링 디렉토리 깊이, 중요 한 페이지 카탈로그 크롤링 상태, 잘못 된 페이지 카탈로그 크롤링 상태 같은 웹 사이트의 디렉터리를 볼 수 있습니다. 우리는 페이지를 비교 하 여 더 많은 문제 그리고 카탈로그에서 수집 찾을 수 있습니다. 중요 한 카탈로그에 대 한 우리 통해 내부 및 외부 조정, 잘못 된 페이지, 화면 robots.txt에 대 한 크롤 링 하 고 무게를 추가 해야 합니다.

또한, 매일 로그 통계를 통해 우리 볼 수 있습니다 내부와 외부 디렉터리 효과 동작 역 최적화 합리적인, 여부 원하는 효과 얻을 수 있습니다. 같은 디렉터리에 대 한 긴 기간 동안 우리는 추측에 대 한 이유의 동작에 따라 디렉터리의 페이지의 성능을 볼 수 있습니다.

3, 페이지 탐색

사이트 로그 분석에서 우리는 특정 거미 크롤링된 페이지를 볼 수 있습니다. 이 페이지에서 우리는 어떤 거미 크롤 링에서 금지, 어떤 페이지의 값에 포함 되지 않습니다 크롤 링, 거미의 우리 크롤 링 금지 robots.txt에이 주소를 필요한 리소스를 만들려면 어떤 중복 페이지 URL, 등, 크롤 링 하는 페이지를 크롤 링 분석할 수 있습니다.

또한, 우리는 또한 새로운 기사에 대 한 페이지에 포함 되지 않은 이유를 분석할 수 있습니다, 그리고 크롤 링 하지는 때문에 크롤링 또는 하지 포함 하지만 공개 하지 않았다. 읽기 매우 의미심장 하지 않은 일부 페이지, 어쩌면 우리 필요 이러한 페이지에 대 한 크롤링 채널로 우리가 해야 noindex 태그에 있는지 여부. 하지만 다른 한편으로, 거미는 이러한 의미가 채널 페이지 크롤링 페이지에 의존 지체 될 것입니다, 거미 사이트맵 이해 하지? "이, 바보 같은 조류 의심을가지고, 경험을 공유 하도록 요청"

4, 거미 액세스 IP

그것은 적당 한 상황 아래 사이트를 판단 하는 거미의 IP 섹션을 통해 제안 되었습니다, 그리고 바보 같은 조류는 매우 중요 한 지식 후이 너무 강력 하기 때문에. 그리고 더 많은 드롭 오른쪽 작은의 중요성을 판단 하는 단일 IP 섹션 처음 세 개의 데이터에서 판단 해야 한다. 더 많은 사용의 IP 분석 false 거미, 악의적인 클릭 거미 거미의 컬렉션 인지 결정 하 이어야 한다.

5. 액세스 상태 코드

거미는 종종 등 301, 404, 상태 코드에 나타납니다이 상태 코드는 사이트에 나쁜 영향을 피하기 위해 시간에 처리 한다.

6, 크롤링 기간

분석 하 여 거미 시간 크롤링 단 하루에 우리가 찾을 수 있는 밖으로 어떻게 특정 거미 활성화 되어 특정 시간에이 사이트에. 주간 데이터를 비교 하 여 우리는 주 동안 특정 거미의 활성 사이클을 볼 수 있습니다. 이 사이트 콘텐츠 업데이트 시간 지도 특정 의미를가지고 고 전에 소위 "수석"은 과학적 진술에 대 한 이해.

7, 거미 크롤링 경로

사이트에서 거미 크롤링 경로 기본 설정의 사이트 구조에 대 한 만약 우리가 특정 거미 액세스 경로 따라 우리 특정 ip 액세스 경로 추적할 수 있는 로그를 찾을 수 있습니다. 이것에서 우리가 수 거미의 탐색 경로 제대로 안내, 거미 더 많은 크롤링 걸릴 중요 한, 귀중 한, 새로운 업데이트 페이지. 크롤링 경로에서 우리는 페이지의 물리적 구조와 URL 논리 구조의 기본 설정의 경로 설정을 분석할 수 있습니다. 우리의 웹사이트에 검색 엔진의 관점에서 볼 수 있습니다.

우리는 또한 더 많은 콘텐츠를 얻을 수 있습니다 웹사이트 로그 분석에서 깊이, 오신 것을 환영 합니다 친구 메시지 교환 연구 예쁜 여성 네트워크 웹사이트 SEO 지식 및 로깅 도구의 부족 Www.tingnv.com 추가 수 없습니다.

관련 문서

연락처

이 페이지의 내용은 인터넷에서 가져온 것이므로 Alibaba Cloud의 공식 의견이 아닙니다.이 페이지에서 언급 된 제품 및 서비스는 Alibaba Cloud와는 관련이 없으므로이 페이지의 내용이 골칫거리 인 경우 저희에게 알려주십시오. 우리는 5 일 근무일 이내에 이메일을 처리 할 것입니다.

커뮤니티에서 표절 사례를 발견한 경우 info-contact@alibabacloud.com 으로 관련 증거를 첨부하여 이메일을 보내주시기 바랍니다. 당사 직원이 영업일 기준 5일 내에 연락 드리도록 하겠습니다.

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.