Absrtact: 웹 마 스 터 뿐만 아니라 원래, 작성 하는 방법을 알아야로 체인을 보낼 뿐만 아니라 사이트의 로그를 분석 하는 법을 배워야 하는 방법. 웹 마 스 터 사이트 로그 분석, 검색 엔진에 귀하의 사이트에 더 중요 하다 이해할 수 있다. 웹 로그를 통해 얻을 수 있는 중요 한 것은 무엇입니까?
뿐만 아니라 사이트 로그 체인을 보낼 뿐만 아니라 웹 분석 하는 법을 배워야 하는 방법, 작성 하는 방법을 알아야 웹마스터로 서. 웹 마 스 터 사이트 로그 분석, 검색 엔진에 귀하의 사이트에 더 중요 하다 이해할 수 있다. 어떤 중요 한 정보를 얻을 수는 웹 로그를 통해 아래 지정:
첫째, 사이트의 크롤링 봐
1, 그냥 온라인, 새로운 역 참조 검색 엔진 사이트 크롤링; 왔다 하지
2, 사이트에 포함 된 예외, k, 로그를 통해 이해할 수 있는 검색 엔진 사이트;를 위 하는 여부 또는
3 웹사이트의 문제를 해결 하기 위해 로그; 읽기 해야 합니다.
두 번째, 사이트 로그를 찾는 방법?
일반적으로 FTP 로그 라는 폴더에에서 다른 서버 수 있습니다 로그 파일 이름을 동일 하지 않습니다, 하지만 확실히 로그를 포함 하는 것이 키워드, 다음 그림:
셋째, 로그를 여는 방법?
다운로드, 압축, 텍스트 편집기를 사용 하 여 오픈 깨진, EditPlus를 사용할 수 있습니다 또는 드림위버 같은 웹 편집기를 열 경우 열 수 있습니다.
4, 주요 검색 엔진 거미 이름:
로그를 연 다음 우리가 볼 수 있습니다 다음 검색 엔진 스파이더 이름 각각, 귀하의 사이트에 검색 엔진입니다.
바이: Baiduspider
구글 googlebot =
Msn:msnbot
야 후: 후루룩
Yodao:youdaobot
Sogou:sogou get + 거미
360:360spider
5: 철거 로그인
로그 검색에서 위의 거미의 이름을 여부 거미 귀하의 사이트에 그리고 그 거미 크롤링 사이트 페이지 상황 알고 명확 하 게 이해할 수 있다.
123.125.71.33--[19/apr/2013:00:47:39 1am] "get/page/contact/contact.php http/1.1 21978"-"" mozilla/5.0 (호환 가능 ible; baiduspider/2.0; + http://www.baidu.com/search/spider.html) "
구체적인 분석은 다음과 같습니다.
123.125.71.33 IP 액세스
[19/4 월/2013:00:47:39 1am] 액세스 시간 및 표준 시간대
http/1.1 프로토콜 크롤 링에 따라 get/page/contact/contact.php http/1.1 (도메인 name)/page/contact/contact.php에서이 페이지 (get 나타냅니다 서버 작업)
200 서버 응답 상태 코드입니다.
21978 21,978 바이트 크롤링된 나타냅니다.
파이어 폭스 브라우저 액세스 정보를 사용 하 여 방문자를 의미 하는 mozilla/5.0
6. 웹 사이트 로그온 SEO 정보
다른 서버 또는 가상 호스트 설정 다른 로깅 내용 있다.
와 같은 일부: 법령을 준수 하는 몇 가지 더 많은 레코드를 보면 200 0 33834 237 953, 세 번째 숫자 바이트 수를 나타냅니다 결정할 수 있습니다.
와 같은 일부: 200 0 0 또는 200 0 64 바이트를 가져오기의 기록입니다. 참고: 200 0 0과 200 0 64 어떤 문제를 대표 하지 않는다. 소위 200 0 64 K의 의견은 일반 웹 사이트에 기반 하지 수 대표는 64 코드.
로그에서 발견 더 많은 HTTP 상태 코드 200 (일반), 304 (변경), 404 (오류 링크).
304는 콘텐츠 마지막 크롤링 이후 업데이트 되지 않았음을 나타냅니다. 일반적으로, 웹 사이트의 사진을 종종 그 값을 반환합니다.
404 대의원,이 링크에 대 한 액세스는 잘못 된 링크입니다. 원래 존재에서 한 손에이 오류 링크 페이지를 나중에 삭제, 다른 한편으로 없을 수 있습니다, 하지만 죽은 링크 체인 이외의 다른 사람.