중간 트랜잭션 http://www.aliyun.com/zixun/aggregation/6858.html "> seo 진단 Taobao 게스트 클라우드 호스트 기술 홀
seor에 대 한 서버 IIS 로그는 매우 중요 한 최적화 참조 로그 우리가 검색 엔진 거미 크롤링 상황을 볼 수 있습니다 그리고 또한 사이트 자체를 이해할 수 있기 때문에, 상황의 일부 또한 채널의 일부 사용자에 게 분석 될 수 있다 반드시 통계를 할 몇 가지 제 3 자 코드를 사용 하 여, IDC 공간 사업 제한 하 여 일부 IIS 로그 열어야 합니다를 참조 하십시오 그렇지 않으면 볼 수 없습니다,이 경우 설치 하려면, 당신이 할 수 전에 일부 소스 코드를 다운로드 하는 것이 좋습니다. 다음 특정에 작성 하 고 일부 서버 IIS 웹 사이트 수 있도록 설명!
(a) 거미 크롤 링 수 봐.
검색 엔진 거미 그래서 우리는 또한 거미 크롤 링, 간접 수 이해 검색 엔진 데이터베이스에 제출 콘텐츠를 크롤링 것 이다 로봇 사이트의 콘텐츠를 크롤 링 하는 데 사용 되는 우리의 사이트는 검색 엔진의 부탁을 배웠습니다. 또한, 우리는 또한 거미의 이력의 비교를 통해, 더 유용한 사이트의 사슬 밖에 서는 완벽 하 게 이해할 수 있다, 거미는 더 가치, 또한 페이지 콘텐츠 거미 처럼, 결코 수행 하는 우리의 사이트를 이해할 수 있습니다.
그 유해한 검색 엔진 거미에 대 한 우리 필요, 그들을 방패로 결국, 거미 나누어집니다 많은 종, 만약 우리가 찾이 미확인된 거미의 많은 어느 날 우리의 사이트에 크롤 링, 많은이 시간 우리 권리를 삭제를 피하기 위해 차폐 해야 하기 때문에 또한, 나는 그들의 자신의 웹 사이트를 크롤 링 하는 거미를 유치 하는 사람들을 사용 하지 않으려고 하 촉구 한다.
검색 엔진 거미는 많은 수의 사이트를 크롤 링, 의심의 여지가 그 서버 리소스는 특정 직업, 하지만 거미 우리의 사이트의 무게에 크롤 링의 많은 큰 도움이 그래서 중요 한 순간의 붕괴를 피하기 위해 더 나은 서버를 선택 해야 하는 것이 좋습니다. 다른 해커의 많은 그래서 우리는 또한 주의를 지불할 필요 사이트의 데이터 리소스, 훔치는 거미 크롤링 모드를 사용 하는 이해를 몇 가지 공식 게시판을 통해서이다!
(b)를 어떻게 거미는 페이지를 크롤 링을 참조 하십시오.
일반적으로 말하자면, 가장 소중한 거미는 우리의 웹사이트 홈페이지, 따라서 일반 홈페이지 스냅숏 업데이트는 가장 자주. 그리고 내부 페이지는 또한 자주, 그것은 두 번째 우리는 종종 같은 효과, 일부 페이지의 경우 되지 않습니다 말 스파이더에 의해 크롤 링을 도달할 것 이다, 우리 수 ISS 로그 우리가 말를 통해 금지 거미 크롤 링. 또한, 이해는 체인에 밖에 서 하는 과정에서 많은 웹 마 스 터는 집 주소, 여기 나 일부 더 많은 열 기사 페이지의 외부 체인 해야 할 당신을 촉구, 우리의 컬렉션은 큰 도움이, 그리고이 우리는 또한 우리의 사이트 조건 중 일부을 이해할 거미는, 어떤 페이지에서와 같은 어떤 페이지 크롤링 상대적으로 자주 페이지를 크롤 링 하지, 크롤링도 포함 하지 않았다, 그래서 우리 정리, 우리 보다 정확 하 게 어떤 거미 더 많은 콘텐츠를 선호 하 고 또한 거미가 크롤 링 체인의 역할 또는 우리의 콘텐츠에 관심을 볼 수 있습니다 이해할 수 있다.
(iii) 웹 사이트 HTTP 코드 분석입니다.
거미 크롤링 크롤링 우리의 웹사이트의 내용을 알고 일반적으로 남겨 200 보여 일반적으로 반환 된 HTTP 상태 코드를 나타냅니다 직접 해제 하지 않을 수 있습니다, 즉, 감사 기간을 필요 합니다.
이 작품에 대 한 다음 저자 자신에 게 두 만든 대답, 웹 마 스 터 도움말 수 있도록 노력 하겠습니다.
사이트가이 페이지를 존재 하지 않는 때, 1, 404 또는 200을 반환 해야 합니까?
첫 번째 대답은 반환 404 값이 올바른, 우리 모두 404 페이지 검색 엔진을 말할 수 있는 알고 있기 때문에이 페이지는 잘못 된 페이지를 액세스할 수 없습니다 하지만 200 이면 그것은 동일 하지 않습니다, 그것 때문에이 페이지를 크롤링할 수, 그러나 거미 크롤 링을 발견 했을 때 액세스할 수 없는 상태 여야 합니다. 너무 너무 많은 이러한 페이지 직접 하면 우리의 사이트 바로 공화국에 의해 검색 엔진에 의해
2 때 건축 주 또는 기록, 사이트 상태 코드를 반환 해야 합니까?
대답은 503 상태, 503 검색 엔진 사이트는 단지 일시적으로 방문 하 고, 수 말할 수 있기 때문에 특정 시간에 복구 될 것 이다, 다른 상태 코드, 검색 엔진, 특히 404 페이지에 액세스할 수 없습니다, 하자 검색 엔진 직접 사이트 더 이상 존재 한다고 생각 됩니다.
404 페이지에 대 한 사실, 우리의 사이트는 또한 좋은 도움, 그래서 귀하의 사이트의 오 404 페이지를 기억 하는 것이 좋습니다.
(4) 로그 분석 전문 도구 사용
사이트에 대 한 PV 값이 의심할 여 지 없이 식의 사용자 경험 사이트 수 없습니다 열거나 가난은 우리의 사이트에서 높은, 뛰어 오를 때의 콘텐츠 사이트 순위 말 하지 마 그리고 매미, 페이지 액세스는 높은, 찾을 수 없습니다 이를 개선 하기 위해 사용자의 요구를 탐험 수 있습니다. 하지만 우리의 사이트 오랜 동안 열려 있지 않거나 방문 느립니다, 그럼 우리가 볼 수 있는 로그에서 일부 악의적인 트래픽을 공격, 우리는 중 타협,이 상황이 나 보고서, 얼굴 또는 직접 서버를 변경 하려면 여부.
웹 사이트에 대 한 사용자가 귀하의 사이트에 클릭 하지 마십시오 경우 표시 귀하의 사이트는 매력적인, 검색 엔진 것 이다 또한 사이트 라고 생각 하지는 좋은 사이트, 그래서 그것은 매우 중요 한 사용자 경험 스튜디오를 할 정도로. 마지막으로, 두 보다 전문적인 IIS 로그 분석 도구를 하는 것이 좋습니다.
1입니다. Awstats,
2입니다. Webalizer
이 두 가지 도구 사이트의 상태 코드 (⊙o⊙) 오의 일부를 분석 하실 수 있습니다!
요약: 웹 사이트의 IIS 로그 작업의 모든 측면에서 사용자 경험 사이트 최적화에 대 한 좋은 도움이 되 고, 우리에 추가할 수 일부 작은 세부 우리 우리의 사이트는 자연스럽 게 검색 엔진의 호의 얻을 수 있는 좋은 일을 하 고 주의를 소홀히 우리의 사이트의 이해 그리고 k 또는 오른쪽 아래로 우리의 사이트에서 전에 몇 가지 이해 오를 제출할 수 있습니다,이 시간 우리가 수행 대상된 개선, 여러 번 피할 수 있습니다. 이름 순 Http://www.name2012.com 원래 공유 하 여이 문서 희망 친구를 무단 전재, 링크 및 저작권, 여기 당신을 감사 하 고 유지 하는 기억. 공유 하는 오늘 잘 당신과 함께 여기, 난에 있을 것입니다 많은이 플랫폼, 당신과 함께 의사 소통을 다음 다음 번 우리가 참조 하십시오.