개요: 검색 엔진 거미는 검색 엔진 웹 사이트 방문, 페이지, 사진 및 기타 정보를 데이터베이스, 사용자가 검색할 때 검색 엔진, 피드백 설정의 텍스트를 크롤 링 하는 프로그램, 그것의 역할은 자체 검색 엔진은
검색 엔진 거미는 검색 엔진 자체 프로그램, 그것은 역할, 방문 페이지, 사진 및 기타 정보를 데이터베이스, 설정의 텍스트를 크롤 링 하는 웹 사이트의 의견 검색 엔진, 사용자 검색, 검색 엔진 필터링, 정보를 수집 합니다 복잡 한 정렬 알고리즘 그것으로 간주 하는 사용자에 대 한 가장 유용한 정보를 제공 합니다. 심층 분석의 사이트의 SEO 성능, 품질, 그리고는 포함할 수 있다 우리는 사이트를 최적화 하는 데 도움이 수 있습니다 다음 몇 가지 거미 크롤 링 우리가 검색 엔진 거미를 고려할 것입니다 일반 관련 개념:
1. 크롤링 속도: 주어진된 시간에 거미 되 면 웹 사이트 페이지의 수.
2. 크롤링 주파수: 얼마나 자주 검색 엔진 웹 사이트 또는 단일 웹 페이지에서 새 크롤링 시작 합니까?
3. 탐색 깊이: 시작 위치에서 거미 어떻게 깊은 클릭 수 있습니다.
4. 크롤링 채도: 가져온 고유 페이지 수.
5. 크롤링 우선순위: 그 페이지는 거미의 입구도 가장 자주 사용 됩니다.
6. 크롤링 중복:이 사이트는 일반적으로 얼마나 많은 거미는 동시에 크롤링.
7. 크롤링 매핑: 거미 크롤링 경로 복원.
이들은 우리가 그래서 데이터 분석을 사용할 수 있는 개념의 일부 소유권에 그들을 적용 하는 방법? 간단히 내 특정 아이디어의 일부에 대해 얘기 하자.
1. 크 리프 속도 유효성 검사 퍼지 경험적 이론 분석
검색 엔진 거미는 먼저 매개 변수는 크롤링 금액, 일반적으로 우리가 거미 크롤링 단위는 시간의 기간에 대 한 일의 양을 고려 다음 우리는 종종 하루 크롤링 속도 고려 고려의 분석. 물론, 조정할 수 있습니다 또한 시간 제한 자신의 필요에 따라 같이 나누어 모든 시간, 완벽 하 게, 기간 거미의 이해를 이해 하 고 다음 몇 가지 조정을 할 대상. 그 중, 분석의 종류 우리가 성취, 즉, 일부 퍼지 경험적 이론의 유효성 검사의 감각을 많이 가져올 수 있는 것 같아요.
예를 들어 우리는 종종 이러한 문장 들었어요: "할 사이트 콘텐츠 양적 업데이트, 검색 엔진 거미 크롤링 습관, 임의 변경 업데이트 시간, 교육 시간 사이트 크롤링의 내용에 거미에 영향을 미칠 수 있습니다",이 문장이 올바른지? 여기 설명 하는 검색 엔진 거미 크롤링 속도 분석 하는 사이트의 로그를 사용할 수 있습니다. 특정 작업 방법은 한 달 매일 거미의 모든 작은 시간 통계 (데이터 샘플 선택의 합리에 주의), 분할 상황을 크롤 링 하 고 다음 각 시간 기간 분석에 대 한 대비를 더 자주 검색 엔진 스파이더의 어느 시기를 찾을 수합니다 있습니다. 당신의 자신의 콘텐츠 업데이트와 비교 신속 하 게 결론에 올 수 있습니다.
2, 컬렉션을 향상 시키기 위해 등반 주파수 향상
검색 엔진 스파이더가 크롤 링 주파수 자주 사이트의 품질에 의해 결정 됩니다만 사이트는 더 신선 하 고 반복적으로 크롤링할, 많은 큰 콘텐츠-타입 사이트, 같은 거미를 유치 하기 위해서는 더 나은 콘텐츠 업데이트 콘텐츠 매일, 많은 거미는 역에 남아 있다 때문에 콘텐츠 페이지 크롤링 주파수 자연스럽 게 향상 됩니다. 페이지 콘텐츠에 대 한 크롤링 빈도 향상 하 고 링크 업데이트를 검색 엔진 스파이더가 빠른 크롤링, 더욱 완벽 하 게 사이트의 콘텐츠 정보를 페이지에 포함 될 수 있습니다.
많은 친구는 그들의 자신의 사이트 스냅샷 업데이트 또는 거미 발생 주파수를 캡처 충분 하지 않습니다 개인적인 느낌 몇 일 동안 지연 하지 않습니다 말했다. 업데이트 스냅숏 신속 하 게, 특히 새로운 역은 의향을 수행 해야 합니다 더 많은 콘텐츠, 아니 콘텐츠 업데이트, 일반 거미 크롤 링 포함, 또는 크롤 링 하지 않을 수 있습니다 하지만 할 데이터를 반환 하지, 다음 사용자 검색 검색 엔진 데이터베이스를 호출할 수 있습니다 때 일부 데이터를 저장 하는 경우 콘텐츠 페이지.
3, 거미 크롤링 습관을 연구 하 고 최적화 하는 습관
대 한 있는 검색 엔진 스파이더가 크롤 링 깊이, 채도, 우선 순위 크롤 링, 다시 중복 및 크롤링 경로 거미 크롤 링 습관 및 크롤링 전략 연구, 연습 분석을 타겟으로 하지 않습니다 때문에 그렇게 말할 수 있다만 이론적으로 그들의 자신의 아이디어에 대해.
검색 엔진 스파이더가 깊이 크롤 링 하지 않을 경우 충분히 깊은 곳, 주로 거미 완전히 크롤링할 수 여부 크롤링의 계층에 따라 여부 여기 체인 액세스 포트의 레이아웃에 관련 된 하지만 또한 사이트의 레이아웃의 구조에서 고려 하지 않았다 때문에 계정, 진단 할 일부 대형 사이트에 여러 번 입구의 일부의 우선 순위를 등반 거미 흐름을 강화 하 고 주요 전략적 배치를 포함 포털의 거미 크롤링 우선 순위 최적화 하는 것입니다, 그리고 일부 페이지에 nofollow 태그를 사용 하는 방법의 실현. 채도 분석할 필요가 또한 크롤링할 수, 단일 페이지 너무 크롤 링에 대 한 많이 우리가 제대로 다음 페이지 탐색에 대 한 이러한 자원의 할당을 제어할 수 있는 경우 거미 리소스를 낭비 하 고 프로 모션에 포함 하므로 큰 도움이 있어야.
중복 및 크롤링 경로 심층 분석을 해야 할 수 있습니다 그리고 경우 심층 기사 논의 될 거미 크롤 링에와 함께.