중간 트랜잭션 http://www.aliyun.com/zixun/aggregation/6858.html "> seo 진단 Taobao 게스트 클라우드 호스트 기술 홀
검색 엔진 및 검색 엔진 최적화 (SEO)는 항상 한 쌍의 모순, 합리적인 최적화를 검색 엔진 사이트 콘텐츠 확인, 사이트의 홍보를 촉진 하는 데 도움이 되었습니다. 그러나, 긍정적인, 반대, 일부 seoers 페이지 및 페이지 순위 평가의 증가 수를 달성 하기 위해 검색 엔진을 속이기 위해 거짓 의미의 다양 한 있다.
초기 키워드 스택 스팸 방법 중 하나를 속임수, 중국어 단어 라이브러리는 소프트웨어를 직접 word에서 문서에 조각, 같은 문서는 실용적인 의미가 없고만 보고 검색 엔진을 줄 수 있는. 그래서 같은 문서에 대 한 검색 엔진은 어떤 방법으로 그것을 식별 하 여?
우리는 모든 검색 엔진은 웹 품질 부서, 바이 두와 검색 엔진의 다른 인공 처리에 대 한 모니터링, 사용자는이 사이트를 차단 하는 등 사이트 바이, 바이 직접 불만 발견 알고 있다. 하지만 구글 같은 정지는 또한 자동 검색 엔진의 처리, 부정 행위의 인식 늘어나고 키워드 더 중요 하다.
검색 엔진은 일반적으로 부정 말뚝 핵심 단어의 식별을 위해 통계 분석 방법을 채택 하 고.
검색 엔진 첫 번째 분사는 페이지, 단어 단어 n의 수 후에 완료 될 수 있다 및 통계에 기사의 많은 수에서 기사 L의 길이 L 문서와 단어 n 2 숫자 거기의 수의 길이가 특정 유통 관계, 발견 일반적 l/n에 대해 4-8의 의미 가치 사이 제한 5-6. 즉, 길이 1000 바이트 문서의 이어야 한다 125-250 분사 하지 않기 때문에 중국어와 영어 단어의 구성 일치, 영어와 중국어에 다른 것이 비율 범위. 검색 엔진 특히 큰 l/n를 발견,이 기사 l/n이이 문서는 의미 없는 기사의 일부 단어를 이루어져 있을 수 있습니다, 특히 작은 경우 현상, 말뚝 박기 하는 키워드의 존재에 존재 한다.
또한, 많은 수의 일반적인 문서를 통해 통계 발견 몇 가지 키워드와 검색 엔진 사이의 특정 유통 관계 웹 페이지 유통 및 유통 지도 키워드 말뚝 현상의 존재를 비교의 통계 결과 통해 수 있다 n/l의 높은 밀도의 수 있습니다.
또한, 검색 엔진 문서 자연 문서 인지 확인 하는 중지 단어 비율에서 또한 것 이다. 중지 단어는와 같은 "" "" 나 "" 이다 "등등 문서에서 일반적으로 사용 단어 또는 단어, 범위,이 페이지의 정상적인 비율에 텍스트 중지 단어의 비율이 되어야 하는 경우 웹 페이지 품질 모니터링 부서 감사에 제출.
물론, 더 많은 알고리즘 문서 자연 문서 인지 확인 하 고 웹 페이지 자연 언어 문서를 비교할 수 있습니다.
소위 마술 통치자, 타오, 일부 부정 행위자로, 그리고 속임수의 문장 구성 하는 대신 문서의 구성의 단어를 준, 부정 행위자로 파충류를 통해 또는 다른 방법으로 온라인 조 문장, 그리고 소프트웨어 기사에 몇 문장의 기사 수십 될 것입니다. 이 바람을 피우고 있는지 여부를 확인 하는 의미 분석을 할 검색 엔진 필요 하지만 의미 분석에 현재 연구는 지능형 검색 엔진의 다음 세대의 방향 연구 단계에 아직도.
그러나, 우리 여전히 비트 그 자동 기사, 그리고 인공 지능에 따라 기사의 세대는 여전히 인간으로 그들의 자신의 언어와 그들의 자신의 정보를 공부에 대 한 중요 한 방향을 생성할 수 없습니다. 부정 행위 및 부정 행위는 인공 지능의 연구를 추진 하겠습니다.
그러나 결국, 소프트웨어를 생성할 수 있습니다 경우 인간 문서를 이해할 수 있다, 이것은 스팸 메일 또는 본질? 말할 수 있는 당신은 확실히 지능의 현재 수준 아니다는 것을 충분히 높은 RSS 집계 문서 스팸 해야?, 만약 이러한 엄청난 양의 문서의 출현, 어떻게 할 우리가 직면이 현상?
저자: 클레이 입상
출처: http://www.nipei.com