검색 엔진 핵심 알고리즘: 자연 언어 및 부울 검색

출처: 인터넷
작성자: 사용자
키워드: 검색 엔진 알고리즘

중간 트랜잭션 http://www.aliyun.com/zixun/aggregation/6858.html "> seo 진단 Taobao 게스트 클라우드 호스트 기술 홀

내가 종사 검색 엔진에 관련 된 일 11 년이 되었습니다와 함께 오늘 당신은 검색 엔진 핵심 알고리즘에 대 한 이야기: 자연 언어 및 부울 검색. 토론 다음 결론에 지도: 검색 크롤 및 검색 엔진 페이지 순위를 몇 가지 추론 방법을 사용 하 고 결과 반환. 크롤러 웹 페이지, 검색 엔진 검색 쿼리 모드, 그리고, 비교 하 고 결과 반환 하도록 크롤러 식별 하는 패턴의 내용을 결정 하기 위해 관찰 모드.

이 이론은의 복잡성은 우리가 사용 하는 활성, 성장, 진화 하는 언어, 즉 언어 사용 패턴 변화는. 계속이 변화, 검색 엔진 있어야 합니다 활성, 성장 하 고 진화, 그래서 추론을 검색 엔진에 대 한 역을 찾는 방법을 이해에 매우 중요 한 개념. 그것을 이해 하는 가장 쉬운 방법은 검색 진화 하는 방법을 결정 하기 위해 과거와 현재의 검색 동작을 비교 하는 것입니다.

부울 검색 시작

오늘날, 사람들의 검색 방법 및 검색 엔진 그냥 나올 때 검색 완전히 다르다. 기억 하는 이전 아치, 고퍼, Jughead, 및 verojnuca 이러한 초기 인덱스 및 검색 프로그램의 능력은 상당히 제한 하였고 색인에서 정보를 찾기 위해 당신은 아주 잘 색인을 알고 있어야 합니다. 사실, 아치 및 고퍼를 사용 하면 문서 또는 당신이 찾고 있는 파일의 정확한 위치를 알고 있어야 합니다.

Jughead와 베로니카, 당신이 실제로 정보에 대 한 검색 수: 다음, 검색은 여전히 아주 기본 하지만. 때 검색 마침내 가능한 되 고, 파일을 찾는 방법에 대 한 몇 가지 엄격한 규칙이 있다. 검색 엔진의 초기 시절에 없었다 아무 매우 인기 있는 자연 언어 검색 오늘.

그들은 "그 문구"에 대 한 검색 보다는 "문구"에 대 한 검색을 원하는 또는 특정 문구. 검색 입력 논리는 방법 인덱스에 올바른 파일 또는 문서를 찾기 위해 필요한 사용자 지정 해야 합니다. 부울 논리 19 세기 세기에서 Georgeboole에 의해 제안 된 논리 대 수 시스템을 기반으로 합니다.

데이터 집합은 매우 초기 쿼리 요구 사항에 맞게 충분히 작은 때까지 실제로, 부울 논리 집합으로 데이터의 분해입니다. 예를 들어 검색할 때, 거기에 있을 수 있습니다 1000 페이지 "풀", "바다"에 대 한 1000 페이지에 대 한 네트워크 및 모든 2000 페이지를 반환 것입니다 "바닷물 수영장"를 검색 하는 경우. 이것은 너무 많이 이다. 그러나, 둘 다 "바닷물"를 포함 하는 페이지 및 "풀" 같이 그림 5-1에 원래 2000 페이지의 단지 작은 부분을 찾을 수 두 용어를 병합.

이 예에서는 더 나아가, "아닙니다 염소" 같은 한정자를 추가할 수 있습니다 있도록 데이터 컬렉션 범위. 이 한정자를 추가 하면 데이터의 다른 부분 제거 됩니다, 풀, 바닷물을 만족. 하지만 염소 쿼리 하지 적은 옵션을 같은

이 예제에서는 부울 검색에 사용 되는 3 연산자:, 또는, 비. 이러한 연산자는 상징에 의해 대표 될 수 있다 부울 논리 논리 대 수 시스템에 따라은:

•: +

비-정부;

• 나: 기본 연산자는 그들의 근접에 어떤 단어를 포함 하는 모든 페이지를 반환 합니다. 연산자는 단어 사이 공백이 표시 됩니다.

처음에, 2000 페이지, 있지만 검색 범위를 줄여 부울 논리 연산자를 사용 하 여 데이터 집합을 크게 분해. 당신이 더 많은 지금, 필요한 찾을 가능성이 있으며 빠르게 있습니다.

인터넷의 초기 시절에 검색. 부울 논리 도움이 됩니다 사용자가 파일 및 필요한 문서를 찾습니다. 관점에서 추론 방법의, 부울 논리 검색에 대 한 완벽 한 문제 해결 능력을 제공합니다. 하지만 기술이 점차 성숙 것입니다...

작은 역 (BET365) http://www.588m.com

관련 문서

연락처

이 페이지의 내용은 인터넷에서 가져온 것이므로 Alibaba Cloud의 공식 의견이 아닙니다.이 페이지에서 언급 된 제품 및 서비스는 Alibaba Cloud와는 관련이 없으므로이 페이지의 내용이 골칫거리 인 경우 저희에게 알려주십시오. 우리는 5 일 근무일 이내에 이메일을 처리 할 것입니다.

커뮤니티에서 표절 사례를 발견한 경우 info-contact@alibabacloud.com 으로 관련 증거를 첨부하여 이메일을 보내주시기 바랍니다. 당사 직원이 영업일 기준 5일 내에 연락 드리도록 하겠습니다.

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.