키워드 최적화를 달성 하기 위해 자신만 검색 엔진을 배포

출처: 인터넷
작성자: 사용자
키워드: 검색 엔진 최적화

중간 트랜잭션 http://www.aliyun.com/zixun/aggregation/6858.html "> seo 진단 Taobao 게스트 클라우드 호스트 기술 홀

종종 키워드 최적화를 논의 하기 위해 웹 마 스 터 친구를 볼 수 있지만 또한 친구 "축적" 키워드를 귀찮게 하는 웹 마 스 터를 참조 하십시오. 키워드 최적화 경험을 할 검색 엔진의 사용을 공유할 수 있습니다 여기.

면책 조항:이 경험 적용 역의 특정 기술 능력을 요구 하는 서버는 자바 운영 환경, Jdk, 같은 수 고양이. 이러한 조건 없는 경우 수동 방식으로 구현할 수도 있습니다 하지만 비교 시간이 걸립니다.

이 경험 Javaeye 포럼에 의해 영감을 했다. 인터넷에 대 한 기술 정보를 검색할 때이 포럼 게재의 기회가 매우 높다. 클릭 하십시오, 그들의 대부분의 기사 목록이 있습니다. 기사 목록 양식을 사용 하 여 핵심 단어를 충족 시켜 주고, 일치 하는 확률은 물론 큰. 그리고 귀하의 문서는 확실히 다른 키워드, 많은 일치 공식적인 내용을 볼 수 검색 엔진에서 하드 힙, 자연스럽 게 같은 것입니다. 사용자 경험에서 넣으면 자신의 데이터베이스 사용자에 게 표시, 성은 또한 최상의 사용자 경험, 사용자가 카테고리, 페이지에 대 한 보고에 비해 가장 관련성이 높은 것 들의 경우는 백배.

이유는 매우 간단 하 고, 달성 하는 방법에 초점. 필자의 구현 오픈 소스 검색 엔진 SOLR와 오픈 소스 중국 단어 세분화 시스템 paoding (중국 기여 Sunding 소프트웨어)를 사용합니다.

SOLR 인덱싱 Lucene, 둘 다 아파치 오픈 소스 조직에 의해 착수 하는 오픈 소스 기반, 공식 웹사이트 주소:

lucene:http://lucene.apache.org/

solr:http://lucene.apache.org/solr/(SOLR is a subproject under Lucene, SOLR readable as "sweep")

이 검색 엔진 크롤 러는 덧붙여 또한 Lucene Nutch 아래 또 다른 하위 프로젝트를 언급, 인트라넷 또는 인터넷을 크롤링할 수 아주 멋진! 고급 컬렉션을 재생 하려면 배울, 물론, 자바 프로그래밍 기술.

점에, 우선, Lucene의 역할. Lucene은 인덱싱 시스템 키워드를 제외 하 고는 후자 색인 뿐만 아니라, 하지만 또한 유지 하는 데이터 관계 등의 다른 콘텐츠 데이터베이스 같은 약간은 콘텐츠 인덱스 수입니다. 그러나 전체 텍스트 검색 기능에 후자는 전체 텍스트 검색을 지원 하기 위해 상대적으로 가난한, 고급 데이터베이스 시스템 그리고 MySQL 데이터베이스의 사용의 대부분은 이러한 기능. Lucene 동일 하지 않습니다, 그리고 그것은 저장소의 의미 및 데이터의 유지 보수, 텍스트 콘텐츠 세분화 인덱스 될 인덱스, 이렇게 태어난. 예를 들어 텍스트 "Hello World" 라는 단어가 있는 경우 그것은 안녕하세요, 세계 두 단어 밖으로 구문 분석 되며 안녕하세요, 세계 두 키워드 색인 디렉토리에 색인 항목으로 추가. 이것은 다른 쿼리 같은 SQL, 데이터베이스 필드 콘텐츠를 분석 하지 않습니다 하지만 필드 인덱스에 대해서만 필드 빈 쿼리 할 수 있습니다 그것은 실제로 문자열 일치, 그래서 비효율적인, 압력을 견딜 수 없습니다. 그래서 아주 소수의 사람들이 큰 사업 볼륨 검색 처럼 사용합니다.

와 Lucene, SOLR 무엇입니까? Lucene만 프로그래밍 인터페이스를 제공 하 고 SOLR는 아웃-의-더-박스 건. 공식적인 지침을 참조 하 고 곧 SOLR 검색 서비스를 올릴 수 있을 것 이다 생각 하십시오. SOLR를 구성 하는 유일한 장소 Schema.xml, 저자, 분류, 제목, 내용, 이러한 필드의 형식과 함께, CMS 시스템의 마지막 기사에서 사용 하는 필드와 일치 해야 하는. 다른 필드 형식에는 그들의 검색 성능에 영향을. SOLR 선반 준비은 그것을 사용 하는 방법? 두 인터페이스 (간단한 바,만 두 개의 인터페이스)를 제공 합니다, 하나는 업데이트, 하나는 선택, 업데이트 및 쿼리 (삭제 업데이트에 속함)에 해당. 업데이트는 정확한 URL을 지정 하는 XML 문서를 게시 하는. 주요 섹션 포맷은 대략 다음과 같습니다.

1, 추가/갱신 (예, 추가 또는 업데이트, 형식 필요.) 즉, 지정된 된 ID에 대 한 기록 이미 있으면 그것을 업데이트 하거나 그것을 추가 합니다.

<? xml 버전 = "1.0" 인코딩 = "UTF-8"? >
문서 > < 추가 ><
< 필드 이름 = \ "id\" > [문서 id] < / 필드 >
< 필드 이름을 "제목" = > [문서 제목] < / 필드 >
< 필드 이름 = "내용" > [기사] < / 필드 >
<!-다른 문자 Gello->
< / doc >< / 추가 >

2, 삭제 나뉘어져 ID 삭제 및 쿼리 삭제, 후자 삭제 일치 하는 모든 쿼리 상태 기록.

Id] < /id >< / 삭제 > < 삭제 >< id > [기사
< 삭제 >< 쿼리 > [쿼리 문자열] < / 쿼리 >< / 삭제 >

선택에서 다시 찾고, 쿼리는 상대적으로 간단 합니다. 일반적 Schema.xml 수 기본 쿼리 필드를 정의할 수 있습니다 수 여러 필드의 조합만 키워드 쿼리 당신은 이러한 필드에 갈 것 이다. 필드를 지정 하려면 필드 이름 형식으로 쿼리할 수 있습니다]: [키워드 쿼리 합니다. 복잡 한, 그것은 또한 논리 조합 지원 이며 관련된 문서를 보고에 관심이. 선택 도보 Get 인터페이스, get 방식으로 쿼리 요청을 보낼 사용할 수 있습니다, 주요 분야는 Q, 이것은 또한 주요 검색 엔진 쿼리 키워드 필드 이름을 사용 하는. 당신이 필요가 있는 무엇을 언급 하는 것은 select 쿼리의 결과 XML 형식 및 XML 문서를 구문 분석 하 고 데이터를 꺼내 프로그램을 작성 해야. 그럼 그냥 따라 데이터베이스에서 읽고 그것을 사용 하는 당신이 좋아하는 만큼 데이터. 쿼리 결과 다음과 같이 서식이:

&lt;? xml 버전 "1.0" 인코딩을 = = UTF-8 "? &gt;"


&lt; 응답 &gt;


&lt; 순 이름 "Responseheader" = &gt;


&lt; int 이름 "상태"를 = &gt; 0 &lt; / int &gt;


&lt; int 이름 "Qtime" = &gt; 1 &lt; / int &gt;


&lt; 순 이름 "매개 변수" = &gt;


&lt; str 이름 "들여쓰기" = &gt;, &lt; / str &gt;


&lt; str 이름 "시작" = &gt; 0 &lt; / str &gt;





&lt; str 이름 "Q" = &gt; 약간 깨진된 자식 &lt; / str &gt;


&lt; str 이름 "행" = &gt; 10 &lt; / str &gt;


&lt; str 이름 "버전" = &gt; 2.2 &lt; / str &gt;


&lt; / 순 &gt;


&lt; / 순 &gt;


&lt; 결과 이름 = "응답" numfound = "시작 =" "0" &gt;


&lt; doc &gt;


&lt; str 이름 "CategoryID" = &gt; a8ea126f3128443fbb2d17e0d5e3c55f &lt; / str &gt;


&lt; str 이름 "범주" = &gt; 약간 깨진된 자식 &lt; / str &gt;


&lt; str 이름 = "내용" &gt; &amp; 앰프; lt; p &amp; amp; gt; 나중에 작은 찾기 위해 아이 들 그리고 왕 양 소 구, 전에 게시물 또한 와인의 3 개 이상의 그릇을 마 셨다. 로 서 저장, 속담 하 신 분, 소 구만 세 그릇, 상점 좋습니다 작은 깨진된 아이 안 소 구, 작은 아이, 깨진 교차 했다 작은 돈을 게 그냥 뭐, 말 안 하 고 보낸 약간 깨진된 아이 스틱 좋은 12 호랑이. 깨진된 아이 언덕을 교차 수 있습니다.? 깨진 어린이 시리즈 애니메이션 단편 영화 "Jing 양 갱"를 참조 하십시오. &amp; amp; lt; /p &amp; amp; gt; &lt; / str &gt;


&lt; 날짜 이름 "만든" = &gt; 2009-08-04T17:18:44Z &lt; / 날짜 &gt;


&lt; str 이름 = "설명" &gt; 찾으려고 작은 나중에 작은 깨진된 아이 왕 양 소 구, 전에 게시물 또한 와인의 3 개 이상의 그릇을 마 셨다. 로 서 저장, 속담 하 신 분, 소 구만 세 그릇, 상점 좋습니다 작은 깨진된 아이 안 소 구, 작은 아이, 깨진 교차 했다 작은 돈을 게 그냥 뭐, 말 안 하 고 보낸 약간 깨진된 아이 스틱 좋은 12 호랑이. 깨진된 아이 언덕을 교차 수 있습니다.? 깨진 어린이 시리즈 애니메이션 단편 영화 "Jing 양 갱"를 참조 하십시오. &lt; / str &gt;


&lt; str 이름 = "id" &gt; 5ed7054bf108454db2b0216fbc006934 &lt; / str &gt;


&lt; str 이름 = "키워드" &gt; 징 양 갱 3 그릇을 갱 작은 아이 깨진 하지만 12 호랑이 &lt; / str &gt;


&lt; 날짜 이름 "수정" = &gt; 2009-08-27T20:46:09Z &lt; / 날짜 &gt;


&lt; int 이름 "상태"를 = &gt; 1 &lt; / int &gt;


&lt; 날짜 이름 "타임 스탬프" = &gt; 2009-08-27T15:59:48.821Z &lt; / 날짜 &gt;


&lt; str 이름을 "제목" = &gt; 소 구 하지만 세 그릇: 작은 깨진된 아이 킹 양 갱 12 타이거 기억 &lt; / str &gt;


&lt; / 문서 &gt;


&lt; doc &gt;


&lt; str 이름 "CategoryID" = &gt; a8ea126f3128443fbb2d17e0d5e3c55f &lt; / str &gt;


&lt; str 이름 "범주" = &gt; 약간 깨진된 자식 &lt; / str &gt;


&lt; str 이름 = "내용" &gt; &amp; 앰프; lt; p &amp; amp; gt; 작은 깨진된 아이 9 태양의 촬영 보복 후, 나중은 나중에 위의 모든 하루 울고 달 Diao 까마귀. 약간 깨진된 아이 매우 불안 하 고,이 수행 하는 방법? 지금, 당신은 저장은 나중에 아이 도와-나중에, 달에 작은 깨진 아동의 작업 당신을 보고! &amp; amp; lt; /p &amp; amp; gt; &lt; / str &gt;


&lt; 날짜 이름 "만든" = &gt; 2009-08-04T17:18:44Z &lt; / 날짜 &gt;


&lt; str 이름 "설명" = &gt; 9 태양의 촬영 후 작은 깨진된 아이 복수, Ya Ya 까마귀 Diao 위의 모든 하루 울고 달에. 약간 깨진된 아이 매우 불안 하 고,이 수행 하는 방법? 지금, 당신은 저장은 나중에 아이 도와-나중에, 달에 작은 깨진 아동의 작업 당신을 보고! &lt; / str &gt;


&lt; str 이름 = "id" &gt; 4c0cfeb8990c455da88aeaabd864bca8 &lt; / str &gt;


&lt; str 이름 = "키워드" &gt; 작은 아이 벤 달 게임 &lt; / str &gt;


&lt; 날짜 이름 "수정" = &gt; 2009-08-27T16:48:39Z &lt; / 날짜 &gt;


&lt; int 이름 "상태"를 = &gt; 1 &lt; / int &gt;


&lt; 날짜 이름 "타임 스탬프" = &gt; 2009-08-27T15:59:43.021Z &lt; / 날짜 &gt;


&lt; str 이름을 "제목" = &gt; 작은 깨진된 아이 벤 문 게임, 내가 서 장 E! &lt; / str &gt;


&lt; / 문서 &gt;


&lt;!-이것은 다른을 생략 하는 공간을 제한 결과 →





&lt; / 결과 &gt;


&lt; / 응답 &gt;

이 이번에는 실제로 문제가 있는 것입니다, 그 때때로 일치 하는 키워드 하지 단어입니다. 우리는 알지만 영어 단어는 공백으로 구분 하 여, 중국어 단어 더 복잡 하 고 심지어 사람들이 읽을 것입니다 모호한 단어의 일부. Lucene은 외국인의 가제트, 아니 내장 중국 단어 세분화 시스템으로 인접 문자열, 일치 하는 중국어를 검색할 칠 것 이다. 이 일치 하도, 그리고 나쁜 사용자 경험에 감소 됩니다. 아마 당신은 생각 그것은 아무것도, 그것은 좋은, 한 결과 누설 하지 않습니다. 하지만 당신이 생각 하는, 주요 검색 엔진은 바보, 학위 일치 결과 페이지는 높은, 키워드의 무게에 영향을 미칠 것입니다.

별로 라고, 제발 중국 열 소스 단어 시스템 Sunding (paoding). 소스 한 번 중국 사람들이 하지 기여 하 게 하기 때문에 중국의 차폐 및 IP, Sunding, 참조는 중국인으로 서 자랑 스럽습니다. 기여 하지 누가 중국? Sunding 및 상업 중국어 단어 분할 소프트웨어 여전히 있어야 간격, 하지만 키워드 최적화 할 수 사용. SOLR의 schema.xml 구성 파일에 해당 구성을 추가 하 여 검색 엔진 이루어집니다 있도록 paoding 구성 파일에서 사전 경로 일치 해야 합니다.

다음 프런트 엔드 최적화 디자인입니다. 이 탭 검색 결과 페이지를 가리킨 홈 페이지에 몇 가지 인기 있는 키워드 태그 할 수 있습니다. 효과 내 배포 된 경우 중 하나를 참조할 수 있습니다: http://www.kaoly.com/t-%E9%BB%84%E9%87%91%E7%9F%BF%E5%B7%A5.html. 또한, 일부 무료 CMS 시스템 설명 레이블 기능, 검색 기능, 심지어는 하지만 검색 기능 Lucene와 비교할 수 이며 그것의 라벨은 더 많은 수동 또는 자동 유지 보수, 상관도 직접 비교 검색에 검색 엔진 또한 어려운. 당신이 경우 귀하의 검색 엔진 알고리즘은 충분히 가까이 큰 검색 엔진에 좋은, 검색 결과 가장 인기 있는 검색 엔진에 귀하의 모든 콘텐츠 되어야 합니다 생각 합니다. 우리는 모두 이것을 이해 하는 것이 믿습니다. 레이블의 설립의 편의 말할 것도 없고 좋은 키워드를 찾는, 언제 든 지, 단순히 그것에 대 한 링크를 할 태그를 추가할 수 있습니다. 일반적인 무료 CSM 시스템 내에 좋은 기능이 없습니다 믿 었 다. 또한 태그의 창조에 자동으로 검색할 수 있습니다, 경우에 그것의 라벨은 관련 검색 엔진으로 그것을 할 검색 엔진, 설계 되지 않았습니다 때문에 그것은 몇 가지 유용한 추가 작은 기능을 제공할 수에 대해서만.

여기 쓰기 키워드 최적화 체계 완성 된 소개를 달성 하기 위해 검색 엔진을 될 것입니다. 그것은 내 시간과 공간을 제한 하는 솔루션의 소개 때문에 많은 배포 내용은 언급 하지는. 당신이 관심이 있다면, 관련 설명서를 참조 하거나 저 (qq:1017273876)에 게 연락 수 있습니다. 마지막으로 웹 마 스 터 그물과 웹 마 스 터 웹 사이트 더 불, 더 적립 더 많은 돈을 하는 것이 좋겠다!

관련 문서

연락처

이 페이지의 내용은 인터넷에서 가져온 것이므로 Alibaba Cloud의 공식 의견이 아닙니다.이 페이지에서 언급 된 제품 및 서비스는 Alibaba Cloud와는 관련이 없으므로이 페이지의 내용이 골칫거리 인 경우 저희에게 알려주십시오. 우리는 5 일 근무일 이내에 이메일을 처리 할 것입니다.

커뮤니티에서 표절 사례를 발견한 경우 info-contact@alibabacloud.com 으로 관련 증거를 첨부하여 이메일을 보내주시기 바랍니다. 당사 직원이 영업일 기준 5일 내에 연락 드리도록 하겠습니다.

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.