중간 트랜잭션 http://www.aliyun.com/zixun/aggregation/6858.html "> seo 진단 Taobao 게스트 클라우드 호스트 기술 홀
내부 체인: 귀하의 웹사이트 및 웹 사이트 내에서 관련된 페이지를 링크의 내용에 관련 텍스트에 링크를 추가 하는 수단을 의미. 비어 있는 링크 건설 내부 합리적인 사이트는 검색 엔진의 수집 및 웹사이트 무게 강화할 수 있다. 상대 외부 링크, 내부 링크도 중요 하다.
전통적인 방법으로
시스템 또는 보도 자료 시스템을 달성 하기 위해 다음과 같은 방법을 통해 보통 내부 체인 (라벨)에 대 한 호 들 갑을 사용 하는 경우:
데이터베이스: 문서 (문서의 테이블) 필드 (ID, 제목, 본문, Adddate, userid), (내 목록) 키워드 필드 (ID, 이름, 링크)
문서, 목록 내에서 모든 문서의 본문을 대체 하는 루프의 자료.
그것은, 만약 우리가 2W, 5W, 이상 등 내 면 우리의 목록에 있는 데이터의 많은 하지만 원하는 기능을 얻을지 않습니다. 각 게시물 및 수정의 효율성은 생각할 수 있는. NetEase의 뉴스, 바이 두의 백과 사전 그리고 큰 웹 사이트를 공격 하는 방법 이다 그것을 달성 하는 방법에? 만약 위의 방법에 따라, 시스템 몇 개월만에 붕괴 됩니다.
분석 및 비교
얼마나 많은 단어 (HTML 코드 제외) 일반 문서에 있을 것? 1W? 1W 문서는 아주 긴, 이미 하 고 싶습니다는 1W에서 직접 문서 몇 사람이 읽을 인내심을가지고 믿는 경우는 페이지에 있을 것 같아요. 페이지와 사용자 경험, 편집자는 기사, 또는 너무 많은 콘텐츠를가지고 있으며 매우 긴 챕터로 보통 분할 된다. 만약 우리가 사전에 수 제 추출, 그리고 효율성을 크게 향상 시킬 수 있도록 데이터베이스에서 다음 검색에서 단어의 체인에 나타날 수 있습니다? 대답은 ' 그렇다. 우리 1 W word 문서, 문서의 모든 텍스트 체인 필요가, 사이클의 수는 1W 시간 가정. 위의 예제 보다 훨씬 더 나은?
전통적인 방법으로, 여부, 측면 전체 목록의 내용을 넣어. 생각의 다음 종류는 사전에, 밖으로 정렬 하는 모든 단어의 체인에 나타나고 다음 이러한 단어를 사용 하 여 각각 연결된 리스트를 검색 하기 위해 가능성이 있을 것입니다. 이러한 비교 문제가 나온다.
새로운 아이디어입니다: 단어를 꺼내 문서에서 필요한 체인, 그리고 쿼리 목록.
가능한 작업
잠시 동안, 우리는 전통적인 방법으로 수동 및 활성 방법으로 생각의 새로운 방식으로 호출합니다.
활성 메서드의 구현은 다음과 같습니다.
중국어 단어 분할 기술을 사용 하 여, 우리는 분사에 대 한 문서를 가질 수 있습니다. 그런 다음 단어 후 어휘에 따라 필터를 일반적인 소유격 대명사, 부사, 외침 등등. 넣어 명사, 브랜드, 장소 이름, 상표와 너무에, 또는 그들의 자신의 동의어 사전 테이블에 따라 분사. 다음 목록, 검색 단어 나머지 우리 링크, 패스에 존재 하지 않는 경우.
위의 예비 아이디어, 실제 구현에서 프로세스 요인이 많이 고려해 야. 핵심 포인트는 세그먼트에 생각 합니다.