검색 엔진 야 후의 분류 시스템 및 성능 평가

출처: 인터넷
작성자: 사용자
키워드: 검색 엔진 평가 야 후

중간 거래 SEO 진단 Taobao 게스트 클라우드 호스트 기술 홀

현재, 많은 검색 엔진 핵심 단어 계층적 항목 카탈로그 등 컴퓨터 검색 소프트웨어에서 제공 하는 키워드의 조합을 통해 네트워크 정보 리소스를 구성 하는 작업을 결합 합니다. 야 후가 클래스 스타일 테마 가이드 검색 엔진의 전형적인 대표 이다.

야 후의 매력의 검색 순위에 놓여 테마 색인. 분류 인덱스를 제공 하는 고급 검색 소프트웨어와 결합 하는 포괄적인 분류 아키텍처의 테마에 따라 야 후 성공적으로 설립 고유한 정보 관리 및 조직 메커니즘을 현실로 네트워크 정보는 종합 검색. 이 논문은 야 후의 클래스-대상 시스템, 분류 원리, 검색 방법 및 성능 평가에 대 한 추가 토론.

I. 분류 시스템

야 후 이루어져 있다 14 기본 범주, 예술 및 인문 (예술 및 인문학), 비즈니스 & 경제 (비즈니스와 경제학)를 포함 하 여 컴퓨터 및 인터넷 (컴퓨터, 인터넷/네트워크), 교육 (교육), 엔터테인먼트 (엔터테인먼트), 정부 (정부), 건강 (건강과 의학), 뉴스 & 미디어 (뉴스 및 미디어), 휴양 및 스포츠 (레저 및 스포츠), 참조 (참조), 지역 (국가 및 지역), 과학 (과학), Socialscience (사회 과학), 사회 및 문화 (사회와 문화)

정보 또는 웹 사이트의 크기와 지식 조직의 요구에 따라 각 기본 클래스는 하위 범주 또는 하위 범주, 그리고 더 많은 특정의 다른 수준으로 세분화 됩니다 하위 카테고리에 사이트의 주제. 그것은 범주 클래스 머리, 서브 클래스, 등 등의 상당히 상세한 디렉토리 계층을 설정합니다. 클래스 헤드 디자인은 합리적인, 구조는 완전 한, 포괄적인, 클래스 순서 계층은 별개, 수준의 세부 사항 광범위 한 학위 다르다, 따라서 온라인 풍부한 정보 자원 분류, 특히 정확한 분류에 대 한 기반을 제공 합니다.

Ii입니다. 분류의 원리

Internetscoutproject의 분류 전문가, Aimeeglassel, 말했다, "가까운 연결이 있다 인도에서 유명한 분류 전문가 결 장 분류의 전문가 Yangang Nazin의 시스템 및 야 후 네트워크 정보 자원의 주요 카탈로그 라이브러리 간의", 그것은 야 후의 패싯 분석의 방법을 사용 하 여 네트워크 정보 자원의 분류의 성격을 보여준다. 특히, 다음 포인트는 야 후의 면을 낸 분류 원리 또는 기본 프로세스에 대 한 깊은 이해 될 수 있습니다.

1.를 사용 하 여 광범위 한 주제 분야의 분류 인덱스 설정

그것의 분류를 만들기 위해 시스템 뿐 아니라 무한 한 수용 하지만 또한 꽤 있다 특별히 구체적으로 야 후 도메인을 사용 하는 상대적으로 광범위 한 주제, 분석 및 비교적 완전 한 분류 인덱스를 설정 하는 합성 메서드를 통해. 이것은 열거 클래스 테이블의 선형 단방향 구조를 피하기 위해 여러 가지에서 주제 콘텐츠는 Yangang Nazin 결 장 분류의 주요 원칙 반영 광범위 한 클래스 같은 면 지식을 나누어 있기 때문에 면을 낸 분류의 아이디어와 일치.

2. 문맥에 따라 정보 콘텐츠의 조합

야 후의 분류 구조에서 보이는, 생각할 수 있습니다 그것과 매우 가까운 동의어 사전 야 후는 또한 해당 개념 단어 문자열을 작성 하는 기호 보다는 어휘를 사용 하기 때문에. 그러나, 그것은 조합의 능력 보고 일반적인 동의어 사전 보다 훨씬 더 복잡 한입니다. 웹 페이지의 콘텐츠 기능을 분석 하 여 우리 개념 단어 문자열 얻을 또는 인덱싱 단어 문자열 일부 클래스 개체 단어 야 후 분류 아키텍처, 구성 하 고 해당 클래스 수준에 넣어. 야 후의 개념 문자열에 포함 된 독립 어휘 또는 검색 문자열 자체 이름을 포함 하지만 다른 단어와 결합, 그것은 문맥 관계를 만들고 깊은 의미가 있다. 이 관점, 및 faceted 분류는 매우 유사 합니다.

3. 정보 콘텐츠를 표시 하려면 콜론 사용

"1960 년대 인도 연구 결핵 치료에" 정보 콘텐츠를 색인에 구체적으로 둘 다의 마킹 시스템을 검사로 분류 됩니다.

Yangang Nazin에 대 한 콜론 분류에서 콘텐츠 표시 됩니다: l,45;421;6;253;f.44 ' N5

단어에 해당 기호를 바꿉니다.

의학, 폐; 결핵: 치료; X-ray:research.india ' 1950

면처리된 수식에서 해당 문장 부호를 콜론으로 대체 하는 경우 결과 문자열 형식으로 적절 하 게 표현 된 정보의 내용을 설명 하기 위해 야 후에 사용 되는 방법입니다.

건강: DiseasesandConditions:Tuberculosis

그것은 얼마나 비슷한 정보 설명입니다 볼 수 있습니다! 야 후로 사용 하 여 콜론 통합된 구분 정리 하 고 정보의 내용을 설명, 뿐만 아니라 원래 면처리된 표시의 특성을 유지 하지만 또한 어느 정도까지, 마킹 시스템 단순화 따라서 정보의 분류 색인의 효율성을 크게 향상.

4. 다른 분류 경로 입구를 제공

"정보의 가상 컬렉션" 개념적 모델 및 참조 순서 (즉, 프랙탈 순서)의 유연성에 구현 하는 야 후의 큰 장점이 다. 전통적인 도서관에서 책만 책장에 고정된 위치에 배치할 수 있습니다. 하지만 디지털 세계에서 전자 정보 자원은 더 이상 유일한 실제 위치에 제한. 우리는 클래스 구조체의 다른 위치에 정보 소스를 나눌 수 있습니다. 적용 하 여 면처리된 분석 방법 네트워크 정보 자원의 조직, 야 후는 서로 다른 경로에서 쿼리를 완료할 수 있도록 그것의 광대 한 분류 계층 구조에서 정보 소스에 대 한 다른 경로 지점 포털을 제공할 수 있게 동일한 콘텐츠를 검색 하는 다른 사용자에 게 서비스를 제공 하.

미국에서 위스콘신-매디슨 대학교의 홈페이지에 대 한 찾으려는 경우 예를 들어 야 후 제공 하는 다음과 같은 범주 또는 검색 경로:

(1) 지역에서 시작 하는 경우: 클래스, 해당 분류 경로: regional:u.s.states:wisconsin:cities:madison:education:collegesanduniversities:
Universityofwisconsin-매디슨입니다.

(교육 카테고리에서 시작 하는 경우 2) 처음 몇 경로: 교육: HigherEducation:CollegesandUniversities, Collegesanduniversities 디렉터리에서 지리적 영역의 하위 범주 선택 "unitedstates @", 당신이 볼 수 있습니다 고 지역 디렉토리, 그리고 이전 경로와 동일 하. 비밀은 상징의 사용에 "@", 유사한 참조 (CrossReference) 야 후의 다른 분기의 하위 집합에서 사용자 가이드를 제공 하는 계층 구조 검색의.

셋째, 검색 방법

야 후는 간단한 검색 및 상세 검색을 제공할 수 있습니다. 전 주로 그것의 분류 구조에서 첫 번째 수준의 카탈로그 검색, 후자 키워드를 사용할 수를 검색 하기 위해 부울 논리를 형성 하 고 검색 소프트웨어 주로 OpenText 회사에 의해 제공 됩니다. 2의 조합 이라고 구슬 벽: 하나의 주제 가이드의 강력 하 고 높은 품질 디렉토리 제공, 다른 검색 도구의 높은 수준을 제공 합니다. 또한, 검색, 야 후 뿐만 아니라 자체 테마 디렉토리를 검색 하지만 1 백만 웹 파일 받았다 OpenText 데이터베이스 제공 OpenText 회사 검색 됩니다.

명백 하 게, 야 후는 몇 가지 단점이 검색에서와 같은: 유일한 키워드 검색 및 부울 연산자만 지원 하 고 나, 알타비스타, 라이 코스, 등 등등에 하이퍼링크, 다른 엔진 근처, 등, 하지만 그것의 홈 페이지의 끝에 의해를 제공 하지 않습니다 사용자가 검색, 야 후의 단점의 숫자를 만드는 이러한 장소에 가이드. 그 결과, 야 후는 여전히 www는 가장 인기 있는 쿼리 도구 중 하나.

Iv. 성능 평가

테마 가이드 검색 엔진의 모델, 야 후는 다음과 같은 이점이 있습니다.

1. 주제 카탈로그 및 검색 소프트웨어의 완벽 한 조합

면 분석의 방법을 사용 하 여 정보 관리 전문가 주제 카탈로그를 선택 하 고 정보를 조직에 있는 사람들의 지혜와 지식을 반영 하 고 카탈로그 편집의 품질 향상을 컴파일합니다. 동시에 간단한 검색 소프트웨어 결함의 분류를 자동으로 완료를 극복 하기 위해 뿐만 아니라 필터링, 분류 하 고 정리 하 고, 웹 페이지의 제출에 대 한 매뉴얼의 테마 디렉토리에 따라 계층의 분류를 향상 시킵니다. 해당 검색 소프트웨어 또는 도구를 포함 하 고 제공 하는 높은 품질과 효율적인 검색 서비스, 따라서 시스템의 반사 속도 가속화, 통합 검색, 사용자의 정보 요구 하는 가까이 검색 결과의 정확성 향상.

2. 정보 검색의 어려움을 감소

야 후의 데이터베이스 구성 14 범주 (소규모 수업 다양 한 숫자)에 따라 분류 체계는 매우 상세한, 그래서 그것은 좋은 시작 지점 특히 그 새로운 사용자와 퍼지 요구 사항, 사용자에 대 한 광범위 한 주제 검색에 대 한 그것은 더 만들 검색 스타일 보다 점진적인 방식으로 확장 될 수 있는 항목 인덱스를 검색 하도록 선택할 자연. 그리고, 사용자의 클래스 아래에서 사용자 생각 너무 많이, 당신은 또한이 범위에서 키워드 검색을 사용할 수 있습니다 경우 항목의 수를 포함 하는 클래스의 수준을 보여줍니다. 야 후의 디렉터리 기능 및 콘텐츠 서비스를 사용 하 여 신속 하 고 쉽게 검색, 따라서 어느 정도 인터넷 정보 검색의 어려움을 절감 하 고 시스템의 사용자 편의성을 개선 가능

3. 분류 다양 한 검색 결과

야 후 분류 경로에서 시작 하 고 마지막으로 정보의 선택 추진 크게 클래스 출력 검색 구조를 나눕니다. 그것은 또한 해당 필요한 처리 결과 목록에서 콘텐츠, 일부 설명 어구 또는 문장을 선택 하는 사용자를 촉진 하기 위하여 추가: 같은: (*) 또는 (멋진) 태그 결과 항목이 다른 항목 콘텐츠 및 레이아웃 디자인에 우수한 나타냅니다; 최근 3;과 위의에 포함 하는 최신 콘텐츠를 나타냅니다 (새로운) 언급 "@ "관련 참조, 괄호에 포함 된 파일의 수를 나타냅니다. 또한, 야 후, 표시 되는 결과의 종류를 증가 웹 사이트 관련이 있을 수 있습니다, 그리고 관련 웹 페이지, 뉴스 및 해당 검색 결과의 다른 형태. 정리해 보면, 야 후는 사용자를 위한 더 나은 서비스를 달성 하기 위하여 그것의 정보 검색 서비스를 개선 하는 새로운 방법과 수단을 개발 하 고 있습니다.

야 후의 장점 요약 하지만 또한 그것의 결점에 주의 기울여야 한다, 이러한 결함은 종종 검색 엔진 일반적인 단점의 메인 테마:

1, 인터넷 정보의 급속 한 증가로 정보 수집의 속도 네트워크 리소스를 컴파일 항목 디렉터리의 속도 언급 하지 않기 위하여의 성장 율 보다 훨씬 덜 그렇게. 이 작은 데이터베이스에서 결과 및 문서 수 수집 제한, 단점의 일부 그래서 사용자가 종종 "에서 나 얽 매 인", 해당 정보 요구를 충족 하지 않을 수 있습니다.

2, 기본으로 설정 하는 단어 사이 간단한 검색 테이블 ". 또는.", 그리고 내장 자동 자르기 기능, 그래서 검색에 자주 나타나는 많은 없는 축약 결과 파일.

3, 쿼리의 다른 사용자에 적응 하거나 요구, 야 후는 같은 정보 콘텐츠 수 있습니다 종종 검색 제공 다른 경로 입구, 그리고 기호 "@" 해당 참조를 설정 하려면. 이 부분 확대 시키는 분류 작업, 다른 한편으로 또한 그것의 분류는 어려움 일관성 따라서 정확한 보호를 얻기 어려운 자주 시작 하 고, 특정 경로에서 나타나지만 수 없습니다 찾을 정보 콘텐츠를 야 후는 현상 포함.

4, 웹 페이지 또는 기타 정보 콘텐츠 증가의 복잡성에 포함 될 표시 되지 않습니다 또한, 어려움의 정확한 분류를 증가 같이 ActiveX 기술 문학에 관련 된 야 후에 정확 하 게 분류 하기 어려운.

5 높은 품질 항목 카탈로그를 컴파일하고 네트워크 자원의 개발의 속도 유지 하려면 상당한 인력, 재료 및 재정 자원을 투자할 필요 하 고 작업에 종사 하는 직원의 품질 요구는 증가 하 고 있다. 그렇지 않으면, 그것은 되지 않습니다의 테마 디렉터리의 품질을 보장할 수 있지만 또한 근본적으로 품질 서비스를 제공할 수 없습니다.

V. 폭로 및 권장 사항

야 후의 주요 하 고 가장 성공적인 부분은 이다 그것은 "터치 보드" 검색 엔진, 특히 설계 및 개발에 대 한 주제-가이드 카테고리에서 검색 엔진의 설정. 더 조직 및 네트워크 정보 자원, 특히 중국 정보 자원의 관리를 개선 하기 위해 야 후의 고급 검색 엔진 경험을 사용 하 여 하는 것은 역사는 우리에 게 주신 책임입니다. 지금 온라인 중국 정보 자원 높은 품질의 설립에 효율적인 "네비게이터" 넣어 앞으로 다음과 같이:

1, 야 후 디지털 정보 조직에 성공적으로 적용 프랙탈 분석, 정보 기관의 품질 향상을 위한 완전 한, 포괄적인, 계층적 명확한 주제 디렉토리 시스템의 집합 설정의 아이디어,이 우리의 참조 및 학습 가치가 있다.

현재, 중국에 많은 중국 엔진 분류 경로의 부족으로 인해 미래의 상황을 유지할 수 없습니다 하거나 그것과 정확한 분류 및 정보 검색에 어려움의 시리즈 카탈로그 시스템 필요한 분류 주제 이론으로 부족, 때문에. 우리가 반드시 야 후 분류 모드를 복사 하지 않습니다. 콘크리트를 컴파일 하는 과정에서 우리가 중국 생각 습관, 검색 습관 및 기존 이론 시스템 (예: "중간 차트 법")에 따라 필요한 분류 프레임 설정 해야 합니다.

2, 점차적으로 따라서 성공적인 정보 검색 소재 기초 누워 데이터베이스의 크기를 증가 한다. 두 가지 방법으로 데이터베이스의 내용을 보충 하는 것이 좋습니다: 하나는 사용자가 온라인 양식을 통해 자신의 웹 페이지 주소 (URL)를 제출 하도록 격려 하 고 두 번째 새로운 온라인 파일을 찾을 그들의 자신의 순찰 소프트웨어에 의해, 보완 하는 과정에서 데이터베이스에 포함 될 것입니다, 또한 일반 데이터베이스 콘텐츠 업데이트에 주의 기울여야 한다. 이 시점에서 중국 검색 엔진의 일부 여전히 충분 하지 않습니다, 그리고 종종 맹목적으로 채우기 정보, 하지만 콘텐츠 라이브러리의 부족 한다 유지 보수 작업, 거 대 한 데이터베이스, 낮은 검색 효율성, 정보 콘텐츠 사용 되지 않는, 정밀 차이 결과로.

3, 단순히 설명서 정보 분류 무능, 의존의 결손에 비추어 연구 여부를 사용할 수 있습니다 네트워크 정보 자원의 조직에 의해 자동 분류, 자동 색인 및 자동 요약 텍스트 환경에서 구현 되 고 더욱 완성 등 정보 콘텐츠를 처리 하는 고려해 야 할 이와 강화 되어야 한다. 매뉴얼과 기계를 이용한 조합 업무 효율 향상, 정보 조직 관리의 품질을 향상 시킬 것 이다.

또한, 우리는 검색 소프트웨어의 개발과 연구를 강화 하기 위해 계속 해야 합니다. WWW 웹 페이지 콘텐츠는 이미지, 애니메이션, 사운드, 비디오 및 기타 멀티미디어 정보로 구성 됩니다. 우리는 적극적으로 정보 검색 방법의이 종류를 탐구 해야 한다 하지만 키워드 검색 방법에 국한 되지 않습니다. 현재, 저장, 인덱싱 및 멀티미디어 정보 검색 컴퓨터와 정보 관리의 분야에 있는 사람들의 점점 더 많은 관심을 받고 있습니다. 이 기술 개발 해야 밀접 하 게 추적 되며 중국 엔진 검색 소프트웨어의 편집에 적용.

4, 정보 수집, 검열 및 직원의 품질의 조직 것입니다 직접 또는 간접적으로 영향을 주제 분류 시스템 품질의 준비. 따라서, 모든 부서 또는 네트워크 정보 서비스 산업, 특히 부서 또는 중국 검색 엔진을 개발 하는 기업에에서 종사 하는 기업에 인원, 정보 분류 조직, 컴퓨터 검색에에서 특히 그들의 능력의 훈련을 강화 한다. 조직 및 네트워크 정보 자원의 개발 어렵고 유망한 작품, 사서, 정보 관리 및 컴퓨터 분야 전문가 개념을 가능한 한 빨리 변경 해야 하 고 지속적으로 팀의 품질을 개량 하기 위하여 개발의 순위에 가입 광대 한 수 이다.

관련 문서

연락처

이 페이지의 내용은 인터넷에서 가져온 것이므로 Alibaba Cloud의 공식 의견이 아닙니다.이 페이지에서 언급 된 제품 및 서비스는 Alibaba Cloud와는 관련이 없으므로이 페이지의 내용이 골칫거리 인 경우 저희에게 알려주십시오. 우리는 5 일 근무일 이내에 이메일을 처리 할 것입니다.

커뮤니티에서 표절 사례를 발견한 경우 info-contact@alibabacloud.com 으로 관련 증거를 첨부하여 이메일을 보내주시기 바랍니다. 당사 직원이 영업일 기준 5일 내에 연락 드리도록 하겠습니다.

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.