새로운 기술에 의해 전통적인 학문의 파괴: 혈통 네트워크 큰 데이터 추적을 사용 하 여 요구 조

출처: 인터넷
작성자: 사용자
키워드: 파괴 새로운 기술을 통해 우리 추적

패밀리 트리 매니아 인구 조사 기록, 출생 증명서 및 가계 웹 사이트에 다른 문서를 통해 친척에 대 한 정보를 찾을 것이 재미 있다 생각할 수 있습니다. 그것은 친구와 친척, 개인 기록을 보여주는 온다 고 조상의 사회적 파일 쉽게 덜 설득력이 있다.

Ancestry.com 서비스 뒤에 사람들은이 사실을 알고. 그들은 이제 사용자 컴퓨터 생성 하지만 편집 가능한 상위 정보 다이제스트 제공 하 (를 포함 하 여 공식적인 개인 기록, 사용자 제출, 및 기타 새로운 기능 데이터) 4PB 데이터베이스의 최대 사용이 하고있다.

스토리 보기, 조상에 의해 시작 했다 대상으로 고객의 작은 수 초이 분기, 그리고 지금 고객의 10% 서비스를 즐길 수 있다. 에릭 샤우프, 회사의 제품 수석 부사장, 그들은 전에 Stroy 보기 기능을 비교 하 여 고 이야기 보기 기능 공식적으로 출시 된 후 스토리 보기 보다 구체화할 계획 최근 인터뷰에서 말했다. 가계는 사용자 문서 이미지의 단일 페이지를 둘러싸고 파일의 텍스트 부분을 편집 하 여이 기능의 상호 작용을 강화 했다.

어떻게 작동

스토리 보기 기능 더 정교한 도구입니다 필기 레코드를 포함 한 친 족 관계 데이터의 데이터 마이닝을 기반으로 합니다. 하지만 때로는 키 필드 이름 등의 거주 장소. 고객 수 필기 레코드에 액세스, 친척의 설명, 찾아서 데이터는 처리 되지, 사람의 직업 등.

여 점차적으로 "keyers" 손으로 구문 분석 레코드와 검색 가능한 텍스트로 변환 레코드, 조상 필기 기록에서 더 많은 정보를 얻을 하려고 합니다. 이 방법으로 주소 추가 되었습니다 그리고 다른 분야 나중에 추가 될 것입니다. 같은 시간에 조상 해당 데이터베이스를 확장 하 고 사회 아카이브 가질 것 이다 더 많은 소스.

단락 요약을 생성 하는 여러 문서에서 정보를 추출, 가계 읽을 수 있는 복사본 (우리에 게 모든 실업자에 작은 부품을 만들 것 이라고 전설적인 기술)을 생성 하려면 컴퓨터의 사용에 초점을 2010 년에 설립 되었으며 서술 과학으로 향 했다. 스포츠 이벤트의 초기 응용 프로그램와의 수익 보고서 서술 과학 기술 개인 정보 처리에 대 한 더 많은 사용 되 고 지금 회사를 나열.

리드 McGrew, 조상 이야기 (설화)와 콘텐츠 (컨텍스트)의 수석 개발자 서비스 팀, 조상은 처음 서술 과학 기술 사용, 그것만 일괄 처리로 데이터를 생산할 수 있다. 그들은 재무 보고서를 많이 생성 그리고 하지 무엇 우리가 하 려 제공 하는이 배치 정말 느리기 때문에.

몇 달 안에, 서술 과학 보다 세부적인 수준에서 일할 수 있는 새로운 API 개발. "그들은 개별 사용자에 따라 사회 아카이브 생성," McGrew 말했다.

가계의 족보 정보 처리 전문, 회사의 편집자 제공 편집 기준, 또는 "규칙" 서술 데이터의 형식을 지정 하는. McGrew 조상 표준 설명 했다: "예를 들어 아이 보다는 그의 어머니는 더 젊은 10 년의 기록 처럼 입력 오류, 비록 현실에서 하지만 대부분의 경우, 마치 그것이 잘못이 기록 취급 됩니다 그래서 안에 일어날 것 이다."

상대 샤우프에 대 한 정보를 포함 하는 레코드

스토리 보기, 상위의 그림과 생활에서 요약 아래 확장된 문서 사진, 아니라 구조화 된 텍스트의 개별 필드입니다. 그림, 옆 조상 문서 정보에서 생성 된 리드를 제공 합니다. 조상 모든 레코드를 사람에 게 관련이 발견, 일단 가계의 편집 규칙에 따라 완전 한 문장으로 조립 될 것 이다. 문서 기반 리드는 브라우저에 표시 됩니다, 사용자가 편집 하 고 그들은 공유 하기 전에 그들을 저장할 수 있습니다.

공유 하기 어려운

가계의 CIO 스콧 소 렌 슨 말한다 도전을 만들고 사용자에 대 한 새로운 데이터 및 웹 페이지를 저장 하지 않습니다. 스토리지 저렴 지 고 정확한 필기 처리 문제가 되지 않습니다. 보통 keyers 중국에서 찾을 수 있습니다, 그리고 중국 문자 집합은 우리의 알파벳 보다 훨씬 큰, 그들은 이러한 레코드를 입력 하는 것을 매우 잘한다.

진짜 어려운 부분은 서비스, 바로 문서와 텍스트를 제공 하 고 해당 사이트 트래픽 봉우리, 충돌 없이 사용자의 수백만의 높은 가용성을 보장 하지만 스토리 보기의 목표 중 하나 더 많은 사람들이 사이트의 콘텐츠를 찾아서 결국 등록을 허용 하는 것입니다.

관련 문서

연락처

이 페이지의 내용은 인터넷에서 가져온 것이므로 Alibaba Cloud의 공식 의견이 아닙니다.이 페이지에서 언급 된 제품 및 서비스는 Alibaba Cloud와는 관련이 없으므로이 페이지의 내용이 골칫거리 인 경우 저희에게 알려주십시오. 우리는 5 일 근무일 이내에 이메일을 처리 할 것입니다.

커뮤니티에서 표절 사례를 발견한 경우 info-contact@alibabacloud.com 으로 관련 증거를 첨부하여 이메일을 보내주시기 바랍니다. 당사 직원이 영업일 기준 5일 내에 연락 드리도록 하겠습니다.

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.