숫자와 함께 모든 큰 데이터를 읽고 세계

출처: 인터넷
작성자: 사용자
키워드: nbsp 우리 도서관 디지털화

1990 년대 초부터 디지털 기술은 우리 삶의 방식을 근본적으로 변경 되었습니다. 이제 우리는 포괄적인 변환 변환 디지털 형식으로 아날로그 형태로 기록 하는 모든 인간의 지식에 착수 하려고입니다. 미래의 창 일로 다시 과거, 미래를 상상.

바바리아 도서관의 수집 되는 검색 및 인터넷에 업로드.

Zouze (주제), CERN, 주 커 버그 (커)-이 세 명의 이름을 표시 디지털 혁명 과정에서 중요 한 이정표. 1941 년, 이르면 콘라드 Zuse 베를린에서 제대로 작동 하려면 세계의 첫 번째 컴퓨터 개발. 그는 거 대 한 디지털 컴퓨터 "Zuse Z3" 이라고합니다. 1991 년 의해 팀 버너 스-리는 CERN, 스위스의 개발 했다 월드 와이드 웹은 세계 대 중에 게 열려 있습니다. 웹 기술 더 사람들이 의사 소통, 구글, 아마존, 다른 수많은 기업에 대 한 방법을 포장 하는 방법을 혁명을 했다. 나중에, 2004 년에, 마크 주 커 버그 소셜 네트워크 페이스 북을 라는 만들었습니다. 오늘, 페이스 북과 유사한 네트워크, 덕분에 거의 2 십억 명 디지털 id를 인수 했습니다.

컴퓨터, 웹, 페이스 북과 디지털 기술을 기반으로 합니다. 정보화의 의미 0과 1의 많은 수의 구성 된는 쉽게 저장 이진 코드로 텍스트, 사운드, 이미지 및 비디오와 같은 아날로그 정보를 변환 하는. 이러한 디지털 항목 만들어지면, 무한, 재생 될 수 있다 고 품질은 영향을 받는, 그리고 인터넷을 통해 전 세계에 걸쳐 확산 될 수 있습니다. 디지털 기술, 기업에 대 한 판매 채널의 새로운 종류를 창조 했다 하지만 그것은 또한 데이터의 불법 복제와 같은 새로운 문제를 제공 합니다. 1990 년대에 시작 된 인터넷 붐, 디지털화의 전례 없는 물결을 설정 합니다. 1993 년에 약 3%만 정보의 디지털, 저장 된 하지만 2007 년 비율은 94%로 급증 했다. 또한, 이러한 경향은 매일 디지털화 되 고 새로운 데이터의 큰 숫자와 함께 강화 하고있다.

디지털 세계의 가장 중요 한 개척자 중 하나는 독일 발명가 루돌프 지옥, 그래픽 산업의 "에디슨"로 환영 했다 "그랜드 공로 십자가의 독일 연방 공화국의" 수 상했다 고 수상 구텐베르크 (Gutenberg 상) 및 "이너 상 (베르너 폰-지멘스-링)". 지옥은 팩스 및 스캐너의 아버지로 인식 됩니다. 1980 년에, 그는 획기적인 chromacom 디지털 이미지 처리 시스템 상용화. 지옥, 지멘스 자회사, 고용 되었다 바티칸 도서관에서 스캔 하 여 디지털 공공 읽기에 대 한 귀중 한 고전 복사 1980 년대 초에. 디지털 프로세스 되었다 더 광범위 하 고 체계적인에 1990 년대. 예를 들어 1990 년에, 회사 설치 모스크바의 크렘린 박물관 디지털 처리 시스템, 처음으로 디지털 형태로, 모든 러시아 czar의 미술 컬렉션의 카탈로그. 그런 다음, 생성 된 디지털 이미지와 정보, 기록 및 정렬, 이미지 데이터베이스에 저장 됩니다.

반 오픈도 서를 검색합니다. 오늘날, 많은 단체 들은 모든 아날로그 정보의 디지털 복사본을 확인 합니다. 이와 관련, 뮌헨에에서 위치한, 바바리아 라이브러리 모범 이며 그것의 디지털 센터는 다양 한 장비, 독일에서 선도. "우리는 시간당 2000 페이지까지 처리할 수 있는 4 완전 자동화 된 스캐너를 포함 하 여 26 다른 스캐닝 시스템 사용" Klaus Ceynowa, 바바리아 주립 도서관의 부 큐레이터 말했다. 우리는 두 명의 연산자, 각 대상의 2 개의 로봇을 지키고는 있다. 이 시스템은 뿐만 아니라 빨리, 보호 책, 책만 60도. 시스템의 스캐닝 프리즘 열려 페이지 사이 삽입할 수 있습니다. 그것은 명확 하 고 올바르게, 페이지의 내용을 읽을 수 있습니다 다음 페이징 하 고 검사를 계속. "

바바리아 라이브러리 (왼쪽)의 전체 컬렉션 디지털 형식으로 변환 되는. 현재, 그것의 가장 귀중 한 문화재를 읽는 데 사용할 수 있는 응용 프로그램입니다.

2007 년부터, 바바리아 라이브러리와 함께 일하고 있다 구글 "구글 디지털 도서관" 프로젝트를 시작 하는 바바리아 라이브러리 1 백만 볼륨 디지털화 되며 공공 읽기에 대 한 인터넷에 통해. 관련된도 서 1601에서 1874 기간에 작성 된 고 더 이상 저작권 보호를 받습니다. "Google의 검색 센터에서 독일, 디지털 형식으로 변환 후 매주 우리 약 5000도 서 출시," Ceynowa 설명 합니다. 구글 검색의 비용을 가정 하 고 우리 자신의 데이터베이스에 디지털 사본을 함께 제공 합니다. 1874 년, 중 년에서 매우 귀중 한 손으로 쓴된 원고를 포함 하 여 전후 1601 모든 쓰기는 우리 자신의 디지털 센터에서 개조 되었다. 계획에 따르면 Google 프로젝트는 올해 말까지 종료 됩니다. 우리가 우리의 웹사이트의 디지털 도서관에 거의 모든 1 백만 서를 업로드 하 고 아무도 그들을 읽을 수 있습니다 여기. "

그럼에도 불구 하 고, 바바리아 도서관의 전반적인 디지털화 과정이 끝 까지입니다. "우리의 작업은 시작에 불과, 우리가 지금까지 무엇을 했는지가 만든 연결 하 고 Ceynowa 디지털 정보에 대 한 다른 가능성 때문에" 그룹이 말한다. "바바리아 라이브러리 포함 하 여 모바일 응용 프로그램을 개발 했습니다는" 루드비히 II "응용 프로그램. 응용 프로그램 기록 데이터, 이미지, 및 루드비히의 "동화 성" 그들의 위치에 따라와 관련 된 문서를 사용자 지정 하는 사람들이 있습니다. 예를 들어 사람들이 뮌헨에서 루드비히에 의해 만들어진 호텔 궁전 앞에 서 서 때 그들의 스마트폰 카메라 모드 사용 하 여 호텔의 유명한 까 한 정원 역사의 먼지에 묻혀 오래 있다의 실시간 이미지를 얻을 수 있습니다 그들은. 화초가 반짝이-이 응용 프로그램을 통해 인공 호수 호텔 궁전, 꽃 및 식물, 배경에서의 지붕에 건설 하는 정원, 사람들이 웅장 한 역사적 경치를 즐길 수 있습니다.

그것은 지금 거의 바바리아 라이브러리를 온라인에서 서 수백만 읽을 수 없습니다.

디지털 시민 등록입니다. 박물관과 도서관은 완전히 전체 디지털화의 혜택을 즐길 수 있는 마지막 기관 그리고 정부 기관 및 산업 기업 오래 사용 하는 기술. 자, 독일의 16 연방 국가 시민 그들의 모든 레지스터를 디지털화 계획 이다. 이러한 이유로, 지난 2 년 동안 지멘스 중앙 연구소 박사 Bernt Andrassy의 지도 하에 타당성 조사를 의뢰 했다. Andrassy 설명: "독일 땅은 기본적으로 몇 개의 블록으로 분할." 등록 시스템 이러한 블록에 특정 권한을 할당합니다. 등록 시스템은 그러므로 독일에 있는 토지 이용에 대 한 중앙 규제 메커니즘입니다. 현재, 연방 국가 스캔 지난 50 년 동안에 대 한 모든 등록 서류를 보관 하 고 지멘스 중앙 연구소 필요한 필수 시스템 구성 요소와 함께 그들을 제공 하고있다. 우리는 많은 양의 데이터를 PDF 파일의 페이지에 약 500 백만의 총 수집. "

이 디지털 프로젝트 발굴 도전을 제공합니다. 예를 들어 지멘스 팀 개별 단어를 식별, 중요 한 문제를 이해 하 고 입력 파일, 파일 및 여러 수정 파일의 불 쌍 한 복사본을 포함 하 여 스캔 한 파일 링크를 발견 하는 자동화 된 소프트웨어를 개발 했다. "소프트웨어 알고 있다 한 가지는 대출은 문서의 부분 어느 부분은 속성, 대출, 인지 그리고 어떤 은행의 영역에 대 한 부동산 소유자의 이름을 포함," Andrassy 설명 합니다. "이러한 문제를 해결 하기 위해 전문가 해야 프로그램을 작성 하려면 매우 근 면 하 게 작동 합니다." Andrassy 말했다: "우리의 소프트웨어 요청 된 정보를 자동으로 입력된 마스크에 입력 됩니다." 연산자는 단지 데이터 완료 확인 해야 합니다. "현재, 연방 국가 계획 실행이 거 대 한 제출 프로젝트에 대 한 입찰 발표에." "모든 등록의 디지털화, 보류 중인 각 국가 개인 및 기관 정당한 이익 신속 하 고 쉽게 문서를 액세스할 수 있도록 자체 사용자 포털을 설치할 것 이다-예를 들어 공, 은행, 세무." "

브란덴부르크 아카이브 1743 년 필기 등록 (왼쪽)과 직원 프랑크푸르트 지방 법원의 표시 (오른쪽) 현대 전자 등록 유지 합니다.

잘못 하는 것은 수백만의 손실 귀 착될 수 있다. 디지털 프로젝트 등록에 Andrassy의 경험 또한 산업 분야에 적용 됩니다. "우리는 소프트웨어 패키지를 자동으로 고객의 요구 사항을 부드러운 공지 그리고 andrassy 남기고 있었다 디지털화 된 문서에 데이터 등록에 노력," 고 말했다. 이러한 입찰 공지 PDF 형식에는 일반적으로 하 고 수시로 수천 페이지의 두께. 과거에는, 각 기술 사양 수동으로 추출 하 고 다음 오후 4 시 후 결합 된 주기 식물의 최대 허용 잡음 레벨 등 전문가 의해 평가 했다. "

그러나, 요구 사항 및 기술 사양 목록은 일반적으로 매우 긴, 유로의 수백만의 손실에서 미래에 발생할 수 있습니다 심지어는 잘못 문장. 이 염두에서에 두고, 뮌헨 전문가 만들어진 모든 변화를 발견 하 고 사용자에 게 알립니다 하는 신뢰할 수 있는 검색 시스템 기술을 개발 했습니다. 궁극적인 목표는 해석 하 고 의미 체계 개체 기술 사양을 해석 프로그램입니다. Andrassy 설명 했다: "우리가 개발한 소프트웨어는 3 개의 작업 단계로, 우리가 부르는 '부드러운 검색', '입찰 비교 '및 ' 부드러운 추적'으로 구분 됩니다. 첫 번째 단계는 사용자가 기술 사양 입찰 문서에서 찾을 수 있는 매우 효율적인 프로세스입니다. 두 번째 단계에서 소프트웨어의 이전 프로젝트 파일에서 유사한 기술 사양을 검색합니다. 결과적으로, 당신은 이용할 수 있습니다 오류를 피하기 위해 이전 평가의. 마지막 단계에서 소프트웨어 모든 새로운 버전의 입찰 문서에서 확인 된 기술 명세를 추적 합니다. "

이 방법의 장점은 자동 평가 크게 평가 과정을 가속화 하 고 가능한 빨리 유사한 프로젝트에서 만든 오류를 식별 하는 데 도움이 분명, 있다. 또한, 시스템에는 마지막 순간에 변경을 신속 하 게 결과 분석 하 고 프로젝트에 통합 하는 고객 수 있습니다.

플래시에서 파일 빗을 완료 합니다. 완전 디지털화 단지 시작입니다. 도서관, 정부 기관 및 공장 완전히 새로운 방식으로 사용할 수 있는 디지털 지식 많이 만들어집니다. 그 결과, 다음 몇 년, 그리고 수십 년 동안 개발 노력 필요 화면 디지털 파일, 플래시에 완료 될 것 의미 연결을 이해 하 고 분류 하 고 정보를 재편성 하는 소프트웨어 기반 도구에 집중할 것 이다. "예를 들어 학자 수 있을 것입니다 어떤 원고는 '소설'은 처음에 있는, 신속 하 게 결정 을" Ceynowa 말한다. 그들은 Hing에, 체크 아웃 문서 라이브러리는 세계 각국에서 수백 필요가 없습니다 그리고 그들은 해답을가지고. 이 특정 연구 분야에 혁명을 일으킬 것 이다. "

Andrassy 추가: "법학 등 희귀 질환의 이전 의학 진단 정보에 액세스 더 신속 하 게 액세스할 수 있습니다." 그러나, 지능형 데이터 마이닝은 여전히 교체, 그것은 사람들을 지원할 수 있습니다. 즉, PDF 파일을 읽고 고객 데이터베이스에 그것을 비교 하 고 즉시 알고 그것 만들 것 이다 그것을 확인 하는 방법 수 만드는 갈 길이 있다.

관련 문서

연락처

이 페이지의 내용은 인터넷에서 가져온 것이므로 Alibaba Cloud의 공식 의견이 아닙니다.이 페이지에서 언급 된 제품 및 서비스는 Alibaba Cloud와는 관련이 없으므로이 페이지의 내용이 골칫거리 인 경우 저희에게 알려주십시오. 우리는 5 일 근무일 이내에 이메일을 처리 할 것입니다.

커뮤니티에서 표절 사례를 발견한 경우 info-contact@alibabacloud.com 으로 관련 증거를 첨부하여 이메일을 보내주시기 바랍니다. 당사 직원이 영업일 기준 5일 내에 연락 드리도록 하겠습니다.

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.