저자는 OpenCV와 디지털 비디오 분석 및 방법에 대 한 비슷한 도구를 사용 하 여 클러스터와 분산된 시스템 디자인을 사용 하 여 이러한 분석을 확장 하는 방법을 설명 합니다. 이전 분할에서 코프로세서 비디오 분석을 위해 특별히 설계 하 고 새로운 OPENVX 하드웨어 가속 논의이 문서에서 제공 하는 컴퓨터 비전 (CV) 샘플에 적용 될 수 있는. 이 새로운 데이터 중심 이력서 및 비디오 분석 기술 재고 실시간 모니터링 및 보안 큰, 공공 시설 및 인프라, 그리고 더 많은 엔터테인먼트에 대 한 대화형, 등 까다로운 요구 사항 및 보안 세계에 맞게 응용 프로그램 소프트웨어 및 시스템 설계 시스템 디자이너에 필요 합니다.
표준 (예: 영화 전문가 그룹, 또는 MPEG에서)를 사용 하 여 비디오를 인코딩하려면 위한 압축, 전송, 압축, 및 디지털 비디오를 표시 컴퓨터 산업에 있는 극적인 변화를 주도하 고 있다 소셜 네트워킹 미디어와 향상 된 훈련 및 교육 변화에 아마추어 디지털 극장에서 디코딩 및 디지털 비디오를 사용 하 여 도구는 널리 이용 된다 매일, 하지만 비디오 분석 인코딩 및 압축된 비디오 프레임, 오픈 컴퓨터 비전 (OpenCV) 등을 분석 도구가 필요 합니다. 쉽게 접근 가능 하 고 강력한 디지털 비디오 코덱 도구 FFmpeg 이며 정적 이미지에 대 한 GNU 이미지 처리 (김프) 유용. 이러한 3 기본 도구와 오픈 소스 개발자 완전히 컴퓨터 비전 (CV) 및 비디오 분석을 파악 수 있습니다. 그러나, 이러한 도구와 개발 방법을 분석 하기 전에 하자 이러한 단어의 더 나은 정의 제공 하 여 시작 하 고 그들이 무엇을 사용 하는 것에 대 한 생각.
이 시리즈의 첫 번째 기사, 클라우드 확장, 일부는 1th: 자신의 클라우드를 구축 하 고 온 디맨드 HPC 확장을 사용 하 여 Linux® 웹 카메라에서 연속 실시간 비디오에 영리한 지 변환 가능 OpenCV를 사용 하 여 간단한 예제를 제공 합니다. 이 이미지를 세그먼트에 있는 첫 번째 단계로 사용할 수 있는 이력서 응용 프로그램의 예입니다. 일반적으로 이력서 응용 프로그램 디지털 이미지 포맷, 이미지와 이미지 시퀀스 (필름), 처리 및 변환, 세분화, 인식, 및 조도 포인트의 이미지 요소를 대표 하는 마지막 장면 설명의 수집을 포함 한다. 이력서의 목적을 이해 하는 가장 좋은 방법은 샘플을 볼 것입니다. 그림 1에서는 OpenCV를 사용 하 여 얼굴 특징 탐지 분석. 이 간단한 예제에 유의 하르 캐스케이드 방법 (기계 학습 알고리즘) 수행 계측 분석. 알고리즘 얼굴과 눈을 하지 차단 된 (예를 들어 때 내 막내 아들의 얼굴은 1 개의 측에) 또는 그에 의해 가려진 되었습니다 그림자, 그리고 얼굴과 눈 주제 squinting 하지 때에 가장 정확 하 게 검색할 수 있습니다 하는 데 사용 됩니다. 다음은 이력서에 가장 중요 한 코멘트 수 있습니다: 그것은 간단한 질문. 이 분야에 있는 연구는 그것은 큰 진전을 그것의 출생부터 이상의 50 년 전, 대부분의 응용 프로그램 여전히 실패 2 세의 능력을 구별 하 고 일반화 하 고 수행 하는 다양 한 조건 (조명, 크기 변경, 방향 및 환경)에서 인식 하는 기능에 관해서 특히, 장면 인식 따라잡기 위해 종종 나타났습니다.
그림 1입니다. OpenCV를 사용 하 여 얼굴 인식을 수행 하
이력서에 사용 되는 프로 파일링 방법 이해를 돕기 위해 작은 일련의 다운로드 받을 수 있는 알래스카 주 앵커리지 지역 이미지에 대 한 테스트를 만들었습니다. 이러한 이미지 김프와 OpenCV를 사용 하 여 처리 되었습니다. 난 개발 C + + 리눅스 웹 카메라, 미리 캡처된 이미지, 또는 MPEG 비디오를 위한 OpenCV 응용 프로그램 프로그래밍 인터페이스를 사용 하는 코드. 이력서를 사용 하 여 비디오 콘텐츠를 이해 하기 (실시간으로 또는 사전 수집된 이미지 시퀀스 데이터베이스에서 시퀀스, 이미지) 비디오 분석 이라고.
비디오 분석 정의
비디오 분석은 카메라에서 디지털 비디오 콘텐츠 분석으로 광범위 하 게 정의 된다 (일반적으로 보이는 스펙트럼, 적외선 등의 다른 부분에서 또한 올 수 있습니다 하지만) 또는 이미지 시퀀스를 저장. 비디오 분석 분야, 적어도 등의 숫자를 포함 한다:
이미지 수집 그리고 코딩입니다. 이미지를 수집 하 고 그룹 이미지 또는 압축 된 이미지의 시리즈에서 인코딩된. 비디오 분석의이 단계는 광도 (카메라) 기술, 아날로그 코딩, 샘플링 프레임 및 시퀀스, 압축 하 고이 데이터를 압축 방법 (화소) 배열 하는 빛의 숫자 포맷을 포함 하 여 복잡 한 수 있습니다. CV입니다. 캡처한 장면 설명 장면으로 렌더링 되 고 달리 설명을 변환할 이미지 렌더링의 역. 이력서 "보기"에 대 한 컴퓨터를 사용 하는 프로세스 수행 해야 함을 인간을 볼 수 있습니다, 어디 일반적으로 머신 비전에서 구별 하는 것으로 가정. 종종 사람 처럼 보기 이력서 솔루션은 기계 학습을 사용 하 여 의미 합니다. 머신 비전입니다. 같은 렌더링 과정의 역 이지만 그것은 가장 자주 인쇄 회로 기판 또는 그들은 기하학적 오류 허용 범위에 있도록 하 완료 부품 검사 등 긴밀 하 게 제어 된 환경에서 프로세스 제어 목적을 위해 사용 됩니다. 이미지 처리입니다. 디지털 신호 처리 방법은 광도 계에 널리 적용 될 수 및 방사 계 (측정 전자파 탐지기)에 관찰 된 개체의 속성을 이해 하기 위해서는. 기계 학습입니다. 훈련 데이터를 통해 성능을 개선 하 고 새로운 데이터를 사용 하 여 응용 프로그램을 대중화 할 수 있는 몇 가지 새로운 알고리즘을 개발 하는 알고리즘 향상 됩니다. 실시간 및 쌍방향 시스템입니다. 이러한 시스템, 마감 시간 내에서 서비스 요청에 응답 하거나 적어도 충족의 품질 서비스는 SLA 서비스 고객 또는 사용자 사이 서명 된 이다. 스토리지, 네트워크, 데이터베이스, 및 계산 모든 비디오 분석, 하지만 미묘에 사용 되는 디지털 데이터 처리 및 중요 한 차이점은이 기본, 데이터 중심 컴퓨팅 문제를, 설명 된 대로에 부이 시리즈의 2이 필요 하다.
그 결과, 비디오 분석 넓은 범위에 이력서 보다 이며 시스템 설계 문제는 스마트폰 (구글 고글) 등 전체 시스템 이력서에 대 한 클라우드 기반 서비스 모바일 요소를 포함할 수 있습니다. 예를 들어 IBM VCAs (비디오 상관 관계 및 분석 스위트, 협회 시각과 분석 스위트) 라는 비디오 분석 시스템을 개발 했다 IBM 여행 및 운송 솔루션 게시판 영리 안전 및 보안 솔 레일 [PDF]; 해상도 시스템 설계 개념의 좋은 예입니다. 비디오 분석 솔루션에 관련 된 각 시스템 디자인 분야에 대 한 자세한 설명이 있지만 단서 시스템 디자이너에 대 한 자세한 정보를 제공 하는 리소스가 기사의 범위를 벗어납니다. 이 문서의 나머지 이력서 예제 및 응용 프로그램 처리에 중점을 둡니다.