오만한 데이터가 사람들의 보기를 입력 한 후 점차 사람들이 주의를 일반적으로 포커스 된다. 큰 데이터 PB 시대, 과학의 본질에, 큰 데이터 문제는 과학 과제 뿐만 아니라 데이터 마이닝 문제를 포함 하 여 인지 과학의 PB 시대. 그래서 빅 데이터 시대에 데이터 마이닝에 대 한?
현대에서는, 수시로 사람들은 큰 데이터 주로 세 가지 소스를 포함 하는: 첫 번째는 자연, 지구에, 매우 큰 자연 환경의 큰 데이터. 두 번째는 생활의 큰 데이터입니다. 세 번째 그리고 가장 중요 한 사람들에 대 한 관심 사회 데이터입니다. 이 데이터는 일반적으로 사람들의 휴대 전화, 컴퓨터 및 기타 장치에서 발견 됩니다. 오늘 보고서 3 분 이내 전세계 사람들에 게 알려져 있을 수 있습니다.
오바마의 취임 사회 분야, 너무 많은 얼굴, 모든 얼굴 이야기, 각 사람 뒤에 큰 데이터 지원. 인간의 얼굴은 데이터 보안을 매우 중요 한 식별자 얼굴을 명확 하 게 인식 하는 방법? 방법 많이 생각 하는 사람들. 베이징에 800000 카메라는, 이제 우리는 드라이브 하 고 쇼핑 매일 카메라의 감독 하에. 우리는 id 인증, 연령 식별, 정서적, 친 족 관계 검색, 심리적 인식, 지역 인식, 인정 하는 카메라를 사용할 수 있습니다. 스트리밍 미디어의 주요 형태는 구조, 기능, 정확도의 장비 알고리즘, 간의 상관 관계 모든 심각 하 게 제한 하는 큰 데이터의 진행 마이닝 얼굴. 이러한 대규모 데이터에서 필요한 기능 특성을 추출 하 고 기능 사이의 관계를 명확히 하는 방법 지금 문제가입니다.
기술 드라이브 컴퓨터 개발
Turing 모델 1936 천재 수학자 튜링, 나중에 3 개의 큰 덩어리를 했다 물리적 컴퓨터 튜링 모델 바 뀌에 의해 제시 되었다: CPU, 운영 체제, 메모리 및 외부 저장으로 입력 및 출력. 처음에 컴퓨터 개발, CPU, 운영 체제, 소프트웨어, 미들웨어 및 응용 소프트웨어의 30 년 가장 투자 했다. At 시간 사람들이 계산 성능 향상에 초점을 맞춘, 우리 시대 컴퓨팅의이 시대를 호출 합니다.
컴퓨터 소프트웨어, 특히 고성능 컴퓨터에에서 노력을 했다. 우리 생각 계산 첫번째 20 년에서 선도적인 역할 하고있다 그리고 그것의 서명 속도 어 금 니 속도. 컴퓨팅 리더십의이 시대에 우리는 주로 구조적된 데이터 발굴 할. 관계형 데이터베이스 에드거의 아버지는 그것의 핵심으로 관계형 대 수를 사용 하 여 엔터티 및 2 차원 형태로 엔터티 사이의 관계를 나타냅니다 1970 년에, 관계형 모델 제시. 과거 30 또는 40 년, 데이터베이스 및 데이터 웨어하우스 데이터 마이닝 데이터베이스 검색 기술에서에서 뿐만 아니라 모든 생 업에서 기술을, 동안 거 대 한 정보 산업이 되고있다.
관계형 대 수 정식 이론 및 관계형 데이터베이스의 제약 조건, 첫째, 최상위 디자인 및 데이터 구조, 다음 입력 데이터 청소 후. 데이터 구조, 돌아가지 그리고 데이터 프로그램 갑니다. 사용자는 데이터 수집, 저장, 분석 및 추출 과정에 대 한 상관 하지 필요. 데이터 마이닝을 통해 우리 분류 지식, 관련된 지식, 순차 지식, 데이터베이스에서에 비정상적인 지식을 찾을 수 있습니다.
데이터베이스 산업의 확장, 사람들이 만족 하지 않습니다 데이터베이스, 그래서이 발생 하는 대용량 데이터에 데이터베이스를 두 가지 피할 수 없는 도전, 첫 번째 과제는 관계형 대 수의 공식적인 제약은 실제 데이터를 표현 하기 위해 너무 가혹 하기 때문에, 데이터 증가의 볼륨으로 두 번째 과제는 관계형 대 수 작업의 성능을 극적으로 떨어졌다. 이 시점에서 우리의 저장 기술은 급속 한 발전, 인간의 검색 나이 입력. 스토리지는 저렴 한, 때문에 검색 9 개월 마다, 그래서 저장 구동 기술, 속도 20 년 이상의 개발 후이 검색 시대 반 구조화 된 데이터 마이닝 시대에 우리가 주도 대 한의 저장 속도. 이 시대 대표는 World Wide Web 팀 버너 스-리의 아버지, 그가 개발한 하이퍼 텍스트 아이디어 제안 텍스트, 테이블, 그림를 포함 하 여 세계의 첫 번째 웹 서버, 그래서 우리 소프트웨어의 지원으로 한 서버에서 다른 서버, 서버의 내용을 검색할 수 있습니다 게시할 수 있습니다 오디오 및 비디오 하이퍼미디어 정보의 조각입니다.
결과적으로, 클라이언트 서버 아키텍처와 클라우드 컴퓨팅 구조 호황을 누리고 있습니다, 그리고 대수학, 규범, 표준, 하이퍼링크 생성 링크를 통해 엔터티, 또는 심지어 소프트웨어 엔터티 형식의 모든 미디어에 주로 의존에 제약 조건이 없는 형식입니다.
공식적인 이론 훨씬 유연 하 고 다양 한 엔터티 만들기 관계형 대 수 보다 패자, 이때 데이터는 엔터티를 돌고 시작 이며 엔터티 이동 링크. 클라우드 컴퓨팅, 데이터 마이닝 또한 클라우드 컴퓨팅 환경에서 검색 및 개인화 서비스로 간주 될 수 있다 배경에서 고정된 쿼리 메서드는 아니 독특한, 100% 정확한 쿼리 결과.
대용량 데이터 마이닝 네트워크
6 월 인터넷 대역폭 배로와 인간 개발 컴퓨팅 및 저장소의 상호 작용 인터랙티브 시대를 입력 했습니다.
모바일 인터넷 시대에 큰 데이터 마이닝, 조각난, 이기종 신선 하 고 감상적인 원래 생태 데이터를 반영 하는 네트워크 환경에서 주로 구조화 되지 않은 데이터 마이닝이 이다.
구조화 되지 않은 데이터의 특징이입니다 그것은 종종 낮은 값, 강한 소음, 이기종, 중복 찬 데이터, 메모리에 데이터를 많이 더 이상 사용 되지. 데이터의 형식 제약 조건을 더 완화 되 고, 그리고 그것은 인터넷 문화, 창 문화 및 사회 문화를 가까이 지 고.
개체의 관심 또한 큰 변화를 겪고 있다, 마이닝 관심은 첫 번째 작은 관객만 나 하향식 디자인, 신뢰성 강조의 상단 보다 나은 사람이 되도록 중요 한 생각은 하 고, 링크를 찾으려면 마이닝 데이터의 적시성 찾을 예외, 더 작은 대 중에 대 한 수요를 충족 하기 위해 작은 사람들의 요구 찾을 동향 짧은 값을 찾을 수.
현재, 깊이 학습 데이터 적응형 단순의 일종 이다. 만약 우리가 얼굴 픽셀 검색에 대 한 바이 두 검색의 깊이에, 너무 많은 사람들이 누구 누구는 얼굴? 데이터 볼륨의 급속 한 증가, 다양 한 미디어 형태 조각난, 조직 구조 및 데이터를 조각화 될 프로그램 주위 마이닝 절차 수 있으며 언제 든 지 가상 개편 될 수 있습니다 마이닝 종종 구조화 되지 않은 데이터 마이닝, 자연 데이터 정리, 데이터 사용의 효율성을 개선 하기 위해 구조화 된 데이터와 반 구조화 된 데이터의 자연 형성에서 인간-컴퓨터 상호 작용 환경 및 지역 사회 정보에 다른 커뮤니티의 발견 이다.
공동 정보 단어는 요즘 많이 했다, 우리 컴퓨터에 튜링 테스트, 컴퓨터 코드를 생성 하는 기계는 인간의 세대 구별 하는 데 사용, 이것은 카네기 멜론 대학, 쇼핑, 네트워크 로그인 사이트에에서, 응용 프로그램 사이트를 발생 적응 코드 사용 됩니다. 세 번째 대표를 언급, 루이, 그는 제안 적절 한 코드를 적용 합니다.
만약 클라우드 우리가 생각 하는 그 클라우드 컴퓨팅 계산 리소스는 동적, 확장성, 공공 참여의 인터넷을 기반으로 하는 모델은 기본적으로 다음 값를 지 원하는 대형 데이터 마이닝 컴퓨팅 가상화, 및 서비스에서 제공 하는 방법. 시스템 업그레이드, 더 간결한, 유연 하 고 다양 한, 맞춤, 휴대 전화, 게임 콘솔, 디지털 카메라, 다른 뉘앙스의 텔레비전 세트에 의해 초래 하는 전통적인 구성에서 생산 되었습니다 icloud 제품 더, 사용자 친화적인 인터페이스, 개인화, 대용량 데이터 마이닝 터미널이 될 수 있다.
굴 착 기 큰 데이터 응용 프로그램의 다양 한 지원 만약 우리가 데이터 수집 센터, 스토리지, 컴퓨팅 센터, 서비스 센터, 그래서 큰 데이터 적시 응용 프로그램 및 적시 발견의 가치를 지원할 수 있는 데이터 마이닝 센터를 있어야 합니다.
큰 데이터 표시 새로운 시대,이 시대의 특성 풍부한 물적 자원, 그리고 편리 하 고 다양 한 정보 서비스 뿐만 아니라 유비 쿼터 스 인터넷만 추구 하지 않습니다 하지만 또한 다른 값 변환, 데이터 마이닝의 소재 값 포함 가상 세계에서 정보 가치의 발견 소재와 대용량 데이터 마이닝에 대해 가져온 새로운 정신적, 문화적 현상으로 물리적 세계에서 에너지의 더 정밀 하 게 제어 이끌어 낸다.