요즘, 대용량 데이터의 실제 생활에서 피할 수 없는 도전 되고있다. 우리가 결정을 내릴 때 큰 데이터는 어디에 나 있습니다. 큰 데이터 용어의 대폭적인 출현 또한 그 중요성의 점진적인 이해를 주도하 고 있다. 큰 데이터는 학계, 업계 및 정부에 제공 하는 거 대 한 기회를 보이고 있다. 같은 시간에 큰 데이터도 세 가지 중요 한 기술 문제부터 참여 당에 큰 도전을 행 세:
구조화 및 반 구조화 된 데이터를 다루는 정보 기술 및 다른 수단을 사용 하는 방법
큰 데이터에만 약 15%, 그리고 나머지 85%에 대 한 구조적된 데이터 계정 구조화 되지 않은 데이터, 소셜 네트워크, 인터넷 및 전자 상거래 등 많은 분야에서 발견 되는 있습니다. 다른 한편으로, 아마도 90%는 데이터의 오픈 소스 데이터에서와 나머지는 데이터베이스에 저장 됩니다. 큰 데이터의 불확실성은 높은 차원, 변화 및 강한 임의성에에서 명시 됩니다. 주식 거래 데이터 흐름은 큰 불확실성 데이터의 전형적인 예입니다.
큰 데이터는 많은 연구 문제를 자극 했다. 개별 발현, 일반 기능 및 구조화 및 반 구조화 된 데이터의 기본 원리는 아직 명확한, 그리고이 공부 하 고 다양 한 학 제, 포함 한 수학, 경제학, 사회학, 컴퓨터 과학 및 관리 과학을 통해 논의 해야 합니다. 이미지 같은 반구조적 또는 구조화 되지 않은 데이터를 감안할 때, 어떻게 그것으로 변환할 수 있습니다 다차원 데이터 테이블, 개체 지향 데이터 모델 또는 직접 이미지 기반 데이터 모델? 그것은 주목할 만한 각 형태의 표현에 큰 데이터 데이터 자체, 아니라 전체 그림의 측 성능만 선물 한다.
"거친 지식" 데이터 마이닝을 통해 추출 하는 과정 "광산" 과정 이라고 "지능형 지식" 과정 "2 광산" 이라고 다음, 경우는 정량 주관적 지식, 특정 경험, 상식, 본능, 상황 지식 및 사용자 기본 설정 등 거친 지식을 결합 합니다. "한 발굴" "두 개의 마이닝" 비슷한 것을에서 "품질"을 "수량" 도약.
반구조적 및 구조화 되지 않은 대용량 데이터, 구조화 된 "거친 지식"의 특성 때문에 (숨겨진 모드) 생성 된 데이터에 의해 큰 데이터 마이닝도 함께 몇 가지 새로운 기능. 이러한 구조적된 거친 지식은 처리 하 고 주관적인 지식을 생성 하는 반구조적 및 구조화 되지 않은 정보 기술에 의해 변형 수 있습니다. "지능형 지식"을 추구 큰 데이터 연구의 핵심 가치를 반영 합니다.
큰 데이터 복잡성과 불확실성 기능 설명의 설명 방법 및 큰 데이터 시스템 모델링을 탐험 하는 방법
이 문제의 획기적인 전제 조건 및 대용량 데이터 기술 자료 검색을 실현 키입니다. 긴 안목으로 보면, 개별 복잡성의 도전과 큰 데이터의 임의성 이어질 것입니다 큰 데이터 통일의 완전 한 이론에 이르게 큰 데이터 수학적 구조 형성. 짧은 기간에 학계는 구조화 된 데이터와 반 구조화 된, 구조화 되지 않은 대용량 데이터의 교차 산업 애플 리 케이 션을 지원 하기 위해 데이터 간의 일반적인 변환 원리의 개발을 장려 한다. 관리 과학, 최적화, 기반 이론 특히 일반 메서드 및 큰 데이터 지식 발견의 규칙 개발에 중요 한 역할을 재생 됩니다.
대용량 데이터의 복잡 한 형태의 측정 및 "거친 지식"의 평가에 관련 된 많은 연구 문제에서 발생 합니다. 알려진된 최적화, 데이터 봉함 분석, 기대 이론 및 경영 과학에서 유틸리티 이론 거친 지식 데이터 마이닝에 의해 생산의 "두 마이닝" 과정으로 주관적인 지식을 통합 하는 방법의 연구에 적용할 수 있습니다. 인간-컴퓨터 상호 작용 여기 중요 한 역할을 재생 됩니다.
셋째, 데이터가 고 결정이 사이의 관계에 영향을 미치는 큰 데이터 지식과 관리 결정의 발견
큰 데이터 자체의 복잡성 때문에이 문제는 의심할 여 지 없이 일반적인 데이터 마이닝 이론 및 기술에 새로운 도전을 앞으로 두고 있는 중요 한 연구 주제. 큰 데이터 환경에서 관리 결정 2 "이" 문제에 직면: "데이터가"와 "결정이". 전통적인 관리 결정 모드 비즈니스 지식과 축적 된 연습 경험의 학습에 따라 달라 집니다 그리고 데이터 분석에 따라 관리 결정.
큰 데이터는 전통적인 관리 결정 구조의 패턴을 변경 되었습니다. 관리 결정 구조에 큰 데이터의 영향의 연구는 오픈 연구 문제 될 것 이다. 결정 구조에 변경 "두 발굴"을 어떻게 탐험을 사람들을 요구 하는 또한, 높은 수준의 의사 결정을 지원 하기 위해. 큰 데이터 제공 어떤 데이터가, 아무리 "큰 데이터에서" 지식 거친 여겨질 수 있다 아직도 "광산" 카테고리. 그것은 데이터가 고 결정이 사이 교량으로 "두 마이닝"에 의해 생성 하는 "지능형 정보"를 찾을 필요가 있다. 큰 데이터 환경에서 결정 구조 변경 되는 방법을 탐험, 그것은 의사 결정자의 주관적 지식을 의사 결정 과정에 참여 하는 방법을 공부할.
큰 데이터 숨겨진 법, 인공 자연 이며 그것은 찾아보기 어려운 하지만 만약 우리가 구조적된 데이터를 구조화, 반 구조화 된 데이터를 변환 하는 방법의 찾을 큰 데이터를 찾는 과학 모델 대용량 데이터의 아름다움의 연구에 대 한 일반적인 접근을 가져올 것 이다 알려진된 데이터 마이닝 방법을 대용량 데이터 마이닝 도구를 될 것입니다.
이들은 몇 가지 내 팁 3 큰 데이터에 대 한 기술적인 질문 그냥 시작 포인트 공부 하는 큰 데이터 문제에 대 한 중요 한 공부입니다. 또한, 데이터 과학, 데이터, 데이터베이스를 기반으로 하는 지식 검색 규칙 및 열기 데이터 소스, 그리고 큰 데이터 마이닝의 전체 또는 로컬 솔루션의 존재에 따라 지식 검색 규칙에서 규칙을 생성 하 고 데이터에 존재할 수 있는 공리 시스템을 포함 한 몇 가지 문제가 있다. 가까운 장래에, 나는 이러한 문제는 획기적인 연구 및 응용 프로그램 결과 얻기 위하여 신중 하 게 공부 될 필요가 믿습니다.