공식적으로 2014 중국 큰 데이터 기술 컨퍼런스 여기에 공유 하는 그들의 최신 연구와 실용적인 결과, 중국 경제 네트워크 관리 컨설턴트 능력에서이 기사, 미래 산업 기술 개발 뿐만 아니라 대용량 데이터와 심도 있는 학습 사이의 관계의 주요 해석에 거의 백 기술 전문가 12 월 14 일에 떨어졌다.
아래
는 저자의 원문:
2014 년 12 월 12-14, 큰 데이터 연구, 응용 프로그램 및 산업의 발전을 촉진 주요 테마로 2014 중국 큰 데이터 기술 컨퍼런스 (다 데이터 CCF 큰 데이터 전문가 위원회, 중국 과학원 및 CSDN 공동 주최 중국 컴퓨터 학회 (CCF)에 의해 호스팅 기술 컨퍼런스 2014, 2014 BDTC) 두 번째 CCF 큰 데이터 회의 베이징 새로운 운 크라운 프라 자 호텔 그랜드 오프닝.
최근 몇 년 동안, 국내 및 해외 인터넷 회사와 전통적인 기업 데이터 유동화 및 규모의 잠재적인 가치 실현에 저장 수백 TB 또는 심지어 EB를 처리 하는 방법 낮은 비용 데이터 레벨 하 고 효율적으로 큰 도전입니다. ""데이터 값을 큰 데이터 문제에 직면 하는 거의 모든 산업을 만든다. "빅 데이터" 그것 "산업 혁명"의 새로운 라운드를 촉발 시켰다.
쳉 발표 2015 년 큰 데이터 개발 동향 예측
과학 연구 연구소의 컴퓨팅의 중국 아카데미, CCF 큰 데이터 전문가 위원회 사무 총장 청 회의에서 큰 데이터 백서 및 개발 동향 보고서를 출판. "중국의 큰 데이터 기술 및 산업 개발 백서 (2014)" 주로 배경 및 대용량 데이터의 역학, 대용량 데이터, 대용량 데이터 기술 발전, 대용량 데이터 IT 산업 체인 및 생태 환경, 및 큰 데이터 개발 동향 및 제안 일반적인 응용 프로그램을 소개 합니다. 2015 큰 데이터 개발 동향 예측에 대 한 동시에 쳉이이 단어에 대 한 정리: 통합, 크로스-국경, 재단, 돌파구.
대용량 데이터 분석 지능형 컴퓨팅 결합 큰 데이터 및 신경, 깊이 학습, 의미 컴퓨팅 컴퓨팅과 대용량 데이터 분석의 분야에서 핫스팟 되고있다 인공 지능의 다른 관련된 기술 등 핫 스폿이 되고있다.
둘째, 데이터 과학 점차적으로 사회 디지털 학위와 함께, 멀티-징계의 통합을 촉진, 더 깊 어 고 데이터 수준에 더 많은 분야 일치 하는 경향이. 통합된 연구 유사한 아이디어를 사용 하 여 수행할 수 있습니다.
크로스-징계 데이터 융합 분석 및 응용 대용량 데이터 분석 응용 프로그램의 미래 발전에 주요 트렌드 될 것입니다.
4, 대용량 데이터, 모바일 상호 연결, 구름의 인터넷 연결 됩니다 컴퓨팅, 소셜 컴퓨팅, 및 다른 기술 분야의 통합, 통합된 응용 프로그램의 수에 따른 크로스 핫. 것 들과 모바일 컴퓨팅의 인터넷 물리적 세계와 사람, 큰 데이터와의 통합을 강화 하 고 클라우드 컴퓨팅을 백 엔드 데이터 저장소 관리 강화 및 컴퓨팅 기능.
5, 큰 데이터 다변화 처리 모드 및 하드웨어 및 소프트웨어 인프라 점차적으로 충전. 메모리 컴퓨팅 대형 데이터 처리의 성능 향상의 기본 수단이 될 계속 됩니다. 상업 및 hadoop은 위해 특별히 설계 되었습니다 시스템 및 하드웨어 큰 데이터 처리, 공존 스파크 나타내는 메모리 계산을 점차 이동 하 고 큰 데이터 처리 및 다변화 모드 공존, 통합의 대용량 데이터 처리 플랫폼 추세가 점차. 어느 정도이 변화의 관점 통합 되, 미래의 큰 데이터 다변화 처리 모델 공존 및 통합된 플랫폼 될 수 있습니다.
6. 큰 데이터 보안 및 개인 정보 보호 우려 남아 있습니다.
7, 새로운 컴퓨팅 모델, 돌파구, crowdsourcing 기술 만들 것 이다 큰 데이터 말하기 학습의 깊이의 미래를 되지 않을 수 있습니다.
8, 각종 시각화 기술 및 대용량 데이터 분석을 강화 하는 도구. 분석을 하기 전에 데이터를 탐험 한다. 시각화는이 과정에서 큰 역할을 재생 됩니다.
9, 큰 데이터 기술 교육 시스템 구축 및 교육 재능 있는 사람이 높은 관심을 필요로 하는 질문입니다.
오픈 소스 시스템 주류 기술과 대용량 데이터 분야에서 시스템 선택 될 것입니다.
큰 데이터를 공유 하는 Biopo 분산 기계 학습 플랫폼
중국의 큰 데이터 기술 컨퍼런스의 첫날 총회에서 Biopo, ICML 2014, 카네기 멜론 대학 교수 Biopo (에릭 피 싱), 자원의 큰 금액을 현재 데이터 처리 플랫폼 얼굴 직통 전화 통신에 낭비 된다. 심지어 더 나은 플랫폼, 계산 시간은 20%, 통신 시간 Hadoop 통신 시간 90%를 차지 하는 같은 80%를 차지.
그의 팀 개발, Petuum 큰 데이터 분산된 기계 2를 포함 하는 플랫폼을 학습 데이터와 프로그램 병렬 기능을 설정 하 고는 또한 더 나은 연구와 기계 학습의 특성의 대상으로 사용의 새로운 유형입니다. 대략적인 구조 매개 변수 서버, 가상 병렬 메모리 프로그래밍을 제공 하는 것입니다, 프로그래밍 시간에 개별 통신을 수행 하는 각 컴퓨터에 필요 하지 않습니다, 또한 하나 스케줄러 라고, 모델 효과적인 세분화, 심지어 동적 세분화입니다 다음 수 분포를 않습니다.
이 매개 변수 서버에 쓰기 메모리 읽기 시간을 크게 줄일 수 있습니다 더 독창적인 소위 반 동기화 조정 메커니즘을 사용 하 여 각 컴퓨터에 대 한 특별 한 지침을 필요 하지 않습니다에 통신, 동기화의 매개 변수 조정 통신 시간이 크게 감소 될 것 이다, 그래서 시간을 계산을 향상 프로그래밍 인터페이스 컴퓨터의 리소스는 가장 중요 한 사용도 계산 시간 보다는 더 적은으로 감소.
Petuum는 또한 오픈 소스 프로젝트, 현재 관측 뿐만 아니라 많은, 지금 최고의 시스템에 기본적으로 해당 달성할 수 있다. 교수 Biopo, 그의 학생에서 최신 결과 받은 그냥,에 따르면 그것은 독립적인 비교 스파크 및 Hadoop 만들려고이 시스템을 사용 하는 그룹은 놀라운. 소프트웨어와 기본 소프트웨어를 포함 하는 petuum 시스템의 비전 지금 다운로드 후 자신의 개발을 위한 열 수 있는 Hadoop 생태계에서 분자 이다.
케이: 깊은 학습 인공 지능의 시대에서 핵심적인 역할을 담당할 것입니다.
바이 연구소 부 딘, 깊이 연구 실험실 감독, 그림 검색 부서 수석 감독 케이 인공 지능 개발에 바이 소개 했다. 인터넷 기업에 대 한 가장 중요 한 기술은 큰 데이터 기반 인공 지능입니다. AI는 무엇입니까? 지 각, 사고와 제어 인공 지능의 여러 가지 중요 한 측면은. 진짜 지능형 시스템, 경험, 더 지능적인의 진화! 그리고 경험 데이터입니다.
그의 연설에서 케이: 인공 지능의 필수 특성 중 하나는 배울 수 있는 능력, 즉, 여부와 끊임없이 경험적 데이터의 축적 시스템의 능력 진화 하 고 개선. 그래서 큰 데이터 나이의 출현은 인공 지능의 개발에 대 한 전례 없는 기회를 제공합니다. 이 시대의 맥락에서 획기적인 발전의 모든 측면에서 깊은 사고, 때문에 아니다 통계 및 계산의 관점에서 깊이 학습 복잡 한 법률을 찾을 데이터의 광대 한 수에 대 한, 우리가 찾을 수 있는 가장 좋은 방법은 될 수 있습니다.
또한, 그는 깊은 학습 두 가지 중요 한 장점이 있습니다 믿고 있다: 우선, 다양 한 모델링 언어, 인지 모델링 프레임 워크, 우리가 사용할 수 있는 언어 체계의이 세트는 부자 관계와 이미지, 자연 언어의 시간적 구조 2D 공간 구조와 같이 데이터의 구조를 표현 하 고 둘째, 깊은 학습은 거의 학습 시스템, 목표만 엔드-투-엔드 기계 직접 단계 데이터 기능 변환 하 여 원본 데이터를 자동으로 레이어를 영향을 전체 학습 과정 직접 최적화 목적 함수에 관련 된 문제 이며, 전통적인 기계 학습 종종 나누어집니다 몇 불연속 단계 지속적으로 전체를 최적화의 목표는 아니다. 따라서, 상호 연결 된 것 들, 데이터 폭발, 뿐만 아니라 의미의 인공 지능 시대의 출현의 시대 심층 학습 핵심적인 역할을 재생 됩니다. 지금부터 2020까지, 우리는 인공 지능 음성 인식, 컴퓨터 비전, 자연어 이해, 로봇, 및 자동 조종 장치 분야에서 지속적인 혁신을 볼 것 이다.
지능의 시대: 큰 데이터를 깊이 학습 동일시 될 것 이다?
그룹에 대 한 배열 하는 회의의 주최 미디어에 의해 여러 전문가를 방문. 내가 질문 Li Guojie 등 전문가: "그냥 청 사무총장 큰 데이터 패널 전문가 투표 다음 올해의 빅 데이터 기술 동향은 그 신경 컴퓨팅과 인공 지능으로 대용량 데이터, 일부 구성원 이다 내년 처음 국내 큰 인터넷 기업 큰 데이터 개발의 촉진에 말하는 것을 선택 하는 더 많은 기대를 했다 이 2015 년 데이터 AI, 동일시 또는 깊은 학습의 기호 의미 합니까? "
"리 Guojie" AI, 큰 데이터 하지만 큰 데이터를 전체 지능형 기술, 동일시 하는 많은 전문가 들은 중국 미래에 매우 중요 한 방향 이므로. 지난 몇 십년은 지금 발견 지능형 더 및 더 높은 수요, 난 희망을 그것은 더 많은 산업에 기여, 디지털, 다음 자동화, 다음 네트워크, 지능형 또한 완료, 하지만 상대적으로 하지 그래서 중요 한, 하지만 나중에 더. 그래서 intelligentization는 매우 중요 한 주제 여야 합니다. 하지만 아무 끝이 정보, 예, 저기, 그림자에 이전 하려는 태양 처럼, 사람의 그림자는 항상 경계를 하는 경우. 어떤 지적인 것으로 생각 되었다 지금 여겨진다 하지 지능형.
지금 정보 우리 모두가 걱정 하는 새로운 경제 정상에 드래그의 약간 이다. 중국의 경제 요인에 의해 주도 되었다, 때문에 그것 지금 GDP 성장 둔화 되 고 단계는 인간 두뇌의 혁신, GDP를 증가 하는. 과거에, 종사 하는 많은 년 "근육" 확장 의존으로, 그래서 땀에 의존 합니다. 그리고 두뇌에 의해 혁신에 의해 인공 지능의 미래.
소위 정상 거부할 것 이다 이것은 새로운 시대의 시작 이다, 내가 생각 하는 것, 지능에 방법을 찾기 위해 더 많은 사람들이로 승천. 환경 오염, 자원 고갈 모순의 감소 될 것 이다. 두뇌의 소비와 자원의 소비는 두 가지 문제 때문에 뇌의 소비 수 있습니다 원인 바이 폴라 사회 세계에서 매우 심각, 소득과 너무 여러 번, 똑똑한 사람들이 고 하지 똑똑한 사람들이 미래에 더 반영 사회 격차. 어떻게 공정한와 인기, 사회 전체 수 있도록 새로운 주제는.
"Biopo" 당신은 그냥 그 질문은 그 큰 데이터와 AI와 동일시 하는 방법을 학습 하는 깊이? 이러한 관계는 큰 데이터는 연구 개체, 인공 지능 목표, 우리는 데이터를 이해 하는 인공 지능의 목표를 달성 해야, 방법론은 기계 학습 또는 지능형 컴퓨팅. 깊은 학습 기계 학습에 10 손가락 안에 손가락 이다. 예를 들어 그냥 교사 네트워크 보안에 대 한 이야기를 분류 하는 데이터를 암호화 하 사용할 수 있습니다 없습니다 학습의 깊이 해결 하기 위해. 따라서, 3 사이 관계는 크거나 같음, 관계, 관용도 또는 논쟁의 다른 수준 사이의 관계. 인공 지능에 깊은 학습, 같은 기계 사용 될 수 있다 학습 어디, 어디 사용할 수 없습니다, 학문에서 분야와 산업은 매우 분명 하다. 덜 성숙한 우리가 천천히 공부, 하지만 이것은 학습의 깊이 모든 포괄은 아닙니다.
최근, 호킹, 같은 커뮤니티의 일부 구성원 말 그 인공 지능 혁명, 또는 인공 지능으로 이어질 것입니다 그들은 테슬라의 CEO, 인간 보다 더 강력한 것 처럼이 있어야 인기 있는 과학 및 엔터테인먼트 주제, 심각 하 게 촬영 하지 않아야. 인공 지능 인간 주제에 대 한 대체 하지 않습니다, 그리고 그것은 사람들이 할 수 있는 것 들을 어떻게 해야. 예, 인공 지능, 아니 과학자는 생체 공학 로봇에 큰 관심 있습니다. 생체 공학 및 인공 지능 수준 엔지니어링 두 가지 이며 기술 성공 소 예는 많은, 그래서 우리는 공학도 통해 항공기 같은 몇 가지 인기 있는 과학 선전. 항공기의 원리와 조류의 비행 원리는 완전히 다른, 기계 학습 및 두뇌 작동 원리는 완전히 다른, 그들은 작품의 대중화에 대 한 이야기. 인공 지능에 대 한 우리 수 없습니다 동일시 그것 깊이 학습 하 고, 마치 인간의 두뇌를 공부 하 고 인공 지능을 달성할 수 있다.
"청" 교수 Biopo의 뷰는 큰 데이터와 인공 지능 동일시 하지 해야 합니다, 큰 데이터 자체 징계로 미래에 사용할 수 있습니다 하지만 그것은 여전히 현상에 동의. 그러나 다른 한편으로, 우리는 이야기 우리 지능형 컴퓨팅, 전화 하는 결론에 대해 말하자면, 큰 데이터 계산, 정보를 표현 하거나 수 있는 학계와 업계의 우려 앞에 몇 시간 동안 기계 지능, 인공 지능, 지능의 모든 종류를 포함 하 여 지능의 문제를 해결 하는 방법.
인공 지능 해결 합니까 문제가 무엇? 사람들의 생각을 해결? 또는 사람들의 예측을 해결 하거나 현상 해결? 어떤 인공 지능의 메커니즘 즉, 적어도 큰 데이터 예측 결정을 인공 지능의 범주에서 승격 될 수 있습니다.