분야에서 점점 더 중요 한 역할을 담당 하는 인공 지능 기술 큰 데이터, 그리고 그것의 기술공 IBM 왓슨에 증가 관심을가지고. 최근, 리 Yonghui, IBM의 사역의 과학 및 기술, 뛰어난 엔지니어 2014 중국 큰 데이터 기술 컨퍼런스를 참석 하 고 연습과 AI 기술 업계에서의 응용의 가능성을 분석 하는 예제로 왓슨을 복용 CSDN 클라우드 컴퓨팅, 독점 인터뷰를 받았다. Li Yonghui 믿고 데이터와 구조화 되지 않은 데이터의 조합 생성 지혜는 대용량 데이터의 향후 방향 그리고 왓슨 표현 인지 컴퓨팅 기술이이 목표를 달성 하는 고 기능 다양 한 산업 솔루션 또는 클라우드 제공 모델의 도입을 포함 한 IT 제품에 통합 될 것입니다.
인터뷰의 내용은 다음과 같이 요약 된다:
CSDN: 큰 데이터 기술 최근 일부 IBM의 이해 개발에 당신을 소개 하자.
리 Yonghui: 우선, 2014 중국 큰 데이터 회의의 성공에 축 하 우리는 1000 개 이상의 사람들이 회의 참석, 다양 한 제조 업체와 많은 해외 전문가 포함 하 여 큰 영향 및 중국에서 큰 데이터의 관심사를 나타내는 보고 기쁘게. IBM의 관점에서 큰 데이터 4V 특성 (포함: 볼륨 데이터 용량; 다양 한 데이터 형식; 속도의 속도 데이터; 정확성 데이터 진위 또는 값 데이터 미래에 하드웨어에서 시스템의 미래, 소프트웨어 개발 방향이 4 v 협력에 집중할 것 이다 그래야 다른 개발을 많이 해야한다.
IBM는 구조화 된 데이터 처리에 대 한 전통적인 데이터베이스 기술 뿐만 아니라 구조화 되지 않은 정보에 대 한 NoSQL 기술을 크게 개발 될 미래에 믿고 있다. 우리가 구조화 된 데이터와 구조화 되지 않은 데이터는 대용량 데이터 분야의 미래 발전을 보고 우리를 위해 주요 방향으로 비즈니스 혁신을 안내 하는 통찰력을 만들려고 합니다.
CSDN: 데이터 값, 인공 지능, IBM 또한 지금 특별 한 관심의 다른 유형의 마이닝 어떻게 당신이 생각 하는 큰 데이터 문제를 해결 하기 위해 인공 지능 기술을 채택 필요?
리 Yonghui: IBM 향후 검색 데이터와 데이터 마이닝을 간단한 데이터 쿼리에서 미래의 큰 데이터 및 구조화 되지 않은 흐름 데이터를 기존의 구조화 된 데이터의 처리에 의해 특징 인지 컴퓨팅의 개발 방향으로 인공 지능을 분류 합니다. 이제 우리는 그냥 사람에 의해 생성 하는 데이터에서 보면, 있을 수 있습니다 데이터 생성, 생성 하는 것 들 데이터, 시스템에서 생성 된 데이터, 생성 된 착용 장비 데이터, 등의 네트워크의 미래에 더 많은 센서 필요 도움을 좀 더 지능적인 분석 시스템 선택.
컴퓨팅 자원 감소, 오프닝 도구 및 일부 오픈 소스 제품의 개발의 비용으로 장차의 방향에 관해서는 임계값 적게, 그리고 인지의 미래 컴퓨팅 여러 방향에 있을 것입니다 다른 산업에 대 한 있을 것 이다 그것의 자신의 특성, 되며 각 개발된 제품 낮은 임계값, 있을 것 이다 통합 일부 제품 미래에 또는 그것을 사용 하 여 함께 개발 하.
Csdn:watson는 IBM의 인지 컴퓨팅 기술 대표, 업계에서 그것의 이점이 반영 됩니다 어떻게 생각 합니까?
리 Yonghui: 왓슨 설계 되었다 ibm 100 주년을 기념 하기 위해 공부 하 고 2011 미국 비디오 게임 쇼 "위험의 위기"에 참여 했다 위험 두 번째 인간 기계 전쟁을이 겼 다. 우리가 질문 및 답변 (DEEPQA) 기술, 핵심 단어를 캡처 의미 론 적 분석을 통해의 깊이 사용 하 여, 문제, 다양 한 컴퓨터, 검색 비교, 증거를 얻기 위해 결합 병렬에 대 한 해결책의 성격 분석 (증거 기반) 분석 결과 기반으로.
이 컴퓨터의 기능은 IBM의 모든 분야에서 최고의 기술 조합, 하드웨어 플랫폼은 2880 IBM 파워 프로세서 코어 클러스터, 높은-성능 컴퓨팅, 유연한 확장, 높은 병렬 및 계층형 스토리지 관리, IBM의 GPFS 병렬 파일 시스템 확장 소프트웨어 결합 IBM의 연구 및 개발, 인간의 자연 언어 구문 분석 능력, 자율 학습 능력 등의 많은 년, 구조화 되지 않은 데이터 분석 기능, 그래서 그것은 IBM의 강력한 장치 및 최상의 소프트웨어 조합. 미래 왓슨 기술은 다양 한 분야에에서 사용 됩니다, 왓슨의 뛰어난 기술이 IBM의 새로운 하드웨어, 소프트웨어 및 서비스 제품으로 통합 될 것입니다.
CSDN: 당신은 그냥 다른 산업에 대 한 다양 한 솔루션, 왓슨을 기반으로 다른 산업 솔루션을 소개할 수 있다? 있는 일부 클라우드 환경을 통해 전달 될 수 있는?
리 Yonghui: 두 번째 인간 기계 전쟁 승리 후 우리는 왓슨, 우리의 제품에 그리고 또한 다른 업계 전문가와 기술을 통해 상용화 하 고 싶었다. 우리가 선택 하는 첫번째 일은 인간이 되지 현재 다루고, 암 치료의 문제를 해결 하기 위해 또는 암 치료법을 제안 희망 의료 직업.
사실, 우리, 재무 제표의 분석 뿐만 아니라 위험 관리, 고객 관계 관리 등 금융 산업에서 수요를 많이 보기 때문에 우리 금융 산업으로 잘라 두 번째 산업 지원을 제공 왓슨의 분석 능력을 통해 될 수 있습니다. 우리는 미래에 다른 기업에서 지원이 있다.
환경 개발의 구름에서 왓슨의 미래 계획 중 하나 사용을 제공 하는 클라우드 일부 Api를 제공 하는 등 서비스와 같은 접근을 차례입니다. 현재 사용자가 사용 하는 IBM Bluemix 플랫폼에서 7 서비스가 있다. 이러한 서비스의 대부분은 언어 구문 분석 및 분석을 관련이 있습니다. 보이는 미래에, 우리는 계속 온라인에 더 많은 전력을 제공.
CSDN: 언어 분석/대용량 데이터 분석 또한 많은 응용 프로그램, 하지만 중국 및 외국 언어 차이가 있을 것 이다, 지역화, 중국에 대 한 왓슨 시스템 않았다 어떤 지역화 연구 및 개발? 거기 무엇 다른 성공 사례는?
리 Yonghui: 언어의 분석 문화와 좋은 관계 및 언어 사용의 모든 나라의 습관 있으며 학습의 과정 필요. 왓슨에서 제공 하는 서비스는 서비스의 일부만 현재에 큰 데이터 분석 응용 프로그램의 응용 프로그램에서 다음 단계를 촉진 하기 위하여 중국 차별화 합니다. 동시에 중국에서 IBM 중국 연구소를 설정 하지만 또한 중국 문화에 대 한 관련된 기술 연구 및 제품 개발, 미래에 있을 것 이다 더 나은 조합.
왓슨은 일반적인 기계는 하드웨어의 집합을 판매 하거나 고객에 게 판매 하는 소프트웨어의 집합 하지만 업계와 좋은 조합을 기대는 플랫폼은 고객의 자신의 방법 개발 적용의 조합 제공. 왓슨의 상용화를 촉진, IBM이 올해 설정 새로운 왓슨 비즈니스 그룹 일부 특수 산업에 대 한 왓슨의 조합을 제공 하. 그냥 우리의 첫 번째 조합 의료 산업의 조합, 미국에서 몇 가지 의료 산업 기업 함께 공부 하는 언급 했다. 또한, 금융 산업에서 우리는 글로벌 및 씨티, DBS와 다른 협력 있다. 왓슨의 서비스 중 일부는 웹에 열려 있기 때문에, 우리는 미래에 통합 될 응용 프로그램의 다양 한 있을 것입니다 예상.
CSDN: 했 어 당신에 대해 뭐라 제 응용 프로그램, 그리고 지금 그것의 최신 개발?
리 Yonghui: 항 암 제는 우리의 첫 번째 응용 프로그램, 2012 년 정도에 설치, 응용 프로그램 디버깅 및 학습, 1-2 년 후 가장 중요 한 배우는, 의료 산업 등 환자 사례 및 의학 정기 간행물의 많은 수를 포함 하 여 기록 데이터의 많은 수를 포함 하기 때문에. 지속적인 기계 학습을 통해 시스템 진단 및 암 치료에서 다음 단계를 결정 하는 그들을 돕기 위해 몇 가지 의사 증거 기반의 제안을 제공 합니다. 기계 의료 의사에 대 한 결정을 할 수 없습니다, 때문에 왓슨만 제안을 제공 하 고 추천, 뒤에 데이터 또는 링크 체인을 나열 하며 의사 판단을 내릴 때 왓슨 증거 기반 분석 결과 나 권고를 제공 합니다.
미국, 어디 그들은 일부 암 환자를 치료 하는 과정에서 매우 드문 증상을 발견 하 고 10 미만 의사 전세계 알고 그들을 치료 하는 방법, 하지만 기계 최신 의학 저널 및 연구 보고서, 학습을 통해 몇 가지 실용적인 성공 되었습니다. 그 다음 최고의 액션을 고려 하거나 증거 기반 분석 결과 제공 하는 모든 의사를 알 수 있습니다. 일반적으로, 광대 한 의료 지식에 비해, 의사, 매년 마다 새로운 것을 배우에 더 적은 시간을 보낼 수 그리고 기계 학습의 도움으로 의사 정확성과 증상 진단의 신뢰성을 높일 수 있습니다.
CSDN: 제 5 월 현재 의료 직업에 직면 가장 큰 문제는, 그것은 동일한 원리를 사용 하 여 다른 문제에 대 한 솔루션을 얻을 수?
리 Yonghui: 솔루션에서 암 분야에서 사용할 수 있습니다, 하지만 모든 산업, 그리고 심지어 각 전문의 의료 산업, 그들의 자신의 전문 지식을 사용할 수 있는 디버깅 후, 관련된 정보 수집, 분석을 할 수 있다. 그래서 우리가 전에 의료 업계와 함께 일 한 두 가지 경우에는 협력의 1 년 보다 더 나은 결과 있을 것 이다.
CSDN: 훈련 주기 데이터, 질병의 복잡성 및 어떤 요인이 관련 되므로 관련이 있습니까?
리 Yonghui: 우선, 전문된 지식 용어, 구문 분석, 그는 각 산업 분석 언어 수 있습니다 이해 하지. IBM 왓슨 일부 기술 몇 가지 새로운 용어를 찾아서 다음 인지 지식 중요 또는 중요 하지 않은, 관련성을 알고 하는 것입니다 다음이 정보는 우리가 모를 거 야, 몇 가지 관련 데이터를 찾을 때 데이터를 스캔 이것이 어려운 점.
둘째, 각 산업, 특히 전문 업계, 자체 개발은 매우 빠르다. 의료 계, 생명 공학, 뿐만 아니라 착용 장비, 바디의 품질의 출현, 같은 데이터 컬렉션의 신체 병 리 특성 어떻게 거 대 한 증가 수 그 역사적 의료 데이터와 새 데이터를 유용한 데이터의 분석의 교차로 건너 넣어, 이것은 도전 앞에.
또한, 기계 자체의 메커니즘은 많은 양의 데이터 처리할 때 보다 효율적인 방식으로 처리 해야 합니다.
CSDN: 당신은 항상 강조가 오픈 소스와 개방, 어떤 종류의 노력이 두 가지 측면에서 우리는?
리 Yonghui: IBM 오픈 소스 업계에 중요 한 기여자 이다. 언어 분석 분야에서 국제 표준 중 하나입니다 Uima, 구조화 분석을 위한 공통 플랫폼을 제공, 반복적인 개발 감소와 실제로 IBM 기부금의 많은 왓슨 개발 음성 분석 과정 개발 주요 기술 중 하나입니다. 다음 단계에서 우리는 왓슨 음성 분석에 중요 한 병렬 처리를 달성 하기 위해 통해 수준 확장 기술을 개발할 것입니다. 개방, 서 방금 언급 한 IBM의 파워-처럼 코어 프로세서는 매우 높은-성능, 그리고 이것은 업계 최고급 프로세서 기술에는 처음으로 열고 OpenPOWER 얼라이언스를 통해 업계에 일부 CAPI 고속 IO 인터페이스 또한 열립니다, 우리는 미래에 IT 산업에 많은 하드웨어 혁신 및 변화를가지고 기대 합니다.
CSDN: 당신이 방금 언급 한 왓슨 일부 서비스는 웹에 있다면, 그들의 기술을 적용할 왓슨의 결과 중 일부를 제 3 자 개발자에 대 한 필요성에 있다고?
리 Yonghui: 우리는 왓슨의 사용 시나리오의 미래 오픈 API 또는 제공 하는 무료 방법, 그리고 전문적인 시스템에서 기본적으로 서비스는 SaaS를 통해 왓슨의 기능을 사용 하 여 더 많은 사용자를 허용 하는 2 개의 방향, 있을 수 있습니다 참조 IBM 응용 프로그램, 모든 분석 시스템을 통합 하는 업계의 특성을 개발 하기 위해 업계와 밀접 하 게 통합 하는 더 훈련을 많이 필요, 각 업계 요구 사항은 서로 다른 것입니다. 우리가 방금 언급 하 고 있다 처럼 의료 직업에 암 치료가 아니다 감기 치료와 동일.
CSDN: 당신이 주요 연구 및 개발 방향 왓슨의 미래에 요약 수 있습니다?
리 Yonghui: IBM은 연구 및 개발, 매우 집중 하는 IT 회사 이며 장점 중 하나는 하드웨어, 소프트웨어 및 서비스, 클라우드 서비스 등의 조합 이다. GPU, FPGA 가속, 메모리 공유 및 다른 기술의 미래 왓슨의 주요 개발 방향 CAPI 고속 연결 채널을 통해 하드웨어 플랫폼의 대규모 실시간 처리 기능을 향상 시키기 위해 더 나은 통합 같은 OpenPOWER 동맹의 결과 활용 뿐만 아니라 다른 산업, 뿐만 아니라 그들은 또한 Watson의 연구와 개발의 성과 공유할 수 있습니다 일반 대 중에 게 더 나은 서비스를 제공 하도록 하는 클라우드를 통해 소위 크로스-산업 조합으로 결합 하는 다른 산업의 수를 확장 하는 것입니다.
CSDN: 어떤 조언을 IBM는 그 인공 지능 기술을 사용 하 고 싶다면 큰 데이터를 구현 하려면?
리 Yonghui: 우선, 우리는 것이 좋습니다 기업 비즈니스, 무슨 큰 데이터와 결합 될 수의 범위 내에서 그의 산업을 이해 해야 또는 구조화 되지 않은 데이터를 더 그들의 서비스를 강화, 우리는 일부 지역 등 고객 관계 관리, 위험 관리, 참조 함께 소셜 데이터 분석 등의 큰 데이터 분석 큰 도움이 될 것입니다. 이것은 산업, 그리고 첫 번째 단계는 비즈니스 체인에 관련 된 데이터를 찾아. 두 번째 단계, 성공적인 작은, 시작 하는 제안에 사용할 수 있습니다. 전통적인 데이터베이스 뿐만 아니라,이 두와 함께 일부 구조화 되지 않은 데이터 분석 도구를 사용 하 여 더 나은 개발의 다음 단계를 얻을 수 있습니다.
플랫폼의 선택에서 우리 또한 고려해 야 한다 미래 개발, 다중 소유 환경에서 이용 율을 개선 하는 방법 더 나은 플랫폼을 제공 하는 방법. IBM는 전원 하드웨어를 통해 일부 IBM 소프트웨어 제품 수 있습니다 고객에 게 점점 더 나은 선택 기대 하고있다.
CSDN: 마지막으로, 무엇 인가 당신의 감정과 올해 BDTC 회의 대 한 제안
리 Yonghui: 우선, IBM 2014 빅 데이터 기술 회의에 참여 하도록 초대에 대 한 주최자를 감사 합니다. 더 많은 사람들이 큰 데이터 필드를 나중에 합류 한다 고 그것은 기대는이 회의에서 IBM과 중국의 현지 기술 전문가 만들 수 있습니다 더 많은 교류 지역 전체 중국 큰 데이터의 깊이에서 개발 하 고 있도록 노력 하겠습니다. 동시에 중국 그것의 희망도 기술 산업 미래에 더 있을 수 고도 연구 및 개발 결과, 소스와 공동으로 산업의 발전을 촉진 하는 다른 지역 사회 기여.