큰 바이오 데이터 "도보 어렵다"

출처: 인터넷
작성자: 사용자
키워드: 큰 데이터 nbsp;

"빅 데이터"의 시대가 왔다. 현재, 큰 데이터는 IT 산업에서 주요 파괴적인 기술 혁명 후 되고있다 클라우드 컴퓨팅 및 인터넷 것 들의. 기술의 대중화와 함께 큰 데이터 적용 된 생물학, 금융, 유통, 에너지, 교통 분야에서, 어떤 사람들의 삶의 모든 측면을 permeating은.

다른 분야에 비해, 중국은 큰 데이터에 외국 시작 지점에 일치, 큰 데이터 나가도 우리 나라에서 새로운 개발 기회 라고 할 수 있다. 이 위해,이 신문은 대용량 데이터 시대의 도착에 맞게 다양 한 분야에서 큰 데이터 응용 프로그램 및 중국의 큰 데이터 개발, 그리고 독자의 어려운 문제를 소개 하는 열을 열 것 이다.



비록 중국의 데이터 생산은 매우 큰, 하지만 생물 학적 데이터는 여전히 상대적으로 뒤 외국에 비해.

세계 컵 예측, 대학 입학 시험, 어떤 종류의 남자는 오늘 가장 인기 있는... 큰 데이터를 사용 하 여 이러한 익숙한 분석 하지만 소수의 사람들이 알고 많은 수는 이미 생물 의학 분야에서 "손"를 도달 하 고 질병 예측을 시작 했다.



유럽 및 미국에서
국가 생물학 분야의 발전에 큰 중요성을 첨부. 올해 3 월, 영국 영국 의료 연구 위원회 (MRC) 32 백만 파운드 용량, 용량 및 의료 생물 정보학의 핵심 인프라를 개선 하기 위해 처음 5 주요 프로젝트에 자금을 투자할 것 이라고 발표 했다.  "의료 생물 정보학 프로그램"는 £ 50 백만의 총 투자 예상, 커플링 복잡 한 생물 학적 데이터 및 건강 기록의 새로운 방법을 생성 하 여 중요 한 의료 문제를 주소 것입니다.





빠르면 2012 년 3 월, 오바마 행정부는 "빅 데이터 연구 및 개발 프로그램을" 이상 $200 백만 조 투자 유망 국가 전략적 차원에 큰 데이터를 발생 시킨 발표 했다.  2014, 정부 완전 하 게 하는 방법에 생물 의학 대용량 데이터의 사용 하지만 또한 지식 프로그램에 다 데이터를 발표 했다.





비록 우리 나라 기업 또한 자주 큰 데이터 하지만 상하이 생물 정보 기술 연구 센터 감독에 움직임는 중국 아카데미의 과학 상하이 생명 과학 연구 연구소 생물학 정보 센터 디렉터 리 Yicho "중국 과학 신문" 기자 지적: "비록 다른 방향으로 개발에 국내 큰 데이터까지 해외, 초과 하지만 큰 바이오 데이터는 여전히 상대적으로 뒤 외국에 비해. "






에 아니 무료로 점심 식사



되지 않기 때문에 데이터 수량은
생물 학적 큰 데이터 개발은 해외에 뒤에 떨어지고 있다.





첸 Runsheng, 과학의 중국 아카데미의 학회 회원에 따라 초기 연구자 중 하나는 이론적인 생물학에 종사 생물 정보학 연구, Huada 유전자로 표현 하는 유전자 시퀀싱 메커니즘 큰 생물학 데이터의 생산에 중요 한 기여를 했다.





의 현재 연속은 약 40%의 국제 데이터 및 기술 개발 및 시퀀싱, 거의 모든 연구 대학 및 연구 기관의 비용으로 농업, 임업 또는 의학, 유전자 시퀀싱을 수반.





"게놈 수준에서 대규모 생물학 데이터의 개발 프로테옴, 대사 그룹 및 바이오-네트워크 등 다양 한 수준에서 관련 된 생물학 데이터의 대량 생산을 주도하 고 있다 하지만 우리나라는 아직 통합된 생물 정보학 정보 센터를 설립 하지."  "첸 Runsheng 지적 한다.





Li Yicho는 또한 해외 대형 데이터 지연에 대 한 가장 근본적인 이유는 중국에서 더 큰 포괄적인 생물 학적 데이터베이스 및 생물학에 대 한 더 큰 데이터 센터 플랫폼은 믿고 있다.




즉, 그 때 우리는 연구를 수행, 우리가 수만 "도움을 요청" 큰 데이터베이스에서
.  이러한 큰 데이터베이스 주장 그들은 제출 응용 프로그램으로 데이터를 공유 하는 무료, 아니 무료로 점심 식사는.





기자 일부 대형 국제 생물학 데이터베이스 데이터 사용자가 자세한 데이터 사용 지침, 데이터베이스 데이터, 하지만 그것의 금액은 그것의 사용에 밖으로가 게 쉬운 우리 과학자 들에 의해 제출 하는 경우에 제출 하도록 해야 배웠습니다.





Li Yicho 말했다: "자유로운 데이터 공유만 이론적으로, 실제 코어 데이터 하지 제출 됩니다 신청자에 게 시간, 전문가 아닌-코어 또는 불완전 한 데이터는 발견할 것 이다." 대형 데이터베이스 관련 임상 의학은 데이터 지원자를 검토 하는 특별 한 위원회 그리고 만약 그들이 적용을 거부, 그들은 이유를 주지 것입니다. "





따라서, 데이터를 얻을 자격을가지고, 우리의 과학자 들은 종종 위해서는 반복적으로 하지만, 종종 더 아래 서류를 준비 하. "정복, 매우 짜증된입니다.  Li Yicho 외쳤다.





건물 큰 플랫폼 충족 "어려운 문제"





종종 공익, 장기적이 고 안정적인 투자와 전문 기술 팀에 대 한 필요와 함께 국가 생물학 데이터베이스의 설립.  전문가 따르면, 90 's에 우리 나라의 관련 부서 국가 수준의 데이터 센터의 설립으로 간주 하지만, 지금까지 특정 구현 계획이 논의 되었습니다.





그래서, 왜 데이터 센터 지연 되었습니다?





Li Yicho 기자, 영국과 미국 데이터베이스의 설립에 많은 돈 투자, 가장 재능 있는 사람들의 소개는 박사, 연간 비용 의회 세 출에 의해 지원 됩니다, 그리고 소스는 더 안정, 투자는 올해 약 100 백만 달러.





"비슷한 생물 설정 하는 경우 대용량 데이터 센터, 우리 또한 있어야 사람들의 수백 및 년의 수백만의 수백의 장기 안정적인 투자." 돈을 정부에 의해 지불 하는 경우 장애물은 여전히 하지 작은.  "Li Yicho 분석입니다.





첸 Runsheng는 또한 지적 국가 수준의 데이터 플랫폼의 설립은 사회 과학에서 일반적 이다 하지만 센터의 위치에 대 한 다양 한 시나리오, 그것 제시 하는 방법 (엔터티 또는 가상), 그것은 무엇을 포함, 참여, 권리의 범위 및 관리 및 WHO에서 관리 하는 방법.




이러한 상황에서 집중, 무 능력
통합 생물의 배포 데이터는 국가에서 어려운 문제가 되고있다.





"중국 이야기를 게놈 데이터와 단백질 데이터 있지만, 다른 사람, 작은 데이터 센터와 논의를 하지만 그들의 자신의 거기 아무 통합된 조정 관리의." 국가 생물 데이터 센터 없이 협조 될 수 없습니다.  첸 Runsheng는 어려움





같은 시간, 중국의 생물 학적 데이터, 출력은 큰, 그러나 이용 비율은 충분히 멀리 이다. 결과 데이터는 좋은 정보를 제공 합니다, 하지만 발견의 전체 가치를 여러 측면 있다.  데이터의 양이 큰 경우에, 그것은 분석 하 고 짧은 시간에 그 가치를 발굴 문제입니다.





또한, 큰 데이터 생성 필요 해당 이론, 기법 및 방법, 따라 하 고 새로운 도구와 방법이 필요 하다.  업계 관계자만 아니라 미국과 유럽, 하지만 데이터 분석 프레임 워크, 소프트웨어 시스템에에서 국내 기존 대형 생물 학적 데이터 분석으로 용량을 밖으로 지적 하 고 그것에 고급 기술을 업그레이드할.





는 중국의 "토양"
에 뿌리




Li Yicho 지적 큰 생물 학적 데이터를 있지만 이러한 장애물에 직면 하지만 의지할 수 있는 "대상, 강한 협력 파악" 국제 발자취 따라 잡는.




그의 관점에서
, 큰 생물 학적 데이터의 중국의 발전의 장점은 대규모 샘플은.





어떻게 해야 지금 국내 바이오 데이터 리소스를 보호 하 고 그들을 사용 하 여 가치 있는 방법의 찾을 것입니다.





"하나는 명확히 큰 생물 학적 데이터 목표와 채널을 개발 하 고 두 번째는 생물학 데이터의 좋은 일을 함께 작동 하도록 오픈 지향과 국내 연구 단위."  Li Yicho 강조 했다.





예를 들어 중국에서 현재 의료 연합 프로젝트가 했다 몇 가지 성과를 상하이 지역에서.





병원 및 지역 사회 병원 의료 기록 및, 주민의 건강 파일 연결 있고 34 백만 전자 의료 기록 및 아카이브를 포함 하 여 데이터베이스 시스템 설립.





Li Yicho와 같은 데이터의 작은 방울 수는 바다, 큰 생물 학적 데이터를 유익한 수렴 결국이 국가 전략적 자원 보호 및 활용을 호출 하는 환자의 동의 취득 후 건강 파일 및 시험 결과, 뿐만 아니라 효율성을 향상 시킬 개인 정보 보호에 대 한 편견 없이 의사의 고 말했다.





또한 큰 생물학 데이터의 개발은 철저 하 게, 되어야 지적 첸 Runsheng는 중국의 "토양", 그것의 자신의 특성을 마이닝에 뿌리.





"중국의 종족 특성의 다양 한 있다, 그것은 전적으로 독특한 생물 학적 큰 데이터 시스템 수." 이런 상황, 문제, 보고에서 큰 생물학 데이터의 개발은 더 목적이 있는, 이것이 우리가 주의를 기울여야 한다. "첸 Runsheng 말했다.

관련 문서

연락처

이 페이지의 내용은 인터넷에서 가져온 것이므로 Alibaba Cloud의 공식 의견이 아닙니다.이 페이지에서 언급 된 제품 및 서비스는 Alibaba Cloud와는 관련이 없으므로이 페이지의 내용이 골칫거리 인 경우 저희에게 알려주십시오. 우리는 5 일 근무일 이내에 이메일을 처리 할 것입니다.

커뮤니티에서 표절 사례를 발견한 경우 info-contact@alibabacloud.com 으로 관련 증거를 첨부하여 이메일을 보내주시기 바랍니다. 당사 직원이 영업일 기준 5일 내에 연락 드리도록 하겠습니다.

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.