그것은 다른 기업 및 개인 정보를 보호 하 고 데이터를 정규화 하는 동안 데이터 교환 플랫폼을 설정 하는 서비스에 "섬" 데이터를 통합할 수 있습니까?
이 전체적으로 기업, 개인, 심지어 사회에 도움이 됩니다. 하지만 비즈니스 엔터티, 큰 데이터는 지금 그것의 자산의 부분 및 그것의 경쟁적인 가장자리를 잃는 의미할 수도 있고 데이터 공유
펜을 꺼내, 두 선을 그리는 텅의 헤이룽장 성 헤이허, 윈난 지방에 우리의 국가 지도에 라인의 오른쪽만 땅 면적의 36% 차지 하지만의 인구에서 살아 96%-이것은 유명한 인구 지리학자 Hu Huanyong "헤이허 텅 선", 일컬어 Hu Huanyong 선에서 발견 하는 1935 년에 그것은 지리에 큰 의미와 우리 나라에서 인구입니다.
"이것은 큰 데이터 80 년 전에입니다. "7 월 25 일에" 큰 데이터 링크 미래 "포럼 제품 부서 Shenyacheng의 부 제너럴 매니저 온라인, 동시에 QQ의 수를 보여주었다 Tencent 인터넷 및 사회 연구소, Tencent, 조직 그리고" 헤이허 텅 선 "반면, 결과 보기 두 사진을 기 막히게 비슷합니다.
또한, Shenyacheng 수집 및 대용량 데이터의 발굴을 통해 만날 수 있습니다 정부, 기업 및 개인의 요구와 같은 큰 데이터 함수 특정 참조를 제공 하는 결정에 대 한 예측을 통해.
규모는 심판에 대 한 단독으로
위키백과로 큰 데이터 정의: 데이터 참여의 양을 차단, 관리, 처리, 및 인간의 합리적인 시간 내에서 해석할 수 있는 정보를 구성할 수 있을 만큼 거 대 한 이며 바이 백과 사전 항목으로 표현 된다: 대용량 데이터, 또는 거 대 한 양의 정보를 현재 주류 소프트웨어 도구, 캡처, 관리, 처리 및 데이터 정렬 비즈니스 의사 결정 더 긍정적인 목적 정보를 달성 하기 위해 적절 한 시간 내에 통과 하지 수 큰 규모에 관련 된 데이터의 양을 말합니다.
교수 Wenjirong, 중국의 정보 대학 인민 대학의 부사장 말했다 위키백과 바이 백과 사전의 큰 데이터의 정의 기본적으로 "큰" 개념에 집중 하지만 더 깊은 문제를 공개 하지 않았다.
"빅 데이터 먼저 판단 하 고 예측 하는 능력 이다." "Wenjirong 설명 전제의이 거 대 한 데이터 수집 및 저장, 처리, 기술 습득에 기반은 판단 하거나 예측 하는 새로운 능력의 결과."
사실, 소위 큰 데이터는 절대 수량, 수 100 T의 대형 데이터 아니다는 말할 수 없다. 큰 데이터 주로 적용 문제의 크기와 관련이 있습니다. "Wenjirong 설명 했다," 데이터 문제, 문제, 특히의 샘플 공간 크기의 크기를 사용 하는 것입니다, 이러한 데이터는 하지 충분 하는 것을 결정할 것입니다. "
Wenjirong 말했다: "만약 데이터 적절 하 게 문제의 표본 공간을 커버 할 수 있다, 그것은이 문제에 대 한 큰 데이터." 이 데이터는 해당 데이터와 함께 모든 가능한 상황을 커버 하기에 충분. "
규모와 품질에 대 한 이야기
전문가 들은 경고는 현상 대용량 데이터를 공부 하는 과정은: 많은 사람들이 데이터는 충분히 큰 생각 하는 경향이 있지만 문제, 즉 데이터의 품질을 무시. 만약 당신이 몇 가지 소위 통계 분석을 할 신뢰할 수 없는 데이터의 무리, 결과 매우 위험 하다.
"전통적으로, 우리가 많은 통계 분석을 할 때 우리가 특히 강조 데이터 샘플링의 공평 하 고 임의의 자연." 하지만 오늘 우리가 때 큰 데이터를 사용 하 여이 점 잊지 것, 내가 생각 만큼 많은 데이터 간단한 통계 수집 때문에 큰 데이터 나 전체 샘플, 의심할 여 지 없이 매우 위험한 추세는 데이터의 품질에 갈 필요가 없습니다. "Wenjirong 생각 한다.
WN, 옥스포드 대학에서 인터넷 연구소에서 연구원 포럼에는 큰 데이터를 가져올 수 있는 두 가지 주요 위험 경고: 하나는 데이터를 잘못이 고 다른 하나는 데이터의 편차.
Primeton 데이터 제품 감독 왕 Xuan 미디어 앞부분에서 일부 기업은 어떤 마케팅 트렌드를 만들기 위해 데이터 분석 기반 하지만 데이터 자체는 잘못 된 결론의 분석 되지 않을 수 있습니다 유용한 인터뷰.
그런 말을 되었습니다 업계에서: 면 60%의 데이터 정확도, 문제 될 것입니다 확실히 경우 약 80%, 사용자의 데이터 정확도 "나쁜 것", 90%의 데이터 정확도 말할 것 이다 사용자에 의해 꾸 지 람 사용자가 진짜 암소를 느낄 것 이다.
"정보 섬" 끊길 필요가
Tencent 회사 소셜 네트워킹 비즈니스 그룹 사장, Tencent 선임 집행 부사장 대통령 통 Dawsong 또한 앞으로 넣어 포럼 "정보 섬"에 문제.
우리가 오늘, 그들의 대부분을 사용 하는 데이터는 Dawsong 통 다른 기업 및 말, 그들은 고립 된 섬에 캡처됩니다 있는 다른 서비스에 의해 수집 된 대용량 데이터에 반대는 매우 중요 한 속성 확장성 및 대용량 데이터의 개발은 하지만 확장성 더 중요 한 것은.
"정보의 섬에 모든 회사 자체 클라우드를 할 수 있습니다 그리고 그것은 많은 혜택을 더 통합된 시나리오를 만들 다른 섬에 데이터를 통합 하는 도전." "통 Dawsong 말했다.
통 Dawsong 질문 그에 대 한 생각을 다른 섬에 이러한 데이터를 통합 하 여 개인 정보를 보호 하 고 데이터를 정규화 하는 동안 데이터 교환 플랫폼을 설정 인지는 말했다.
"이것은 기업과 개인, 심지어는 사회 전체에 도움이," 고 말했다. 하지만 난 어려움, 비즈니스 엔터티, 큰 데이터는 지금 그것의 자산의 부분 및 그것의 경쟁적인 가장자리를 잃고 의미 데이터를 공유 하기 때문에. "통 Dawsong 말했다.
"대용량 데이터의 개발에 주요 병목 현상의 하나는 것 들의 예를 들어 인터넷 산업 사슬의 모든 측면의 경쟁 균형 그리고 지능형 도시, 큰 데이터 없이 완전히가을 하지만 같은 매크로 개념, 사실, 달성 하기 위해 이러한 개념 원하는 통합 및 균형에 걸쳐 특정 기업 또는 심지어 어떤 기업 든 지, 하지만 전체 사회 자원에 의존 하지 않습니다. "박사 Meng Zhaoli, Tencent 인터넷 사회 연구소의 산업 센터의 지도자 말했다.
Meng Zhaoli 크로스 sectoral 데이터 공유 풀, 모든 분야에서 지도자와 정부 중립적 제 3 자의 선호 풀 있이 필요가 나왔다.
"이는 필연적으로 리드 둘 다 경쟁의 수 및 기업의 협력 파트너십이 생태 원에 이번이에 기업에 더 많은 기여 몇 가지 피드백을 얻을 수 있는 가장 중요 한은 합리적인 관리 메커니즘의 설립에서 포함 될 것 이다 그리고 적은 기여 기업 일부 유료 서비스를 제공 하기 위해 고려할 수 있습니다." "Meng Zhaoli 말했다.
데이터 보안 문제를 무시할 수 없습니다.
큰 데이터 폭발의 시대에서 기업은 큰 데이터 비즈니스의 개발을 통해 그들의 자신의 비즈니스 의사 결정을 위한 기초를 제공할 수 있습니다 하지만 또한 함께 데이터 보안 테스트 즉, 자신의 것을 보장 하는 방법 그리고 사용자 데이터 보안 개인 정보 보호, 대용량 데이터의 기본 문제 되고있다.
Tencent 회사 클라우드 플랫폼 부문 제너럴 매니저 첸 Lei 했다, Tencent 일단 90 전기 딜러 웹사이트의 분석을 검색 하는 보안 및 마이크로 신용 공공 계정 사용자가 신용 카드 또는 은행 카드, 지불 하 고 그들의 60 개 이상의 사용자의 id를 훔치는 등 20 개 이상의 문제를 포함 하 여 더 많거나 적은 보안 문제 있다고 발견 하도록 소비자와 소비의 다른 행위에 악성.
"그래서, 오늘은 호텔 직원이 신용 카드를 내 달라고 하는 경우 나는 호텔에서 체재 했다 때 나는 매우 걱정 우리가 오늘 직면 하는 인터넷 제품에 너무 많은 보안 문제가 있기 때문 에" 첸 Lei 말했다. "
"대용량 데이터 서비스의 좋은 일을 할 우리가 먼저 해야 정보 보안의 문제를 해결 합니다." 특히 Tencent, 첫 도전 보안 도전이입니다. "첸 Lei 말했다.
Shenyacheng에 따르면 Tencent QQ 사용자는 데이터의 많은 매일 매일 15.5 십억 사용자에 의해 생성 되는 QQ 메시지 등을 생산, Tencent 매일이 데이터를 다루는 것입니다 새 저장소 200 t.
그래서, 대규모 데이터 정보, Tencent은 이다 데이터 "보안" 역할을 가정 하는 방법?
첸 Lei에 따르면 Tencent 강한 보호, 보안 문제를 해결 하는 사용자를 위해 방화벽의 외부 응용 프로그램을 포함 하 여 사용자 서버를 강화 하기 위해 기술 수단을 통해 또한 후자에 운영자의 네트워크에서 보안 보호 조치의 완전 한 세트가 있다.
그러나, 사용자 데이터는 한편으로, 다른 한편으로, 같은 QQ, 마이크로-문자 채팅 도구, 매일 생산 Tencent는 그것을 것입니다 사용자 개인 정보 보호에 관련 된 많은 정보 또한에 포함 됩니다 큰 데이터 개발의 범위를 침해가지고 사용자 개인 정보를 공개 하지 않습니다?
첸 Lei는 주말에 인터뷰와 법규, 말했다: "Tencent 채팅 기록을 사용 하지 것입니다, 마이크로-구름에 저장 된 콘텐츠를 사용 하지 것입니다만 분석 하 사용자의 콘텐츠를 공유 하는 것입니다." "
"하지만이 콘텐츠 공유도 것입니다 등급, 개인 서클에 사용자가 정보를 공유 하는 등, Tencent 사용자 자신에 게 다시 추적 하지 것입니다, 그리고 중요 한 정보 섹션을 제거 하 고 사용 하 여." 첸 Lei는 강조 했다입니다.