그것은 우리가 큰 데이터 기술을 통해 기업 운영 효율의 향상을 실현 하는 중요 한 목표 이지만이 작품은 모든 기업에 대 한 쉽지 않다. 1 월 21 일, "1 십억 TalkingData 모바일 인터넷 산업 인덱스 데이터 보고서", 다양 한 업계 전문가 및 고위 talkingdata 기존 하는 값을 큰 데이터의 자료를 공유 하는 우리에 대 한 구 덩이, 그리고 우리가 어떻게 해결할 수 있습니다.
소위 1 십억 TalkingData 플랫폼 이제 iOS, 안 드 로이드의 시스템 플랫폼, 스마트폰, 태블릿, 스마트 Tv 등 다른 장치 형태로 등을 포함 한 모바일 스마트 디바이스의 1.06 십억을 커버 했다.
전문가 들은 실제 분석은 아직 초기 단계,
국가 모바일 미디어 위원회, 중국 모바일 모바일 인터넷 산업 동맹 사무총장 우 Hongxiao, 엔지니어링, 중국 모바일 인터넷 개발 지 전문가 그룹 최고 니켈 Guangnan의 중국어 아카데미의 학회 회원 그리고 대용량 데이터에 대 한 그들의 견해를 공유 하는 기자 회견에서의 뉴 미디어 연구소의 북경 대학 류 드 딘 이 종이 다른 각도에서 큰 데이터 응용 프로그램의 많은 과제를 지적 한다.
우 Hongxiao:
현재, 단일 데이터베이스의 많은 이미 매우 큰, 여러 능가 했다 PB 규모, 하지만 데이터의 규모는 큰 동시에 처리 어려움은 또한 더 큰. 2 개의 도전이 있다:
데이터의 소스 문제입니다. 데이터 컬렉션의 영역에서 그것은 quweicunzhen 및 대비 역사적 데이터를 시간과 공간의 네트워크 및 데이터 원본 조직에 대 한 정보를 표시 하 여 데이터의 신뢰성을 확인 하는 데 필요한. 더 중요 한 것은, 충분 한 하나의 데이터 값의 데이터 풀을 형성 하기 어렵다. 효과적인 데이터 마이닝 도구 문제입니다. 많이 한 매개 변수를 포함 하는 데이터 처리, 그 복잡 데이터 샘플 자체에 국한 되지 않습니다 하지만 또한 그것의 원본, 엔터티 및 공간 사이 상호 작용의 다양성, 이들은 전통적인 통계적 방법 또는 마이닝 방법을 설명 하 고 독서를 사용 하기 어려운. 마지막으로, 우리의 시각적 렌더링, 더 직관적인 결과의 결과를 데이터 마이닝 데이터 처리의 값은 더 사용 하기 편리.
Ni Guangnan:
그냥 상호 산업, 운영 체제, 모델, 브랜드 연산자, 응용 프로그램 및 다른 6 측면에 데이터를 제공 하기 시작 나중에 실시간으로 결합 하 여 지리적 위치를 추가할 수 있습니다. 1 십억 사람들의 행동의 실시간 모니터링 될 수 있다, 잠재력은 매우 큰, 하지만 또한 매우 복잡 한 문제, 정보 보안, 개인 정보, 규제 개선 등을. 데이터 정보, 공유, 공유 하지만 상업적 이익이 많은 단위에 대 한 상호 연결을 달성 하기 위해 데이터, 그래야 우리가 더 국익, 알아서 보호 뿐만 아니라 단위의 관심사를 뿐만 아니라 정보를 공유 하고자 하는 관련 부서와 협조 하는 필요를 취할 용의가 되지 않습니다. 또한 데이터 및 분석 툴의 품질을 향상 시킬 필요가 있다. 예를 들어 데이터의 관련성을 발견 하는 법 많은 새 값을 만들 수 있습니다.
리 우 데:
전체 중국 클라우드 큰 문제가 많습니다 컴퓨팅 및 빅 데이터 개발 프로세스:
더 많은 데이터를 게시 하 고 데이터가 있기 때문에 너무 많은 홍보, 더 적은 사용 하 여 데이터의 섬입니다. 클라우드 인프라의 중복 건설입니다. 샤 리, 마찬가지로 전체 클라우드 스토리지 플랫폼만 유용 하 고 가치 있는 광산 수집한 것 들 때문에 국가 전략에 재설계 해야 합니다. 데이터 분석 기능입니다. 이제 데이터 마이닝은 ERP, CRM 및 다른 데이터 표시와 유사 하지만 실제 분석은 매우 약한, (예: 도메인 이름 확인, 등을 포함 하 여 사이트에 대 한 메서드는 또한 결함의 많은 얼굴 이제) 초기 상태에 있어야 합니다. 그리고 우리는 이제 세계 선진국 수준에 비해, 격차 확대, 축소 하지.
TalkingData 말했다: 대용량 데이터 분석 2014 모바일 인터넷
오랜 시간에 대 한 분산된 컴퓨팅 아키텍처, 대규모 데이터 처리 및 마이닝 알고리즘 데이터 청사진으로 1 십억 지능형 단말기의 TalkingData 통계 분석 플랫폼을 사용 하 여 여러 차원에서 모바일 인터넷 사용자의 데이터를 분석 하는 데 사용 됩니다. 전체 산업 관찰의 결과 제공 합니다.
Taotingchi, TalkingData 데이터 플랫폼의 감독 기자 회견에서 2014 TalkingData 모바일 인터넷 데이터 보고서에 자세히 설명합니다. 보고서는 "모바일 인터넷 산업 프로필", 돌아가지 "모바일 인터넷 사용자의 행동", "모바일 응용 프로그램 전체 재고", "모바일 인터넷 사용자가 오프 라인 소비 습관" 그리고 다른 주제, 2014 년 중국 모바일 산업의 다차원 분석 전체 개발 상황. (당신이이 보고서에 관심이 있다면, 다운로드할 수 있습니다 무료로 TalkingData 공식 웹사이트를 방문 하 여)
보고서에는 표시는 모바일 인터넷 통신에 초점을 맞춘 수요의 "미 발달 기간" 및 소셜 네트워킹과 쇼핑 및 엔터테인먼트, "고속 개발 기간"으로이 기간 나타내는 "초기 개발 기간" 여행, 의료, 교육, 음식과 밀접 하 게 하위의 응용 프로그램에 관련 된 생활의 다른 영역 나왔다, 생활 서비스를 큰 편의가지고 사용자를 위한 다양 한 온라인 및 오프 라인 연계 (O2O) 추세에. 일반적인 응용 프로그램 뿐만 아니라 하자는 O2O 업계의 지속적인 출현 사용자 성장과 자본 시장 회계의 두 배 급증에 도입, 소비자 폐쇄 루프의 모바일 끝은 점차적으로 형성.
데이터 이야기 대화: 기술, 데이터 소스 및 중립성은 키
TalkingData 제품 Shanhui, TalkingData 중 고 판매 디렉터 데미안 및 TalkingData 데이터 플랫폼 부서 디렉터 Taotingchi의 부사장 CSDN 기자와 인터뷰를 받은 기자 회견, TalkingData COO Xu 이순신, 후 더 깊이 있는 분석 TalkingData의 큰 데이터 연습의 전술 전문가 해결 하는 방법을 언급 한 문제, 뿐만 아니라 기업과 개발자가 무엇을가지고 위한 talkingdata 기술.
대용량 데이터에 대 한 가장 중요 한 것은 전체 기업 운영 서비스에 대 한 분석 결과 사용 하는 TalkingData 그러나, 단일 엔터프라이즈의 데이터는 전체 산업의 역동성을 반영 하기 위해 충분 하지 않습니다 그리고 우리 업계의 데이터의 분석을 기반으로 전체 이것은 쇤베르크는 "하지 임의 데이터를 하지만 모든 데이터" 아이디어와 일치 하는 최선의 결정을 해야. 모든 데이터는 신뢰할 수 있는, TalkingData는 또한에 중립적인 제 3 자 플랫폼 데이터 분석 결과의 참조 값을 제시는 강조 했다. 물론, 전체 산업 데이터, 그것의 기초의 중립 분석을 달성 하거나 신뢰할 수 있는 큰 데이터 기술 플랫폼, 데이터 수집 및 전체 산업의 다양성을 수용할 수 있는, 실시간 분석 및 효율성을 보장 하기 위해 뿐만 아니라 데이터 상호의 통일된 된 인터페이스.
Q: 어떻게 중국 큰 데이터 응용 프로그램을 이해 하는 초기 단계에 아직도?
A: 많은 기업 그들은 하지 않기 때문에 이러한 분석 능력 일반적인 판매 최적화 서비스 최적화, 저장 된 데이터를 사용 하 여 의미를 있지 않습니다. 큰 데이터를 사용 하 여 핵심 사업으로 큰 데이터 드라이버를 설정 하는 방법입니다. 이 관점에서 인터넷 업계에도 전통 산업에서 큰 데이터 기반 비즈니스가이 일은 초기 단계에 아직도.
예를 들어 많은 게임은 의사 결정을 담당 하는 특정 사용자에 의해 운영 보다는 큰 데이터를 사용 하 여 작업을 매끄럽게 하는 것 같은 효과적으로 예측 하 고 사용자가 손실 될 수 있습니다을 저장 하 고 게임 매출 유지 있도록 몇 가지 규칙을 찾을 수 수집. 데이터의 양은 반드시 큰 있지만 손실 뒤에 모델 우리 계산 모델, 모델, 게임에 반환 하는 데 사용 하는 많은 게임에서 다른 게임을 포함 하 여 그의 자신의 게임을 포함 한 게임의 수에 따라 작업을 안내 하는 게임.
이 방법으로 TalkingData, 첫 번째 몇 가지 산업 표준 일을 할 것입니다, 그것은을 통해 얻을 모든 데이터를 분리 하기가 또는 먼저 그 수 있도록 설정할 첫 번째 파티 데이터를 그 사용자의 초상화를 데이터를 관리할 수 있도록 엔터프라이즈에 대 한 DMP 데이터 관리 플랫폼에 요약. 둘째, 그의 데이터 수 있습니다. 이용할 수 제 3 자 데이터, 그리고 그 많은 제 3 자 데이터를 사용할 수 있습니다.
그래서, 큰 데이터 응용 프로그램의 범위 보다 더 고급이, 보다 더 많은 지금, 그것을 취급 하는 방법 많은 데이터를가지고 우리의 원래 이해 일부 데이터 응용 프로그램의 경계를 넘어 다른 분야에서 생산할 예정 이다 더 간단한 수 있습니다.
Q: talkingdata 기술에의 고유 기술 이란 무엇입니까?
A: 데이터 분석, 마이닝 관점에서에서 우리를 저장 하려면 인덱스 차원에 따라 OLAP 모델을 사용 하는 다음 반복 절단, 슬라이스, 추출,이 기술 모델은 기본적으로 모두 비슷합니다. 우리는 또한 하 둡, 하이브, 폭풍, 불꽃 등 오픈 소스 기술을 채택 했습니다. 하지만 우리는 큰 데이터 산업에 있는 조금 기술 기여, 왜냐하면 우리는 우리 자신의 컴퓨팅 엔진 및 권장된 알고리즘, 그리고 일부 마이닝 알고리즘으로 우리의 저장소 모델 몇 가지 오픈 소스 시스템, 우리는 시스템 코드, 이러한 시스템은 종종 교류 하 고 배울 시스템의 기술적인 프레임 워크를 할 수 시장. 예를 들어 시스템 오픈 소스 기린 시스템, 대용량 데이터 작업이 있다. 우리는 우리가 선두, 하지만 우리는 항상이 부분에 우리의 지식을 공유 하고자 말할 수 없다.
Q: 어떤 편의 우리 비즈니스 개발자에 게 제공할 수 있습니까?
A: 모든 사업 두 가지 문제를 해결 하는 것입니다: 어떻게 손님, 그리고 그들을 작동 하는 방법. 이에 따라, 우리 기업 고객을 찾을 수 있도록 넓은 산업 데이터 플랫폼을 사용 합니다. 두 번째 측면, 우리는 폐쇄 루프 제품, 고객, 더 나은 혜택을 얻기 위해 작동 하도록 고객 특성에 따라 지원 기업 운영을 분석에 기반 하는 큰 데이터 집합을 제공 합니다. 이 주로 포함 됩니다.
모든 작업 보고서를 제공 합니다. 회사는 최고의 파트너 및 잠재 고객을 찾을 수 있도록 업계에서 사용자의 초상화. 직접 운영 도구를 잠재 고객을 분리 하 고 제공 하는 기업 대상으로 더 나은 변화를 달성 하기 위해 운영 전략 권장 사항을 제공 합니다.
Q: 많은 큰 데이터 플랫폼 사용자 초상화 기술 제공?
A: 전통적으로 사용자 초상화 사용자의 성별, 나이, 지방 사기의 혐의, 참조가 중요 하지 않습니다. 우리의 사용자 초상화는 실제 실행에 더 관심이 고, 사용 하고자 하는 우리는 애플 리 케이 션, 모바일 제품에 대 한 우리는 사용자의 관심은 우리의 위치와 더 많은 피팅 분석할 수 있습니다. 방문 하고자 하는 쇼핑몰 및 상품 그들은 알고 어떤 도시에 살고 있는 그들은 아주 좋은 생각이 아니다.
Q: 로컬로 배포 된 솔루션을 제공 하거나 수집 하 고 순수한 SaaS 플랫폼 및 피드백 결과 데이터를 분석?
A: 우리는 두 가지 유형의 고객, 중국 가맹점 은행, 등 대형 고객, 개인 정보 보호 요구 사항은 상대적으로 높은, 그것은 은행에 전체 차원 첫 번째 파티 DMP 플랫폼을 배포 하는 데 필요한, 모든 데이터에 입력 수, 공공 비 상업적 데이터, 고객의 두 번째 범주에 대 한 보고서를 공식 홈페이지에서 직접 수 데이터는 우리의 플랫폼에 직접 업로드할 수 있습니다.
받아 중국 상인 은행 (포켓 삶과 모바일 뱅킹) 예를 들어:
우리의 첫 번째 단계는 그들을 돕기 위해 데이터 수집, 깨끗 한 이동에 대 한 인프라 구축, 저장 하 고, 그들은 초기에 작동 하는 기본 데이터를 분석할 수 있도록. 이러한 기본 데이터와 함께 그들은 없 었 그들은 통찰력을 생성할 수 있습니다 전에, 그들의 제품을 최적화 하도록 안내 하 고 오른쪽 채널을 찾을 수 있도록 도움. 두 번째 단계는 데이터 관리 플랫폼을 구축 그들을 돕는 것입니다. 데이터 관리 플랫폼의 정의 고객 시스템 및 서비스를 다양 한 채널에서 데이터를 통합 하 고 큰 데이터 및 마케팅의 맥락에서 그들을 지 원하는 것입니다. 이 시스템으로 고객 이러한 뷰 중 일부는 사용자의 전체 보기 그룹화 할 수 있습니다, 그의 마케팅 시스템으로, 그의 마이크로-메일, SMS 콜 센터, 전달 시스템, 결합 하는 생산에 그들의 자신의 멀티 채널 타사 데이터 기반으로 할 수 및 다음 우리 수 있습니다 그 마케팅 효과 모니터링 에 그의 전반적인 마케팅의 ROI를 향상 시키기 위해 큰 데이터 마케팅의 닫힌된 루프를 형성 한다. 세 번째 단계는 그 첫 번째 DMP와 우리의 제 3 자 데이터를 통해 얻을 수 있도록. TalkingData는 제 3 자 데이터의 우리 자신의 축적에 따라 큰 타사 데이터 센터, 외부 은행의 첫 번째 파티 데이터 사용자, 일반적인 온라인 행동 데이터, 오프 라인 동작 데이터를이 데이터와 함께 많은 사용자가 더 많은 고객 서비스를 더 깊이 있는 통찰력 고객을 도울 수 있다.
Q: 데이터 어느 정도 신뢰를 할 수 있습니다, 그리고 일부는 믿을 수, 최종 프레 젠 테이 션의 결과 오류가 있을 것입니다?
A: 먼저 산업 관점에서 또는 운영 분석의 관점에서 일부 대기업 같은 플랫폼을 시작 했습니다, 그리고 그것은 또한 개발자가 시장을 분석 하는 단방향에서 운영 분석 및 운영 도구를 할 수 있도록, 데이터는 모두 그의 비즈니스 분석을 할 기업 팀의 모바일 쪽에 있도록 이러한 데이터의 접근은 확실히 특히 큰 아니다. 하지만 업계의 관점에서 그것을 보고 하지 않을 수 있습니다 같은. 예를 들어, 보고서를 보내도록 바이 그것 중립 시장 데이터 수집에서 뿐만 아니라 그것을 결합 하 여, 더 바이 두의 검색에서 바이 두의 지도 다양 한 데이터, 크롤링 중립적인 데이터의 사용 그것의 작은 조각을 수만 있습니다. 산업 데이터 보고서로 그것은 일부 바이에 강조가 더 있을 것입니다, 그것은, 그렇게 생각 하지 않을 수 있습니다 하지만 자체의 샘플 편견. 마찬가지로, Tencent는 동일, 그들은 TOP50 응용 프로그램에서 큰 점유율을 차지, 그 느꼈다 그의 사용자 정도로 대중화 되어 있다, 그가 만든 보고서를 그 중립, 고려는 결과 자체는 또한 비교적 편견 그의 사용자 기반, 특정 편차 있을 것입니다. 예를 들어 고객, 하지만 또한 통계 분석에 대 한 우리의 제품의, 단지 그의 개인 사업, 또한 사용 분석 바이, 또한 사용된 Tencent, 데이터의 양이 물론 다른 것, 우리가 있기 때문에 같은 생명입니다.
Q: 어떻게 데이터 소스의 문제를 해결 우리?
A: TalkingData는 업계의 유일한 중립 대용량 데이터 플랫폼, 우리 플러그인 SDK이이 서비스를 제공, 그래서 우리는 더 정확 하 게 손으로 데이터를 직접 수집 하 고 얻을. 컬렉션에서 우리는 사람들에 대 한 관심 것입니다, 이것은 첫 번째 측면 일부 데이터를 얻을 경우의 개인 정보 보호 정책에서 뿐만 아니라 개발자 및 최종 사용자, 그래서 우리가 더 나은 사용자 사용권 계약을 협상 것의 감정에 대해 매우 걱정. 또한, 일부 데이터 교환 및 협력 더 다양 한 데이터를 얻을 수 있는 방법에서 사용 합니다. 이 데이터는 어떤 파트너의 이익을 침해 하지 않고, 법률 준수에 대 한 필요와 동일, 같은 데이터를 얻을에 갈 수 있습니다. 데이터의 또 다른 측면, 우리 천-Fi 지점 저장소 정보를 포함 하 여 온라인 레이아웃을 많이 할 것, 라인에서 데이터를 수집, 이러한 데이터와 온라인 데이터를 통해 얻을 하 고 일치의 많은 수 있습니다. 간단히 말해서, 그것은 보다 포괄적이 고 심각한 게 업계 전반의 데이터 네트워크를 형성할 것 이다.
Q: 데이터 개인 정보 보호 문제를 회피 하는 방법?
답변: 데이터 개인 정보 보호 진정 하 고, 데이터 수집 및 사용 적법성의 문제에 관심을 지불 해야 합니다 데이터 서비스 회사를 위한 기초 이다:
는 명시적으로 데이터는 TalkingData를 어떤 기준에 모을 것 이다 사용자 계약에 수집가 게 하 고 사용자의 알 권리를 보장 하기 위해 개발자를 묻습니다. 데이터를 제 3 자와 상호 작용, 또한 적법성에 대 한 다른 사용자의 데이터 소스를 감사 해야 합니다. Talkingdata, 내에서 어떤 데이터를 수집, 데이터 처리 및 데이터의 내부 관리 프로세스를 매우 엄격한 관리가입니다. 사용자의 휴대 전화 번호, ID 번호, 등, 이러한 데이터는 넘을 수 없는 레드 라인 talkingdata TalkingData ISO2701에 의해 인증 되었습니다 그리고는 회사에 의해 저장 된 데이터는 잘 보호. 데이터 보고서의 처리. TalkingData 산업 데이터, 전반적으로, 남자와 여자의 비율 등을 제공 하지만 개인의 상세한 데이터를 참조 하지 않습니다.