마이크로 보 마케팅을 구현 하는 기술 수단에 의존 하기로 마이크로-블로그 자신의 운영 메커니즘, 데이터 마이닝은 피할 수 없는 선택 무시 하지 않을 수 있습니다. Weibo는 사람들이 스스로 뿐만 아니라 대부분의 마케팅 가치 (인간의 마케팅 기술에 전적으로 의존 하지 않을 수 있습니다, 대 한 사람 사이 대화는 가장 중요 한), 빠르게 변화 하는 데이터의 큰 수입니다. 사람들을 미리 모른다,에서 함축 하는 퍼지, 임의의 데이터 추출 보 불완전, 시끄러운, 많은 수에서 요구를 마케팅에 대 한 다른 마케팅 플랫폼와 비교 하지만 잠재적으로 유용한 정보, 그리고 심지어 Weibo 사용자의 심리적 특성.
마이크로 보 데이터 마이닝 효과적으로 수집, 처리, 마이크로-넓은 용량 정보를 표시 할 수 있을 것입니다. 물론, 사용자 ID, 이름, 성, 시, 등록 시간, 마이크로 블로그 출시 시간을를 포함 하 여 성별, 인증 사용자, 친구, 팬 들, 게시 된 마이크로 블로그 수 수 여부 출판 마이크로 블로그 등. 그러나 이들은 모든 수단으로, 어쩌면 Weibo의 대규모 정보 콘텐츠, 모두의 microblogging 플랫폼에 의해 개발 된 사용자 인터페이스를 통해 쉽게 액세스할 수의 값이 가장 낮은 부분. 하지만 Weibo에 데이터 마이닝의 기본적인 목적은 하지 데이터를 얻기 위해 이러한 분명 한 경직 된, 하지만 기업의 마케팅에 유용한 링크를 찾을 데이터를 수정 하.
첫 번째는 데이터 필터링, 마이크로 블로그는 엄청난 양의 콘텐츠를 기업의 콘텐츠 필터를 관련이 있을 수 있습니다 경우에 여전히 수 있습니다 거 대 한 양의 데이터를 소화 하기 어려운 사업. 같은 시간, microblogging과 짧은의 내용 때문에 하지만 또한 기호 및 분사에 대 한 문제는 네트워크 언어의 많은 수를 연결 된. 그것은 대량 microblogging 콘텐츠에서 기업에 대 한 필터 정보를 충분히 정확 하 게 어렵다입니다. 차례로 설정 세분화 기업 자체에 관련 된 특정 사용자 심사에 의해 보충 하는 마이크로 블로그, 콘텐츠를 찾을 수, 추적 하 고 콘텐츠, 관련 기업 예외에 관하여 마이크로 블로그를 찾을 수 쉽습니다. 기업 자체에서 시작, 일치 하는 콘텐츠 및 사용자의 방법에 대 한 마이크로 보 검색을 효과적으로 해결할 수 대규모 콘텐츠 소화 하기 어려운 문제.
둘째, 마이크로 블로그의 콘텐츠가입니다 너무 nishajuxia, 편리한 릴리스, 인터랙티브 방식 주요 문제를가지고 품질 정보, 정보 진위 식별 하기가 어렵습니다. Microblogging 사용자가 정보를 게시 하는 간단, 전송 되는 정보는 자신의 의도 아니다. Weibo의 사회적 관계를 사용자가 수 동적 그룹의 일부가 될 하려면 전파 되는 특정 메시지를 해제 하는 사용자와 쉽습니다. 많은 microblogging 사용자 앞으로 콘텐츠는 동의 하지 않을 또는 대하여, 또는 참조로 전달 하려면, 그냥 회원, 또는 게시자, 인정을 표현 하 려의 중심에서 조차. 이 경우 정보 및 사용자가 실제로 잘라만 역사를 추적 기록 데이터 사용자의 true 것입니다,이 판단을 통과 원래 마이크로 확장 더 인지 확인할 수 있습니다.
또한, 소셜 네트워크, 마이크로-블로깅의 개발 microblogging 플랫폼에 정보의 형태로 점점 더 일관성이 될 것 이며 텍스트의 대부분은 방법에서 제시, 지금 있을 것입니다 많은 수의 일반 사용자 특정 응용 프로그램에 우회 될 것 이다. 기본 및 데이터 인터페이스의 응용 프로그램은 대부분 동일 하지만 각 응용 프로그램이 자체 프레 젠 테이 션 및 정보, 사용자는 방법의 흐름은 일관 된, 통합된 처리를 달성 하기 어렵다. 자체 데이터 마이닝 알고리즘의 개선 뿐만 아니라 그것은 데이터 수집에서 더 많은 이점을 얻을 수 있는 microblogging 플랫폼의 하단에 더 밀접 하 게 묶여있다.