원래 소셜 미디어 데이터에 포함 된 이러한 개인 수준의 동작 고객의 환경 설정을 나타내는, 구매 기록, 중요 한 생활상, 기분, 성격, 및 소셜 미디어 데이터 마트에 저장 될 수 있는 텍스트 마이닝을 통해 가져온 다른 특성.
우리가 오늘 알고 소셜 네트워킹 개척자 때 게시판은 플랫폼을 공유 하는 첫 번째 대화형 메시지 중 1960 년대 후반에 왔다. 나중 (1990 년대에, 크레이그 리스트 및 AOL 스포트 라이트를 입력 하는 때), 사회 혁명 급속 한 성장 위한 기초 이었다. 소셜 네트워킹에서에서 벗고 21 세기 먼저 프렌드, 링크 드 인, 마이 스페이스, 플리커, Vimeo, 유튜브, 그리고 페이스 북과 2006에서 태어난 트위터 뿐 아니라 최근 2004 출시 Google +와 Pinterest.
디지털 동향, 함께 소셜 미디어의 광범위 한 채택과 브랜드, 이동 하는 특성으로 환경에 대 한 모바일 디지털 전략 개발에 직접적인 영향을 했다. 소셜 커뮤니케이션은 효과적으로 브랜드와 고객 사이의 관계를 연장. 전자 상거래 및 소셜 미디어의 도래 하기 전에 고객 일반적으로 제품을 연구 한 다음 명확한 구매 및 구매에 대 한 필요가 있을 때까지 구매자와 판매자 끝 사이의 관계. 구두의 고객의 실제 소셜 네트워크로 제한 됩니다. 이제, 고객의 의견 소셜 네트워크를 통해 확대 하 고 전체 소비자 지역 사회에 도달 수 있습니다.
브랜드 마케터는 오늘날의 소비자는 적극적으로 정보 수집 구입 하기 전에, 칭찬과 나쁜 리뷰, 그리고 모바일 장치에서 여러 클릭 할 수 있는 더 빠른 가격 비교를 찾고 알아. 그들은 또한 알고 소비자는 이제 소셜 네트워크에서 다른 사람들의 반응에 응답성 소재 인센티브 및 강력한 브랜드 영향으로 보람 있는 개인을 겨냥 하는 영향 충성도 프로그램의 새로운 종류의 개발을 주도하 고 있다. 소비자는 브랜드의 보호자는 브랜드 개성 및 브랜드 아이덴티티를 조정 하지 그래서 브랜드의 생존에 중요 한 되고있다.
그래서 어떻게 브랜드 기업 디지털 인터랙티브 정보 수집 관리 기술 사회 소비자와 캐치 책임이 있다. 소셜 네트워크 제공 사이트 트래픽 및 데이터 통계 도구 (예: 페이 스 북, 유튜브 인 사이트, 통찰력과 소셜 미디어 관리 키트, HootSuite 등), 영향 뿐만 아니라 측정 포털 Klout, 등 포털 통계를 추적 하는 참여 브랜드에 대 한 제 3-파티 옵션을 제공 합니다. 많은 상업적인 사회 듣기 도구, Radian6, SM2, Viralheat 등 Sysomos, 보고서, 텍스트 분석, 관리, 감정 분석, 방문자 정보, 및 참여 워크플로 제공합니다. 이 도구는 범위와 유용성에서 증가 하 고 있다 하지만 이러한 도구의 여러 측면 개발의 초기 단계에 아직도 있다. 감정 분석, 예를 들어 정확성, 부족와 소셜 데이터의 가격 Twitter 같은 서비스 firehose 및 회사 Gnip 좋아하고 DataSift는 아직도 비싼 데이터 가용성의 점에서 제한. 그 결과, 어떤 사람들 강하게 커널 텍스트 마이닝 기능으로 이러한 비즈니스 도구 확장과 독자적인 소셜 미디어 데이터 마트 작성을 요구 한다. 소셜 미디어 데이터 마트는 소셜 미디어 상호 작용에서 소비자 수준 정보 및 위치, 장비, 모바일, 모바일 결제, 플랫폼, 행동과 코멘트 데이터와 관련 된 속도 등 모든 관련 디지털 정보를 저장 합니다.
텍스트 마이닝 및 시맨틱 방법
소비자 데이터를 생성 하는 소셜 미디어는 어떻게 브랜드 변환할 수 트위터, 페이 스 북, 블로그 및 포럼에서 이러한 원시 소셜 미디어 의견 운영 정보 데이터 작업에 대 한 기준으로 사용 될 수 있는? 대답은 구조화 되지 않은 데이터의 새로운 소스를 텍스트 마이닝 및 시맨틱 기술 적용.
텍스트 마이닝 다른 텍스트 원본에서 정보를 추출 하는 데 사용 하는 기법을 말합니다. 그것은 왜 그렇게 중요 한가? 그것은 일반적으로 모든 비즈니스 관련 정보, 정보의 80%는 구조화 및 반 구조화 된 텍스트 데이터 추정. 즉, 모든 비즈니스 정보를 포함 하 고 소비자 행동 데이터 텍스트 분석 정보의이 80%에 의해 표현 되는 데이터의 큰 금액을 적용 하지 않으면 경우에 낭비 될 것 이다. 텍스트 마이닝은 종종 텍스트 분석 이라고 하는 용어는, 스팸 필터링 등 실용적인 의미의 많은 의견 및 e-상거래 사이트, 소셜 듣기, 블로그와 코멘트 사이트, 향상 된 고객 서비스와 전자 메일 지원, 자동화 된 비즈니스 문서 처리, 전자 디스커버리 법률 분야에서 의견 마이닝에 대 한 제안에서 정보를 추출 소비자 선호를 측정, 분석 및 사기 탐지, 사이버 범죄 및 국가 보안 응용 프로그램을 주장.
텍스트 마이닝은 데이터 마이닝 데이터 내에 흥미로운 패턴을 식별 하기 때문에. 비록 수동 (그리고 매우 노동 집약적인) 텍스트 마이닝 1980 년대에 나타났다. 최근 몇 년 동안, 텍스트 마이닝 분야 정의 검색 엔진 결과 알고리즘 및 필터링 데이터 소스에 의해 발견 알 수 없는 정보에 대 한 매우 중요 하다. 기계 학습, 데이터 통계, 전산 언어학, 데이터 마이닝 등 기술이이 과정에서 중요 한 역할을 한다. 예를 들어 텍스트의 지식 검색 목표 자연 언어 처리 (NLP)를 사용 하 여 텍스트, 콘텐츠 및 암시적된 컨텍스트에서 기본 의미 론 적 관계를 감지 하는입니다. 이 프로세스는 NLP를 사용 하 여 복제 하 고 다음 언어 차이, 패턴 인식, 그리고 이해 읽기 및 텍스트로 작업 하는 경우 동일한 유형의 측정 설계 되었습니다.
텍스트 마이닝의 분야에서 다양 한 방법이 있다. 다음의 텍스트 마이닝에 관련 된 일반적이 고 후속 단계 목록입니다.
텍스트 마이닝의 첫 번째 단계를 분석 하 고 정보를 검색 하 여 또는 텍스트 파일의 설정 및 관심의 콘텐츠를 포함 하는 문법 라이브러리를 선택 하 여이 자료를 수집 하 고 싶은 텍스트 기반 소스를 식별 하는 것입니다. 확장된 NLP의 배포와 문법 (어휘 텍스트)를 구문 분석 하 고 명명 된 엔티티 인식 (즉,에 대 한 참조는 브랜드, 사람들의 이름, 장소, 일반적인 약어 및 등의 식별)를 적용 하려면 텍스트 "부분 부분 이름 태그" 호출할 수 있습니다. 반복의 필터 중지 단계 원하는 주제 콘텐츠를 통해 생생한 장애인된 단어의 삭제를 포함 한다. 전자 메일 주소와 전화 번호를 인식 하는 패턴 식별 된 엔터티 및 coreference이 텍스트, 관계, 다음에 관련된 개체를 인식 하는 명사구 사실과 이벤트 추출. 일반적으로 생성 N-그램, 기간으로 연속 단어의 시리즈를 만듭니다. 마지막으로, 의미 론 적 분석을 수행, 소셜 미디어 및 분류 도구 지금 널리 이용 된다 개체 또는 주제에 대 한 태도 정보를 추출 하려면이 방법으로. 여러 번 다양 한 매핑 및 렌더링 기능 또한 더욱 정확한 확인에 대 한 시각화를 제공합니다.
텍스트 마이닝 도구
텍스트 마이닝 소프트웨어 및 응용 프로그램 옵션이 많은 상용과 오픈 소스. IBM는 다양 한 강력한 텍스트 마이닝 솔루션을 제공합니다. Ibm과 강력한 체계® infosphere® biginsights™ 텍스트 분석 추출 Infosphere biginsights 클러스터에서 실행할 수 있는 추가 텍스트 분석 모듈을 제공 하는 큰 데이터 기능. IBM spss® 프로그램은 다양 한 크기 및 범위. 항목에 할당 하는 문서에 대 한 검색에 매우 효과적인 도구는 IBM SPSS Modeler, 일반적인 텍스트 문서 분류 및 분석을 수행 하는 그래픽 인터페이스를 제공 합니다. 설문 조사에 대 한 또 다른 제품 IBM SPSS 분석 텍스트는 문서 내에서 오픈 조사 문제를 분석 하는 데 유용 NLP, 사용 합니다. IBM SPSS Modeler 프리미엄과 SPSS 설문 조사에 대 한 텍스트 분석 같은 엔진에서 실행 되지만 더 포괄적인 워크 벤치 문서 (PDF, 웹 페이지, 블로그 데이터와 구조화 되지 않은 데이터 통합을 용이 하 게 처리 하기 위해 확장 가능한 이메일, 트위터 피드, 등.). 페이스 북에 대 한 관련 된 사용자 지정 코드 노드 확장 직접 데이터를 읽고 페이스 북 벽에서 SPSS 모델러 내 트위터 피드 통합 SPSS 모델러 프리미엄의 기능을 여러 미디어 채널의 전망입니다.
RapidMiner와 R 오픈 소스 텍스트 마이닝에 가장 인기 있는 도구입니다. R는 더 큰 사용자 베이스, 소스 코드를 요구 하는 프로그래밍 언어, 많은 알고리즘 중에서 선택할 수 있다. 하지만 확장성은 항상 r에 대 한 문제 이므로, 큰 데이터 집합에 대 한 R 하지 이상적인 선택 없음 해결 하는 경우. RapidMiner 사용자 기반은 작은, 하지만 그것은 소스 코드를 추구 하지 않는 하 고 강력한 사용자 인터페이스 (UI)를 있다. 그리고 그것은 확장성, 클러스터 및 데이터베이스 프로그래밍 처리 가능. IBM 제공 JAQL R 모듈을 통합 하는 연구 프로젝트는 쿼리 내에서 MapReduce 작업이 동시에 R 계산을 실행 합니다.