使用SPSS文本挖掘工具構建市場行銷和品牌交互管道潛在回報

來源:互聯網
上載者:User
關鍵字 市場行銷 SPSS 品牌交互管道 文本挖掘工具

這些嵌入在原始社交媒介資料中的個人層面行為代表了顧客的偏好、購買歷史、重大的人生事件、心情、個性以及通過文本挖掘獲得的其他屬性,這些屬性可以存儲在社交媒體資料集市中。

我們今天熟知的這些社交網路的先驅是在二十世紀六十年代晚期出現的,當時公告牌是首批互動訊息共用平臺之一。 更晚些時候(二十世紀九十年代,當 craigslist 和 AOL 進入人們的視線時),社交革命才有了飛速發展的基礎。 社交網路的騰飛是在二十一世紀,先是 Friendster、LinkedIn、MySpace、Flickr、Vimeo、YouTube,之後是 2004 年推出的 Facebook 和 2006 年誕生的 Twitter,以及最近的 Google+ 和 Pinterest。

社交媒體的廣泛採用伴隨著數位趨勢,對品牌產生了直接影響,它們為有移動特徵的環境開發了流動數位戰略。 社交流有效地延長了品牌和顧客間的關係。 在電子商務和社交媒體出現之前,顧客一般是對產品進行研究,然後進行明確的購買,買賣方之間的關係即告結束,直至以後有購買的需要。 口碑僅限於顧客的實體社交網路。 現在,顧客的意見通過社交網路得到了放大,甚至有可能觸及整個消費者群體。

有品牌商家們知道如今的消費者都在積極收集購買前的資訊,從中查閱好評和差評,並更好地進行快速價格對比,這一切通過行動裝置上的幾次點擊即可完成。 他們還知道消費者現在對社交網路內其他人的回應更為敏感,而這催生了一種新型的影響者忠誠計畫的開發,該計畫旨在物質激勵和獎勵具有強大品牌影響力的個人。 消費者正在成為品牌的保衛者,以至於調整品牌個性和品牌身份對於品牌的生存從未如此重要。

那麼,有品牌的商家是如何管理數位交互資訊的彙集? 技術在加緊追趕社交消費者的腳步。 社交網路們已經提供了特定于網站的流量和資料統計工具(比如 Facebook Insights、YouTube Insights 和社交媒體管理套件,比如 HootSuite),還提供了影響者測量門戶,比如 Klout, 該門戶提供了用於品牌參與跟蹤指標的協力廠商選項。 而多種商業的社交偵聽工具,比如 Radian6、SM2、Viralheat 和 Sysomos,提供了報告、文本分析、管理、情感分析、訪客資訊和參與工作流程。 這些工具在範圍以及可用性上都有所提高,但是這些工具的許多方面仍然處於發展的早期階段。 比如,情感分析缺乏準確性,而通過像 Twitter firehose 這樣的服務以及像 Gnip 和 DataSift 這樣的合作公司提供的社交資料價格依然有些昂貴,且在資料可用性方面存在限制。 因此,一些人強烈要求擴充這些具有內核文本挖掘功能的商業工具,並建立一個專有社交媒體資料集市。 社交媒體資料集市可存儲從社交媒體交互中獲得的消費者級別的資訊以及所有有關的數位資訊,比如位置、設備、移動行為、移動支付、平臺和與評論資料相關的速度。

文本挖掘和語義方法

考慮到社交媒體會生成大量消費者資料,品牌如何能夠將這些來自 Twitter、Facebook、博客和及論壇的原始社交媒體評論資料轉變為可作為行動依據的業務情報資料? 答案是將文本挖掘和語義技術應用於這些非結構化資料的新來源。

文本挖掘 指的是用來從不同文字來源提取資訊的技術。 它為何如此重要呢? 據普遍估計,在所有與業務有關的資訊中,有 80% 的資訊是非結構化文本資料和半結構化文本資料。 換言之,如果不對這 80% 的資訊所代表的大量資料應用文本分析,所有嵌入的商務資訊和消費者行為資料都會被浪費。 術語文本挖掘 常常被稱為文本分析 具有很多的實際意義,比如垃圾過濾、從電子商務網站上的意見和建議中提取資訊、在博客和評論網站中進行社交收聽和意見挖掘、增強客戶服務和電子郵件支援、業務文檔的自動化處理、法律領域的電子發現、 衡量消費者的偏好、索賠分析和欺詐檢測,以及網路犯罪和國家安全應用程式。

文本挖掘類似于資料採礦,因為它也針對的識別出資料內的有趣模式。 雖然手動(而且是高度勞動密集)文本挖掘出現于二十世紀八十年代。 在近些年來,對於通過定義搜尋引擎結果演算法和篩選資料來源來發現未知資訊而言,文本挖掘領域十分重要。 諸如機器學習、資料統計、計算語言學和資料採礦這樣的技術均在這個過程中發揮了重要作用。 例如,文本的知識發現目標是使用自然語言處理 (NLP) 從文本、內容和暗示的上下文中檢測底層的語義關係。 這個過程旨在使用 NLP 進行複製,然後衡量相同類型的語言區別、模式識別以及閱讀和處理文本時的理解。

文本挖掘領域中有各種方法。 下面將介紹文本挖掘所涉及到的一系列常見步驟和後續步驟。

文本挖掘的第一個步驟是識別出想要分析的基於文本的源,並通過資訊檢索或選擇包含這組文字檔和感興趣內容的語法庫來收集這種材料。 擴展 NLP 的部署可以調用 「部分詞類標注」 和文本順序來解析語法(即語彙單元化 文本),並應用 Named Entity Recognition(即確認品牌、人的姓名、地點、常見縮略語等內容的提及)。 而反覆運算的 Filter Stopwords 步驟則涉及禁用詞的刪除,從而提煉出所需的主題內容。 Pattern Identified Entities 能識別電子郵件地址和電話號碼,Coreference 則能識別文本內的名詞短語以及相關物件,後跟 Relationship, Fact and Event Extraction。 通常會生成 N-Grams,它創建一系列連續單詞作為術語。 最後,執行語義分析,社交媒體偵聽和分類工具如今廣泛使用採用這種方式來提取對某個物件或主題的態度資訊。 很多時候,各種映射和繪製功能還提供了視覺化,以便進行進一步的準確驗證。

文本挖掘工具

文本挖掘軟體和應用程式有很多商業和開源選項。 IBM 提供了種類繁多且強健的文本挖掘解決方案。 利用了 IBM® InfoSphere® BigInsights™ 大資料功能的一種功能強大的方案提供了附加文本分析模組,能夠從 InfoSphere BigInsights 集群運行文本分析提取。 IBM SPSS® 方案規模和範圍都很廣泛。 對於搜索文檔並將它分配給一個主題非常有效的一個工具是 IBM SPSS Modeler,它能提供一個圖形介面來執行通常的文字文件分類和分析。 另一個產品 IBM SPSS Text Analytics for Surveys 則使用了 NLP,對於分析文檔內開放的調查問題非常有用。 IBM SPSS Modeler Premium 與 SPSS Text Analytics for Surveys 運行在同一個引擎上,但是可伸縮性更高,能處理一個有助於結構化和非結構化資料整合的綜合工作臺內文檔(PDF、Web 頁面、博客 、電子郵件、Twitter 提要等)的整個語料庫。 面向 Facebook 的一個相關的自訂代碼節點擴展了 SPSS Modeler Premium 的功能,以便能夠直接從 Facebook wall 直接讀取資料,並與 SPSS Modeler 內的 Twitter 提要相集成,從而獲得多社 交媒體管道觀點。

在開源文本挖掘工具中,RapidMiner 和 R 這兩個工具最為流行。 R 有更大的使用者群,它是一種需要原始程式碼的程式設計語言,有許多演算法選擇。 但可伸縮性一直是 R 的一個問題,所以,對於大型資料集,如果沒有變通方案,R 不是一個理想選擇。 RapidMiner 的使用者群較小,但它不要求原始程式碼,並且有一個強大的使用者介面 (UI)。 而且它是高度可伸縮的,能夠處理集群和資料庫內程式設計。 IBM 提供了一個將查詢內的 R 專案集成在一起的 Jaql R 模組,它允許 MapReduce 作業並行運行 R 計算。

相關文章

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.