文本挖掘軟體和應用程式有很多商業和開源選項。 IBM 提供了種類繁多且強健的文本挖掘解決方案。 利用了 IBM® InfoSphere® BigInsights™ 大資料功能的一種功能強大的方案提供了附加文本分析模組,能夠從 InfoSphere BigInsights 集群運行文本分析提取。 IBM SPSS® 方案規模和範圍都很廣泛。 對於搜索文檔並將它分配給一個主題非常有效的一個工具是 IBM SPSS Modeler,它能提供一個圖形介面來執行通常的文字文件分類和分析。 另一個產品 IBM SPSS Text Analytics for Surveys 則使用了 NLP,對於分析文檔內開放的調查問題非常有用。 IBM SPSS Modeler Premium 與 SPSS Text Analytics for Surveys 運行在同一個引擎上,但是可伸縮性更高,能處理一個有助於結構化和非結構化資料整合的綜合工作臺內文檔(PDF、Web 頁面、博客 、電子郵件、Twitter 提要等)的整個語料庫。 面向 Facebook 的一個相關的自訂代碼節點擴展了 SPSS Modeler Premium 的功能,以便能夠直接從 Facebook wall 直接讀取資料,並與 SPSS Modeler 內的 Twitter 提要相集成,從而獲得多社 交媒體管道觀點。
在開源文本挖掘工具中,RapidMiner 和 R 這兩個工具最為流行。 R 有更大的使用者群,它是一種需要原始程式碼的程式設計語言,有許多演算法選擇。 但可伸縮性一直是 R 的一個問題,所以,對於大型資料集,如果沒有變通方案,R 不是一個理想選擇。 RapidMiner 的使用者群較小,但它不要求原始程式碼,並且有一個強大的使用者介面 (UI)。 而且它是高度可伸縮的,能夠處理集群和資料庫內程式設計。 IBM 提供了一個將查詢內的 R 專案集成在一起的 Jaql R 模組,它允許 MapReduce 作業並行運行 R 計算。