php在做敏感詞過濾時怎麼解決用特殊符號分割、簡繁體、半形全形,來繞開過濾的問題?

來源:互聯網
上載者:User
關鍵字 php
徹底地過濾敏感詞

回複內容:

徹底地過濾敏感詞

過濾和諧詞其實並不是一個好策略,有一萬種說出敏感詞的方法,就一定會有第一萬零一種,如果你反覆設定程式去和諧這些詞,最後會發現,你的會員連最基本的一些話都不能發了。和諧沒有終極解決方案,卻能最終作繭自縛,自縛雙手。對付這些內容最佳的方案還是靠人工,如果你的系統使用者比較多,資訊產生得比較快,可以參考參考微博的社區委員會制度,通過發動一些熱心的會員來輔助管理內容。

人工審核吧
上有政策 下有對策
很難通過程式完全過濾全部敏感詞(特殊分隔、簡繁等)

你需要Regex。

$content = "新開的淘[防和諧]寶網店歡迎光顧!";preg_replace('/淘.{0,6}寶/uU', '****', $content);

用以上的Regex,只要“淘”和“寶”中間有0到6個字元,管你什麼字元,照和諧不誤。

更多用法請自行學習Regex。

這種要看策略了,不過大部分的都還是機器+人工的方式來處理,沒法用機器100%處理掉敏感資訊

關鍵詞過濾容易誤殺,而且總有方法繞過,所以只能用來做初步過濾,最終還是要靠人工來審核

  • 相關文章

    聯繫我們

    該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

    如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

    A Free Trial That Lets You Build Big!

    Start building with 50+ products and up to 12 months usage for Elastic Compute Service

    • Sales Support

      1 on 1 presale consultation

    • After-Sales Support

      24/7 Technical Support 6 Free Tickets per Quarter Faster Response

    • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.