關於notepad++用Regex尋找文本漢字的分析

來源:互聯網
上載者:User

notepad++可以進行Regex尋找,

偶然機會需要尋找漢字

但是發現網上流傳的

[\u4e00-\u9fa5]
[一-龥]
都不好用,有時候,一些個漢字“長”等就不認。但是,把這些個文本複製出來後就可以尋找了。

研究發現,因為一般來自記事本或者其他地方的txt文檔都是使用ansi格式儲存的,應該要單字元尋找,相對的,複製粘貼出來後,Notepad++預設是unicode的,因此,
[\u4e00-\u9fa5]之類的是unicode下的編碼,所以工作良好。
同理,將上述txt文檔另存新檔utf-8格式,重新用notepad開啟,上述Regex可以良好工作了。
另外,轉點基本Regex規則,以備後用
運算式 說明 \t 定位字元. \n 新行. . 匹配任一字元. | 匹配運算式左邊和右邊的字元. 例如, "ab|bc" 匹配 "ab" 或者 "bc". [] 匹配列表之中的任何單個字元. 例如, "[ab]" 匹配 "a" 或者 "b". "[0-9]" 匹配任一數字. [^] 匹配列表之外的任何單個字元. 例如, "[^ab]" 匹配 "a" 和 "b" 以外的字元. "[^0-9]" 匹配任意非數字字元. * 其左邊的字元被匹配任意次(0次,或者多次). 例如 "be*" 匹配 "b", "be" 或者 "bee". + 其左邊的字元被匹配至少一次(1次,或者多次). 例如 "be+" 匹配 "be" 或者 "bee" 但是不匹配 "b". ? 其左邊的字元被匹配0次或者1次. 例如 "be?" 匹配 "b" 或者 "be" 但是不匹配 "bee". ^ 其右邊的運算式被匹配在一行的開始. 例如 "^A" 僅僅匹配以 "A" 開頭的行. $ 其左邊的運算式被匹配在一行的結尾. 例如 "e$" 僅僅匹配以 "e" 結尾的行. () 影響運算式匹配的順序,並且用作運算式的分組標記. \ 逸出字元. 如果你要使用 "\" 本身, 則應該使用 "\\". 

相關文章

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.