Java正則多字串匹配替換

Java正則多字串匹配替換_java

最後更新：2017-01-18 來源：互聯網

上載者：User

創建阿里雲帳戶，並獲得超過 40 款產品的免費試用版；而企業帳戶則可以享有總值 $1200 的免費試用版。立即註冊！

Java中使用也比較簡單：
1. 編譯Regex的字面值得到對應的模式Pattern對象；

2. 建立匹配給定輸入與此模式的匹配器Matcher；

3. 通過匹配器對象執行操作，匹配器對象的方法很豐富，方法之間組合使用更加強大。

複製代碼代碼如下:

public static void main(String[] args) {
    //被替換關鍵字的的資料來源
    Map<String,String> tokens = new HashMap<String,String>();
    tokens.put("cat", "Garfield");
    tokens.put("beverage", "coffee");

    //匹配類似velocity規則的字串
    String template = "${cat} really needs some ${beverage}.";
    //產生匹配模式的Regex
    String patternString = "\\$\\{(" + StringUtils.join(tokens.keySet(), "|") + ")\\}";

    Pattern pattern = Pattern.compile(patternString);
    Matcher matcher = pattern.matcher(template);

    //兩個方法：appendReplacement, appendTail
    StringBuffer sb = new StringBuffer();
    while(matcher.find()) {
        matcher.appendReplacement(sb, tokens.get(matcher.group(1)));
    }
    matcher.appendTail(sb);

    //out: Garfield really needs some coffee.
    System.out.println(sb.toString());

    //對於特殊含義字元"\","$"，使用Matcher.quoteReplacement消除特殊意義
    matcher.reset();
    //out: cat really needs some beverage.
    System.out.println(matcher.replaceAll("$1"));
    //out: $1 really needs some $1.
    System.out.println(matcher.replaceAll(Matcher.quoteReplacement("$1")));

    //到得郵箱的首碼名。插一句，其實驗證郵箱的正則多種多樣，根據自己的需求寫對應的正則才是王道
    String emailPattern = "^([a-z0-9_\\.\\-\\+]+)@([\\da-z\\.\\-]+)\\.([a-z\\.]{2,6})$";
    pattern = Pattern.compile(emailPattern);
    matcher = pattern.matcher("test@qq.com");
    //驗證是否郵箱
    System.out.println(matcher.find());
    //得到@符號前的郵箱名 out: test
    System.out.println(matcher.replaceAll("$1"));

    //獲得匹配值
    String temp = "<meta-data android:name=\"appid\" android:value=\"joy\"></meta-data>";
    pattern = Pattern.compile("android:(name|value)=\"(.+?)\"");
    matcher = pattern.matcher(temp);
    while(matcher.find()) {
        //out: appid, joy
        System.out.println(matcher.group(2));
    }
}

一些老是忘基礎

[...] 位於括弧之內的任一字元

[^...] 不在括弧之中的任一字元

. 除了分行符號之外的任一字元,等價於[^\n]

\w 任何單字字元, 等價於[a-zA-Z0-9]

\W 任何非單字字元,等價於[^a-zA-Z0-9]

\s 任何空白符,等價於[\ t \ n \ r \ f \ v]

\S 任何非空白符,等價於[^\ t \ n \ r \ f \ v]

\d 任何數字,等價於[0-9]

\D 除了數字之外的任何字元,等價於[^0-9]

[\b] 一個退格直接量(特例)

{n, m} 匹配前一項至少n次,但是不能超過m次

{n, } 匹配前一項n次,或者多次

{n} 匹配前一項恰好n次

? 匹配前一項0次或1次,也就是說前一項是可選的. 等價於 {0, 1}

+ 匹配前一項1次或多次,等價於{1,}

* 匹配前一項0次或多次.等價於{0,}

| 選擇.匹配的要麼是該符號左邊的子運算式,要麼它右邊的子運算式

(...) 分組.將幾個項目分為一個單元.這個單元可由 *、+、？和|等符號使用,而且還可以記住和這個組匹配的字元以供此後引用使用

\n 和第n個分組所匹配的字元相匹配.分組是括弧中的子運算式(可能是嵌套的).分組號是從左至右計數的左括弧數

^ 匹配的是字元的開頭,在多行檢索中,匹配的是一行的開頭

$ 匹配的是字元的結尾,在多行檢索中,匹配的是一行的結尾

\b 匹配的是一個詞語的邊界.簡而言之就是位於字元\w 和 \w之間的位置(注意:[\b]匹配的是退格符)

\B 匹配的是非詞語的邊界的字元

題外話

郵箱驗證，以前驗證郵箱，網上搜個正則裝在自己程式裡面就用，其實這是不對的，不同的公司對郵箱的驗證格式是不一樣的，比方說163和qq郵箱註冊，他們要求的格式都不一樣，所以搜一個Regex就去套所有的郵箱格式也是不對的，符合自己的需求的正則才是正確的。

本文章原先以中文撰寫並發佈於 aliyun.com，亦設英文版本，僅作資訊用途。本網站不對文章的準確性，完整性或可靠性或其任何翻譯作出任何明示或暗示的陳述或保證。如對該文章有任何疑慮或投訴，請傳送電郵至 info-contact@alibabacloud.com 並提供相關疑慮或投訴的詳細說明。職員會於 5 個工作天內與您聯絡，一經驗證之後，即會刪除該侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

Get Started for Free

Sales Support

1 on 1 presale consultation

Chat Contact Sales
After-Sales Support

24/7 Technical Support 6 Free Tickets per Quarter Faster Response

Open a Ticket
Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.

Learn More

Java正則多字串匹配替換_java

聯繫我們

A Free Trial That Lets You Build Big!

Sales Support

After-Sales Support