JavaRegex初學者指南自BLOGJAVA)

來源:互聯網
上載者:User
本文將介紹如何在Java中使用Regex來處理文本資料。Regex就是一個字串,但和普通的字串不同的是,Regex是對一組相似字串的抽象,如下面的幾個字串:
 
a98b   c0912d   c10b   a12345678d   ab
 
   
我們仔細分析上面五個字串,可以看出它們有一個共同特徵,就是第一個字元必須是'a'或'c',最後一個字元必須是'b'或'd',而中間的字元是任意
多個數字組成(包括0個數字)。因此,我們可以將這五個字串的共同特點抽象出來,這就產生了一個Regex:[ac]//d*[bd]。而根據這個正則
運算式,我們可以寫出無窮多個滿足條件的字串。
 
在Java中使用Regex的方法非常多,最簡單的就是和字串一起使用。在String中有四個方法可以使用Regex,它們是matches、split、replaceAll和replaceFirst。
 
一、matches方法
 
matches方法可以判斷當前的字串是否匹配給定的Regex。如果匹配,返回true,否則,返回false。matches方法的定義如下:

public boolean matches(String regex)
  
  如上面給出的Regex我們可以用如下程式驗證。

  1. String[] ss = new String[]{"a98b", "c0912d",  "c10b",  "a12345678d",  "ab"};
  2. for(String s: ss)
  3.     System.out.println(s.matches("[ac]//d*[bd]"));

輸出結果:
 
true
true
true
true
true
 
  
下面簡單解釋一下這個Regex的含義。如果我們學過編譯原理的詞法分析,就會很容易理解上面的Regex(因為Regex的表示方法和詞法分析中的表達
式類似)。如在
[...]中的相當於或"|",如[abcd]相當於a|b|c|d,也就是a或b或c或d。如上面的Regex的開頭部分是[ac],就代表著字串的
開頭只能是a或c。[bd]表達字串結尾只能是b或d。而中間的/d表達0-9的數字,由於/在Regex中有特殊含義,所以用//來表示/。而*表示
有0或無窮多個(這在詞法分析中叫*閉包),由於*跟在/d後面,因此表達有0或無窮多個數字。
 
二、split方法
 
split方法使用Regex來分割字串,並以String數組的形式返回分割結果。split有兩種重載形式,它們定義如下:

  1. public String[] split(String regex)
  2. public String[] split(String regex, int limit)

    如下面的代碼將使用split的第一種重載形式來分割HTTP要求標頭的第一行,代碼如下:

  1. String s = "GET /index.html HTTP/1.1";
  2. String ss[] = s.split(" +");
  3. for(String str: ss)
  4. System.out.println(str);

輸出結果:
GET
/index.html
HTTP/1.1
 
    在使用split的第一種重載形式時應注意,如果分割後的字串最後有空串,將被忽略。如使用Regex/d來分割字串a0b1c3456時,得到的數組的長度為3,而不是7。
在split的第二種重載形式中有一個limit參數,要分三種情況討論:
 
1. 大於0: 如limit的值為n,那麼將對Regex使用n-1次,下面的代碼:

  1. String s = "a0b1c3456";
  2. String ss[] = s.split("//d", 3);
  3. for(String str: ss)
  4.     System.out.println(str);

輸出結果:
 
a
b
c3456
 
從輸出結果可以看出,程式只對" a0b1c3456"使用了兩次Regex,也就是在少掃描完字元'1'後,不管後面有沒有滿足條件的字串,都將後面的字串作為一個整體來作為返回數組的最後一個值。
 
2. 小於0: 不忽略結尾的空串。也就是上面的例子返回數組的長度應該是7,而不是3。
3. 等於0:這是預設值,相當於split的第一種重載形式。
 
 
三、replaceAll 和 replaceFirst方法
 
為兩個方法的定義如下:

  1. public String replaceAll(String regex, String replacement)
  2. public String replaceFirst(String regex, String replacement)

    這兩個方法用replacement替換當前字串中和regex匹配的字串。使用方法很簡單,這裡不再詳述,感興趣的讀者可以參考相關的文檔。
 
對於Java中Regex的詳細內容,請參考JDK文檔。

相關文章

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.