標籤:bool 步驟 沒有 提取 協助 參數 ade jdk1.4 有用
這兩天回想了一下Regex的使用,順便就總結了一下java的javascript中使用Regex的用法,需要看javascript中使用正則的朋友可以看我的另一篇總結,下面我就簡單的介紹一下java中Regex的使用。方便自己以後查詢使用,也希望能協助到大家。===歡迎指正===
在JDK1.3及之前的JDK版本中並沒有包含Regex的類,如果要在Java中使用Regex必須使用第三方提供的Regex庫。從JDK1.4開始提供了支援RegexAPI,它們位於java.util.regex包中。
一、常見的符號的介紹
1.1 預定義字元類
| 符號 |
說明 |
| . |
任何字元(與行結束符可能匹配也可能不匹配) |
| \d |
數字:[0-9] |
| \D |
非數字: [^0-9] |
| \s |
空白字元:[ \t\n\x0B\f\r] |
| \S |
非空白字元:[^\s] |
| \w |
單詞字元:[a-zA-Z_0-9] |
| \W |
非單詞字元:[^\w] |
| \ |
逸出字元,比如"\\"匹配"\" ,"\{"匹配"{"。 |
1.2 數量詞
| 符號 |
說明 |
| * |
等價於{0,} 匹配0至多個在它之前的字元。例如Regex“zo*”能匹配“z”以及“zoo”;Regex“.*”意味著能夠匹配任一字元串。 |
| + |
等價於{1,} 匹配前面的子運算式一次或多次。例如Regex9+匹配9、99、999等。 |
| ? |
等價於{0,1} 匹配前面的子運算式零次或一次。例如,"do(es)?" 可以匹配 "do" 或 "does" 中的"do" 。此元字元還有另外一個用途,就是表示非貪婪模式比對,後邊將有介紹 |
| {n} |
匹配確定的 n 次。例如,“e{2}”不能匹配“bed”中的“d”,但是能匹配“seed”中的兩個“e”。 |
| {n,} |
至少匹配n次。例如,“e{2,}”不能匹配“bed”中的“e”,但能匹配“seeeeeeeed”中的所有“e”。 |
| {n,m} |
最少匹配 n 次且最多匹配 m 次。“e{1,3}”將匹配“seeeeeeeed”中的前三個“e”。 |
1.3 邊界匹配符號
| 符號 |
說明 |
| ^ |
行的開頭 |
| $ |
行的結尾 |
| \b |
單詞邊界 |
| \B |
非單詞邊界 |
| \A |
輸入的開頭 |
| \G |
上一個匹配的結尾 |
| \Z |
輸入的結尾,僅用於最後的結束符(如果有的話) |
| \z |
輸入的結尾 |
1.3 其他常見符號
| []的使用--或 |
說明 |
| [] |
匹配括弧中的任何一個字元 |
| [abc] |
a、b 或 c(簡單類) |
| [^abc] |
任何字元,除了 a、b 或 c(否定) |
| [a-zA-Z] |
a 到 z 或 A 到 Z,兩頭的字母包括在內(範圍) |
| [a-d[m-p]] |
a 到 d 或 m 到 p:[a-dm-p](並集) |
| [a-z&&[def]] |
d、e 或 f(交集) |
| [a-z&&[^bc]] |
a 到 z,除了 b 和 c:[ad-z](減去) |
| [a-z&&[^m-p]] |
a 到 z,而非 m 到 p:[a-lq-z](減去) |
| ()的使用 -- 組 |
|
| () |
將 () 之間括起來的運算式定義為“組”(group),並且將匹配這個運算式的字元儲存到一個臨時地區,這個元字元在字串提取的時候非常有用。擷取的群組可以通過從左至右計算其開括弧來編號。 |
| (\d) |
第一組 |
| ((A)(B(C))) |
第一組 ((A)(B(C))) 第二組 (A) 第三組(B(C)) 第四組(C) |
PS:更多其他符號,可參照 http://www.cnblogs.com/Mustr/p/6057159.html
二、常見的操作
2.1 匹配
String matches()方法。用規則匹配整個字串,只要有一處不符合規則,就匹配結束,返回false。
舉例:
public static void checkQQ(){ String qq = "123a45664"; String regex = "[1-9]\\d{4,14}"; boolean flag = qq.matches(regex); if(flag) System.out.println(qq+"...is ok"); else System.out.println(qq+"... 不合法"); } //不合法
/* 匹配 手機號段只有 13xxx 15xxx 18xxxx */ public static void checkTel() { String tel = "16900001111"; String telReg = "1[358]\\d{9}"; System.out.println(tel.matches(telReg)); }
2.2 切割
String split()方法; 根據給定Regex的匹配拆分此字串。返回一個數組。
舉例:
public static void splitDemo() { String str = "avg bb geig glsd abc"; String reg = " +";//按照多個空格來進行切割 String[] arr = str.split(reg); System.out.println(arr.length); for(String s : arr) { System.out.println(s); } }
組group舉例:
public static void splitDemo() { String str = "erkktyqqquizzzzzo"; String reg ="(.)\\1+";//按照疊詞來進行切割 //可以將規則封裝成一個組。用()完成。組的出現都有編號。 //從1開始。 想要使用已有的組可以通過 \n(n就是組的編號)的形式來擷取。 String[] arr = str.split(reg); System.out.println(arr.length); for(String s : arr) { System.out.println(s); } } // er,ty,ui,o
2.3 替換
String replaceAll(regex,str)方法; 使用給定的 replacement 替換此字串所有匹配給定的Regex的子字串。
ps:如果regex中有定義組,可以在第二參數中通過$符號擷取Regex中的已有的組。
舉例:
public static void replaceAllDemo() { String str = "wer1389980000ty1234564uiod234345675f";//將字串中的數字替換成#。 str = str.replaceAll("\\d{5,}","#"); System.out.println(str); } // wer#ty#uio#f
組group舉例:
public static void replaceAllDemo() { String str1 = "erkktyqqquizzzzzo";//將疊詞替換成$. //將重疊的字元替換成單個字母。zzzz->z str = str.replaceAll("(.)\\1+","$1"); System.out.println(str); } // erktyquizo
2.4擷取
----將字串中的符合規則的子串取出。
操作步驟:
1,將Regex封裝成對象。
2,讓正則對象和要操作的字串相關聯。
3,關聯後,擷取正則匹配引擎。
4,通過引擎對符合規則的子串進行操作,比如取出。
舉例:
public static void getDemo() { String str = "yin yu shi wo zui cai de yu yan"; System.out.println(str); String reg = "\\b[a-z]{3}\\b";//匹配只有三個字母的單詞 //將規則封裝成對象。 Pattern p = Pattern.compile(reg); //讓正則對象和要作用的字串相關聯。擷取匹配器對象。 Matcher m = p.matcher(str); //System.out.println(m.matches());//其實String類中的matches方法。用的就是Pattern和Matcher對象來完成的。 //只不過被String的方法封裝後,用起來較為簡單。但是功能卻單一。 // boolean b = m.find();//將規則作用到字串上,並進行符合規則的子串尋找。 // System.out.println(b); // System.out.println(m.group());//用於擷取匹配後結果。 while(m.find()) { System.out.println(m.group()); System.out.println(m.start()+"...."+m.end()); // start() 字元的開始下標(包含) //end() 字元的結束下標(不包含) } }
三、總結
什麼情況下使用什麼方法呢??????
思路方式:
1,如果只想知道該字元是否對是錯,使用匹配。
2,想要將已有的字串變成另一個字串,替換。
3,想要按照自定的方式將字串變成多個字串。切割。擷取規則以外的子串。
4,想要拿到符合需求的字串子串,擷取。擷取符合規則的子串。
以上內容是常用方式的總結,想使用好java正則,多去研究 pattern 和 matcher 兩個對象,。。都在java.util.regex包下。
========歡迎指正=========
Java中Regex的使用(常用的方法)