一、建立Regex
建立Regex和建立字串類似 , 建立Regex提供了兩種方法 , 一種是採用 new運算子,另一個是採用字面量方式。
複製代碼 代碼如下: var dog = new RegExp('dog'); // 第一個參數字串
var dog = new RegExp('dog', 'ig'); // 第二個參數可選模式修飾符
var dog = /dog/;
var dog = /dog/ig; //字面量方式。
RegExp 對象包含兩個方法 : test() 和 exec() , 功能基本相似 , 用於測試字串匹配 。
test()方法在字串中尋找是否存在指定的Regex並返回布爾值 , 如果存在則返回 true , 不存在則返回 false 。
exec() 方法也用於在字串中尋找指定Regex,如果 exec() 方法執行成功,則返回包含該尋找字串的相關資訊數組。如果執行失敗,則返回 null 。
雖然建立Regex對象比較簡單,但真正複雜的卻是用正則文法描述的模式資訊。接下來,我們分幾個小節分別探討一些模式:
二、字串的Regex方法
例如:
複製代碼 代碼如下:var myPattern = /dog/ig;var theStr = "this is a dog,that is a dog!"console.log(theStr.match(myPattern)); //["dog", "dog"]
var myPattern = /dog/i;var theStr = "this is a dog,that is a dog!"console.log(theStr.search(myPattern)) //10
var myPattern = /dog/i; //注意沒有設定全域,如果設定全域,結果為:this is a Cat,that is a Cat!var theStr = "this is a dog,that is a dog!"console.log(theStr.replace(myPattern,"Cat")); //this is a Cat,that is a dog!
var myPattern = /\s/ig;var theStr = "this is a dog,that is a dog!"console.log(theStr.split(myPattern)); //["this", "is", "a", "dog,that", "is", "a", "dog!"],這個加不加全域g沒有影響!
二、直接量字元
在Regex中,所有字母字元和數字都是按照直接量與自身匹配的。同時,Regex還通過反斜線“\”加字母來支援某些非字母的字元。見下面的匹配列表:
字元 匹配
字母和數字 自身 例如: /a/ 匹配 字母 a
\o NUL字元
\t 定位字元
\n 分行符號
\v 垂直定位字元
\f 換頁符
\r 斷行符號
三、字元類
將單獨的直接字元放進[]內,就組成了字元類。一個字元類和它所包含的任何字元都匹配。
例如:/[abc]/ 與abc三個字母的任意一個匹配。
同時,還可以定義否定字元類。利用^字元。例如:/[^abc]/匹配a b c以外的所有字元。
另,可以用連字號號確定一個字元的範圍。例如:/[a-z]/匹配a到z。要匹配所有拉丁字母集,可以使用/[a-zA-Z0-9]/
字元 匹配
. 除分行符號和其他Unicode行終止符之外的任一字元
\w 任何ASCII單字字元,等價於[a-zA-Z0-9_]
\W 任何非ASCII單字字元,等價於[^a-zA-Z0-9_]
\s 任何Unicode空白符
\S 任何非Unicode空白符
\d 任何ASCII數字,等價於[0-9]
\D 任何非ASCII數字,等價於[^0-9]
[\b] 退格直接量
注意,方括弧[]內也可以使用上面的逸出序列。例如/[\s\d]/ 匹配任意的空白符或數字。
四、重複
根據第二節涉及到的知識,我們可以把兩位元表述成/\d\d/,但,如果重複次數過多,肯定就不能這樣寫了。
字元 匹配
{n,m} 匹配前一項至少n次,但不超過m次
{n,} 匹配前一項大於等於n次
{n} 恰好n次
? 0次或1次,
+ 1次或者多次,等價於{1,}
* 0次或多次
例如:/\d{2,4}/ 2個、3個或4個數字。 /\w{3}\d?/ 匹配3個字元,並有一個可選的數字。
注意:/a*/實際上與bbbb是匹配的,因為0個或多個a與bbbb匹配。
五、錨字元
六、選擇、分組和引用
1、字元“|”用於分隔選擇的字元。例如:/ab|cd|ef/匹配字串ab或cd或ef。 /\d{3}|[a-z]{4}/匹配3個數字或4個小寫字母
2、"()"作用是把單獨的公事包成子運算式。例如:/java(script)?/ 匹配java,其後可以有script,也可以沒有。
注意,在分組中,$1、$2、$3分別表示第幾個分組中的內容。
例如:
var myPattern = /(dog).*(cat)/;var theStr = "this is a dog,that is a cat!"myPattern.exec(theStr);console.log(RegExp.$2 + " " + RegExp.$1); //cat dog console.log(RegExp.lastMatch); //最後一次匹配的項:dog,that is a cat
七、貪婪與惰性
例如:
複製代碼 代碼如下:var myPattern = /[a-z]+/;var theStr = "this is a dog,that is a cat!"console.log(theStr.replace(myPattern, "a")); //a is a dog,that is a cat! 貪婪的,把this都匹配了!
var myPattern = /[a-z]+?/;var theStr = "this is a dog,that is a cat!"console.log(theStr.replace(myPattern, "a")); //ahis is a dog,that is a cat! 非貪婪的,只把this中的t匹配了!
最後,RegExp執行個體繼承的toLocaleString()和toString()方法都會返回Regex的字面量,即/abc/