Regex的內容極多,但是本系列主要討論最常用的知識點。我們學習中都有這樣的經驗:如果每次所討論的知識點過多,會不易於吸收消化,也不利於知識脈絡的形成,所以本系列會將有限的內容分成好幾篇文章進行討論。
Regex是一個描述字元模式的對象。JavaScript的RegExp類表示Regex,而String和RegExp都定義了使用Regex進行強大的模式比對和文本檢索與替換的函數。
ECMAScript v3對JavaScriptRegex進行了標準化。JavaScript 1.2實現了ECMAScript v3要求的Regex特性的子集,JavaScript 1.5實現了完整的標準。JavaScript的Regex完全以Perl語言的Regex工具為基礎。粗略地說,JavaScript 1.2實現了Perl 4的Regex,JavaScript 1.5 實現了Perl 5的Regex的大型子集。
① Regex的定義:
在JavaScript中,Regex由RegExp對象表示。當然,可以使用RegExp( )建構函式建立RegExp對象,不過通常還是用特殊的直接量文法來建立RegExp對象。就像字串直接量被定義為包含在引號內的字元一樣,Regex直接量被定義為包含在一對斜杠(/)之間的字元。所以JavaScript可能會包含如下的代碼:
var pattern=/s$/;
這行代碼建立了一個新的RegExp對象,並且將它賦給了變數pattern。這個特殊的RegExp對象和所有以字母"s"結尾的字串都匹配。
alert(/s$/.test("apples")); //true
用建構函式RegExp( )也可以定義一個等價的Regex,其代碼如下:
var pattern=new RegExp("s$");
無論用直接量文法還是建構函式文法,建立一個RegExp對象都很容易。
Regex的模式規範是由一系列字元構成的。大多數的字元(包括所有的字母和數字)描述的都是按照直接量進行匹配的字元。這樣說來,Regex/java/就和所有的包含子串"java"的字串相匹配。
alert(/java/.test("abcjavacba"));
但是Regex中的其他字元不是按照直接量進行匹配的,它們都具有特殊的含義。例如Regex/s$/包含兩個字元,第一個字元"s"按照直接量與自身相匹配,第二個字元"$"是一個特殊的元字元,它匹配的是字串的結尾。所以Regex/s$/匹配的就是以字母"s"結尾的字串。