JavaScript提供了一個RegExp對象來完成有關Regex的操作和功能,每一條Regex模式對應一個RegExp執行個體。有兩種方式可以建立RegExp對象的執行個體。
使用RegExp的顯式建構函式,文法為:new RegExp("pattern"[,"flags"])。
使用RegExp的隱式建構函式,採用純文字格式:/pattern/[flags]。
pattern部分為要使用的Regex模式文本,是必須的。在第一種方式中,pattern部分以JavaScript字串的形式存在,需要使用雙引號或單引號括起來;在第二種方式中,pattern部分嵌套在兩個“/”之間,不能使用引號。
flags部分設定Regex的標誌資訊,是可選項。如果設定flags部分,在第一種方式中,以字串的形式存在;在第二種方式中,以文本的形式緊接在最後一個“/”字元之後。flags可以是以下標誌字元的組合。
g是全域標誌。如果設定了這個標誌,對某個文本執行搜尋和替換操作時,將對文本中所有匹配的部分起作用。如果不設定這個標誌,則僅搜尋和替換最早匹配的內容。
i是忽略大小寫標誌。如果設定了這個標誌,進行匹配比較時,將忽略大小寫。
m是多行標誌。如果不設定這個標誌,那麼元字元“^”只與整個被搜尋字串的開始位置相匹配,而元字元“$”只與被搜尋字串的結束位置相匹配。如果設定了這個標誌,“^”還可以與被搜尋字串中的“\n”或“\r”之後的位置(即下一行的行首)相匹配,而“$”還可以與被搜尋字串中的“\n”或“\r”之後的位置(即下一行的行尾)相匹配。
代碼1.1是一個建立Regex的例子。
代碼1.1 建立Regex:1.1.htm
<html>
<head>
<title>建立Regex</title>
<scriptlanguage = "JavaScript">
var myString="這是第一個Regex的例子";
var myregex = new RegExp("一個"); //建立Regex
if (myregex.test(myString)){
document.write("找到了指定的模式!");
}
else{
document.write("未找到指定的模式。");
}
</script>
</head><body></body>
</html>
上面代碼的運行結果8.1所示。
由於JavaScript字串中的“\”是一個逸出字元,因此,使用顯式建構函式建立RegExp執行個體對象時,應將原始Regex中的“\”用“\\”替換。例如,在代碼1.2中的兩條語句是等價的。
代碼1.2 逸出字元中的“\”:1.2.htm
<scriptlanguage="javascript">
var re1 = new RegExp("\\d{5}");
var re2 = /\d{5}/;
alert("re1="+re1+"\nre2="+re2);
</script>
由於Regex模式文本中的逸出字元也是“\”,如果Regex中要匹配原義字元“\”,在Regex模式文本中要以“\\”來表示,當使用顯式建構函式的方式建立RegExp執行個體對象的時候,就需要使用“\\\\”來表示原義字元“\”。
var re = newRegExp(\\\\)。
1 RegExp對象的屬性
RegExp對象的屬性分為靜態屬性和執行個體屬性。下面分別進行介紹。
1.1 靜態屬性
(1)index屬性。是當前運算式模式最初相符內容的開始位置,從0開始計數。其初始值為-1,每次成功匹配時,index屬性都會隨之改變。
(2)input屬性。返回當前所作用的字串,可以簡寫為$_,初始值為空白字串""。
(3)lastIndex屬性。是當前運算式模式最初相符內容中最後一個字元的下一個位置,從0開始計數,常被作為繼續搜尋時的起始位置,初始值為-1,表示從起始位置開始搜尋,每次成功匹配時,lastIndex屬性值都會隨之改變。
(4)lastMatch屬性。是當前運算式模式的最後一個匹配字串,可以簡寫為$&。其初始值為空白字串""。在每次成功匹配時,lastMatch屬性值都會隨之改變。
(5)lastParen屬性。如果運算式模式中有括起來的子匹配,是當前運算式模式中最後的子匹配所匹配到的子字串,可以簡寫為$+。其初始值為空白字串""。每次成功匹配時,lastParen屬性值都會隨之改變。
(6)leftContext屬性。是當前運算式模式最後一個匹配字串左邊的所有內容,可以簡寫為$`(其中“'”為鍵盤上“Esc”下邊的反單引號)。初始值為空白字串""。每次成功匹配時,其屬性值都會隨之改變。
(7)rightContext屬性。是當前運算式模式最後一個匹配字串右邊的所有內容,可以簡寫為$’。初始值為空白字串""。每次成功匹配時,其屬性值都會隨之改變。
(8)$1…$9屬性。這些屬性是唯讀。如果運算式模式中有括起來的子匹配,$1…$9屬性值分別是第1個到第9個子匹配所捕獲到的內容。如果有超過9個以上的子匹配,$1…$9屬性分別對應最後的9個子匹配。在一個運算式模式中,可以指定任意多個帶括弧的子匹配,但RegExp對象只能儲存最後的9個子匹配的結果。在RegExp執行個體對象的一些方法所返回的結果數組中,可以獲得所有圓括弧內的子匹配結果。
1.2 執行個體屬性
(1)global屬性。返回建立RegExp對象執行個體時指定的global標誌(g)的狀態。如果建立RegExp對象執行個體時設定了g標誌,該屬性返回True,否則返回False,預設值為False。
(2)ignoreCase屬性。返回建立RegExp對象執行個體時指定的ignoreCase標誌(i)的狀態。如果建立RegExp對象執行個體時設定了i標誌,該屬性返回True,否則返回False,預設值為False。
(3)multiLine屬性。返回建立RegExp對象執行個體時指定的multiLine標誌(m)的狀態。如果建立RegExp對象執行個體時設定了m標誌,該屬性返回True,否則返回False,預設值為False。
(4)source屬性。返回建立RegExp對象執行個體時指定的運算式文本字串。