精通 JavaScript中的Regex手機整理 推薦

來源:互聯網
上載者:User

Regex可以:
•測試字串的某個模式。例如,可以對一個輸入字串進行測試,看在該字串是否存在一個電話號碼模式或一個信用卡號碼模式。這稱為資料有效性驗證
•替換文本。可以在文檔中使用一個Regex來標識特定文字,然後可以全部將其刪除,或者替換為別的文字
•根據模式比對從字串中提取一個子字串。可以用來在文本或輸入欄位中尋找特定文字
Regex文法
一個Regex就是由一般字元(例如字元 a 到 z)以及特殊字元(稱為元字元)組成的文字模式。該模式描述在尋找文字主體時待匹配的一個或多個字串。Regex作為一個模板,將某個字元模式與所搜尋的字串進行匹配。
建立Regex
Js代碼 複製代碼 代碼如下:var re = new RegExp();//RegExp是一個對象,和Aarray一樣
//但這樣沒有任何效果,需要將Regex的內容作為字串傳遞進去
re =new RegExp("a");//最簡單的Regex,將匹配字母a
re=new RegExp("a","i");//第二個參數,表示匹配時不分大小寫

RegExp建構函式第一個參數為Regex的常值內容,而第一個參數則為可選項標誌.標誌可以組合使用
•g (全文尋找)
•i (忽略大小寫)
•m (多行尋找)
Js代碼 複製代碼 代碼如下:var re = new RegExp("a","gi");//匹配所有的a或A

Regex還有另一種Regex字面量的聲明方式
Js代碼 複製代碼 代碼如下:var re = /a/gi;

和Regex相關的方法和屬性
Regex對象的方法
•test,返回一個 Boolean 值,它指出在被尋找的字串中是否存在模式。如果存在則返回 true,否則就返回 false。
•exec,用Regex模式在字串中運行尋找,並返回包<script type="text/javascript" src="http://www.javaeye.com/javascripts/tinymce/themes/advanced/langs/zh.js"></script><script type="text/javascript" src="http://www.javaeye.com/javascripts/tinymce/plugins/javaeye/langs/zh.js"></script>含該尋找結果的一個數組。
•compile,把Regex編譯為內部格式,從而執行得更快。
Regex對象的屬性
•source,返回Regex模式的文本的複本。唯讀。
•lastIndex,返回字元位置,它是被尋找字串中下一次成功匹配的開始位置。
•$1...$9,返回九個在模式比對期間找到的、最近儲存的部分。唯讀。
•input ($_),返回執行規範表述尋找的字串。唯讀。
•lastMatch ($&),返回任何Regex搜尋過程中的最後匹配的字元。唯讀。
•lastParen ($+),如果有的話,返回任何Regex尋找過程中最後括的子匹配。唯讀。
•leftContext ($`),返回被尋找的字串中從字串開始位置到最後匹配之前的位置之間的字元。唯讀。
•rightContext ($'),返回被搜尋的字串中從最後一個匹配位置開始到字串結尾之間的字元。唯讀。
String對象一些和Regex相關的方法
•match,找到一個或多個Regex的匹配。
•replace,替換與Regex匹配的子串。
•search,檢索與Regex相匹配的值。
•split,把字串分割為字串數組。

測試Regex是如何工作的! 複製代碼 代碼如下://test方法,測試字串,符合模式時返回true,否則返回false
var re = /he/;//最簡單的Regex,將匹配he這個單詞
var str = "he";
alert(re.test(str));//true
str = "we";
alert(re.test(str));//false
str = "HE";
alert(re.test(str));//false,大寫,如果要大小寫都匹配可以指定i標誌(i是ignoreCase或case-insensitive的表示)
re = /he/i;
alert(re.test(str));//true
str = "Certainly!He loves her!";
alert(re.test(str));//true,只要包含he(HE)就符合,如果要只是he或HE,不能有其它字元,則可使用^和$
re = /^he/i;//脫字元(^)代表字元開始位置
alert(re.test(str));//false,因為he不在str最開始
str = "He is a good boy!";
alert(re.test(str));//true,He是字元開始位置,還需要使用$
re = /^he$/i;//$表示字元結束位置
alert(re.test(str));//false
str = "He";
alert(re.test(str));//true
//當然,這樣不能發現Regex有多強大,因為我們完全可以在上面的例子中使用==或indexOf
re = /\s/;// \s匹配任何空白字元,包括空格、定位字元、換頁符等等
str= "user Name";//使用者名稱包含空格
alert(re.test(str));//true
str = "user Name";//使用者名稱包含定位字元
alert(re.test(str));//true
re=/^[a-z]/i;//[]匹配指定範圍內的任一字元,這裡將匹配英文字母,不區分大小寫
str="variableName";//變數名必須以字母開頭
alert(re.test(str));//true
str="123abc";
alert(re.test(str));//false

當然,僅僅知道了字串是否匹配模式還不夠,我們還需要知道哪些字元匹配了模式 複製代碼 代碼如下:var osVersion = "Ubuntu 8";//其中的8表示系統主要版本號
var re = /^[a-z]+\s+\d+$/i; //+號表示字元至少要出現1次,\s表示空白字元,\d表示一個數字
alert(re.test(osVersion));//true,但我們想知道主要版本號
//另一個方法exec,返回一個數組,數組的第一個元素為完整的匹配內容
re=/^[a-z]+\s+\d+$/i;
arr = re.exec(osVersion);
alert(arr[0]);//將osVersion完整輸出,因為整個字串剛好匹配re
//我只需要取出數字
re=/\d+/;
var arr = re.exec(osVersion);
alert(arr[0]);//8

更複雜的用法,使用子匹配 複製代碼 代碼如下://exec返回的數組第1到n元素中包含的是匹配中出現的任意一個子匹配
re=/^[a-z]+\s+(\d+)$/i;//用()來建立子匹配
arr =re.exec(osVersion);
alert(arr[0]);//整個osVersion,也就是Regex的完整匹配
alert(arr[1]);//8,第一個子匹配,事實也可以這樣取出主要版本號
alert(arr.length);//2
osVersion = "Ubuntu 8.10";//取出主要版本號和次版本號碼
re = /^[a-z]+\s+(\d+)\.(\d+)$/i;//.是Regex元字元之一,若要用它的字面意義須轉義
arr = re.exec(osVersion);
alert(arr[0]);//完整的osVersion
alert(arr[1]);//8
alert(arr[2]);//10

注意,當字串不匹配re時,exec方法將返回null
String對象的一些和Regex有關的方法 <br />//replace方法,用於替換字串<br />var str ="some money";<br />alert(str.replace("some","much"));//much money<br />//replace的第一個參數可以為Regex<br />var re = /\s/;//空白字元<br />alert(str.replace(re,"%"));//some%money<br />//在不知道字串中有多少空白字元時,Regex極為方便<br />str ="some some \tsome\t\f";<br />re = /\s+/;<br />alert(str.replace(re,"#"));//但這樣只會將第一次出現的一堆空白字元替換掉<br />//因為一個Regex只能進行一次匹配,\s+匹配了第一個空格後就退出了<br />re = /\s+/g;//g,全域標誌,將使Regex匹配整個字串<br />alert(str.replace(re,"@"));//some@some@some@<br />//另一個與之相似的是split<br />var str = "a-bd-c";<br />var arr = str.split("-");//返回["a","bd","c"]<br />//如果str是使用者輸入的,他可能輸入a-bd-c也可能輸入a bd c或a_bd_c,但不會是abdc(這樣就說他輸錯了)<br />str = "a_db-c";//使用者以他喜歡的方式加分隔字元s<br />re=/[^a-z]/i;//前面我們說^表示字元開始,但在[]裡它表示一個負字元集<br />//匹配任何不在指定範圍內的任一字元,這裡將匹配除字母處的所有字元<br />arr = str.split(re);//仍返回["a","bd","c"];<br />//在字串中尋找時我們常用indexOf,與之對應用於正則尋找的方法是search<br />str = "My age is 18.Golden age!";//年齡不是一定的,我們用indexOf不能尋找它的位置<br />re = /\d+/;<br />alert(str.search(re));//返回尋找到的字串開始下標10<br />//注意,因為尋找本身就是出現第一次就立即返回,所以無需在search時使用g標誌<br />//下面的代碼雖然不出錯,但g標誌是多餘的<br />re=/\d+/g;<br />alert(str.search(re));//仍然是10<br />
[Ctrl+A 全選 注:如需引入外部Js需重新整理才能執行]

注意,當search方法沒有找到匹配時,將返回-1
類似於exec方法,String對象的match方法也用於將字串與Regex進行匹配並返回結果數組 複製代碼 代碼如下:var str = "My name is CJ.Hello everyone!";
var re = /[A-Z]/;//匹配所有大寫字母
var arr = str.match(re);//返回數組
alert(arr);//數組中只會包含一個M,因為我們沒有使用全域匹配
re = /[A-Z]/g;
arr = str.match(re);
alert(arr);//M,C,J,H
//從字串中抽取單詞
re = /\b[a-z]\b/i;//\b表示單詞邊界
str = "one two three four";
alert(str.match(re));//one,two,three,four

RegExp對象執行個體的一些屬性
Js代碼 複製代碼 代碼如下:var re = /[a-z]/i;
alert(re.source);//將[a-z]字串輸出
//請注意,直接alert(re)會將Regex連同前向斜線與標誌輸出,這是re.toString方法定義的

每個RegExp對象的執行個體具有lastIndex屬性,它是被尋找字串中下一次成功匹配的開始位置,預設值是-1。 lastIndex 屬性被 RegExp 對象的 exec 和 test 方法修改.並且它是可寫的. 複製代碼 代碼如下:var re = /[A-Z]/;
//exec方法執行後,修改了re的lastIndex屬性,
var str = "Hello,World!!!";
var arr = re.exec(str);
alert(re.lastIndex);//0,因為沒有設定全域標誌
re = /[A-Z]/g;
arr = re.exec(str);
alert(re.lastIndex);//1
arr = re.exec(str);
alert(re.lastIndex);//7

當匹配失敗(後面沒有匹配),或lastIndex值大於字串長度時,再執行exec等方法會將lastIndex設為0(開始位置) 複製代碼 代碼如下:var re = /[A-Z]/;
var str = "Hello,World!!!";
re.lastIndex = 120;
var arr = re.exec(str);
alert(re.lastIndex);//0

RegExp對象的靜態屬性 複製代碼 代碼如下://input 最後用於匹配的字串(傳遞給test,exec方法的字串)
var re = /[A-Z]/;
var str = "Hello,World!!!";
var arr = re.exec(str);
alert(RegExp.input);//Hello,World!!!
re.exec("tempstr");
alert(RegExp.input);//仍然是Hello,World!!!,因為tempstr不匹配
//lastMatch 最後匹配的字元
re = /[a-z]/g;
str = "hi";
re.test(str);
alert(RegExp.lastMatch);//h
re.test(str);
alert(RegExp["$&"]);//i ,$&是lastMatch的短名字,但由於它不是合法變數名,所以要。。
//lastParen 最後匹配的分組
re = /[a-z](\d+)/gi;
str = "Class1 Class2 Class3";
re.test(str);
alert(RegExp.lastParen);//1
re.test(str);
alert(RegExp["$+"]);//2
//leftContext 返回被尋找的字串中從字串開始位置到最後匹配之前的位置之間的字元
//rigthContext 返回被搜尋的字串中從最後一個匹配位置開始到字串結尾之間的字元
re = /[A-Z]/g;
str = "123ABC456";
re.test(str);
alert(RegExp.leftContext);//123
alert(RegExp.rightContext);//BC456
re.test(str);
alert(RegExp["$`"]);//123A
alert(RegExp["$'"]);//C456

multiline屬性返回Regex是否使用多行模式,這個屬性不針對某個Regex執行個體,而是針對所有Regex,並且這個屬性可寫.(IE與Opera不支援這個屬性) 複製代碼 代碼如下:alert(RegExp.multiline);
//因為IE,Opera不支援這個屬性,所以最好還是單獨指定
var re = /\w+/m;
alert(re.multiline);
alert(RegExp["$*"]);//RegExp對象的靜態屬性不會因為給RegExp某個對象執行個體指定了m標誌而改變
RegExp.multiline = true;//這將開啟所有Regex執行個體的多行匹配模式
alert(RegExp.multiline);

使用元字元注意事項:元字元是Regex的一部分,當我們要匹配Regex本身時,必須對這些元字元轉義.下面是Regex用到的所有元字元
( [ { \ ^ $ | ) ? * + . 複製代碼 代碼如下:var str = "?";
var re = /?/;
alert(re.test(str));//出錯,因為?是元字元,必須轉義
re = /\?/;
alert(re.test(str));//true

使用RegExp建構函式與使用Regex字面量建立Regex注意點 複製代碼 代碼如下:var str = "\?";
alert(str);//只會輸出?
var re = /\?/;//將匹配?
alert(re.test(str));//true
re = new RegExp("\?");//出錯,因為這相當於re = /\?/
re = new RegExp("\\?");//正確,將匹配?
alert(re.test(str));//true

既然雙重轉義這麼不友好,所以還是用Regex字面量的聲明方式
如何在Regex中使用特殊字元? 複製代碼 代碼如下://ASCII方式用十六進位數來表示特殊字元
var re = /^\x43\x4A$/;//將匹配CJ
alert(re.test("CJ"));//true
//也可使用八進位方式
re = /^\103\112$/;//將匹配CJ
alert(re.test("CJ"));//true
//還可以使用Unicode編碼
re =/^\u0043\u004A$/;//使用 Unicode,必須使用u開頭,接著是字元編碼的四位16進位表現形式
alert(re.test("CJ"));

另處,還有一些其它的預定義特殊字元,如下表所示:
字元 描述
\n 分行符號
\r 斷行符號符
\t 定位字元
\f 換頁符(Tab)
\cX 與X對應的控制字元
\b 退格符(BackSpace)
\v 垂直定位字元
\0 Null 字元("")
字元類 ---〉簡單類,反向類,範圍類,組合類別,預定義類 複製代碼 代碼如下://簡單類
var re = /[abc123]/;//將匹配abc123這6個字元中一個
//負向類
re = /[^abc]/;//將匹配除abc之外的一個字元
//範圍類
re = /[a-b]/;//將匹配小寫a-b 26個字母
re = /[^0-9]/;//將匹配除0-9 10個字元之處的一個字元
//組合類別
re = /[a-b0-9A-Z_]/;//將匹配字母,數字和底線

下面是Regex中的預定義類

代碼 等同於 匹配
. IE下[^\n],其它[^\n\r] 匹配除分行符號之外的任何一個字元
\d [0-9] 匹配數字
\D [^0-9] 匹配非數字字元
\s [ \n\r\t\f\x0B] 匹配一個空白字元
\S [^ \n\r\t\f\x0B] 匹配一個非空白字元
\w [a-zA-Z0-9_] 匹配字母數字和底線
\W [^a-zA-Z0-9_] 匹配除字母數字底線之外的字元

量詞(下表量詞單個出現時皆是貪婪量詞)
代碼 描述
* 匹配前面的子運算式零次或多次。例如,zo* 能匹配 "z" 以及 "zoo"。 * 等價於{0,}。
+ 匹配前面的子運算式一次或多次。例如,'zo+' 能匹配 "zo" 以及 "zoo",但不能匹配 "z"。+ 等價於 {1,}。
? 匹配前面的子運算式零次或一次。例如,"do(es)?" 可以匹配 "do" 或 "does" 中的"do" 。? 等價於 {0,1}。
{n} n 是一個非負整數。匹配確定的 n 次。例如,'o{2}' 不能匹配 "Bob" 中的 'o',但是能匹配 "food" 中的兩個 o。
{n,} n 是一個非負整數。至少匹配n 次。例如,'o{2,}' 不能匹配 "Bob" 中的 'o',但能匹配 "foooood" 中的所有 o。'o{1,}' 等價於 'o+'。'o{0,}' 則等價於 'o*'。
{n,m} m 和 n 均為非負整數,其中n <= m。最少匹配 n 次且最多匹配 m 次。劉, "o{1,3}" 將匹配 "fooooood" 中的前三個 o。'o{0,1}' 等價於 'o?'。請注意在逗號和兩個數之間不能有空格。

貪婪量詞與惰性量詞
•用貪婪量詞進行匹配時,它首先會將整會字串當成一個匹配,如果匹配的話就退出,如果不匹配,就截去最後一個字元進行匹配,如果不匹配,繼續將最後一個字元截去進行匹配,直到有匹配為止。直到現在我們遇到的量詞都是貪婪量詞
•用貪婪量詞進行匹配時,它首先將第一個字元當成一個匹配,如果成功則退出,如果失敗,則測試前兩個字元,依些增加,直到遇到合適的匹配為止
惰性量詞僅僅在貪婪量詞後面加個"?"而已,如"a+"是貪婪匹配的,"a+?"則是惰性的 複製代碼 代碼如下:var str = "abc";
var re = /\w+/;//將匹配abc
re = /\w+?/;//將匹配a

多行模式 複製代碼 代碼如下:var re = /[a-z]$/;
var str = "ab\ncdef";
alert(str.replace(re,"#"));//ab\ncde#
re =/[a-z]$/m;
alert(str.replace(re,"#"));//a#\ncde#

分組與非捕獲性分組 複製代碼 代碼如下:re = /abc{2}/;//將匹配abcc
re = /(abc){2}/;//將匹配abcabc
//上面的分組都是捕獲性分組
str = "abcabc ###";
arr = re.exec(str);
alert(arr[1]);//abc
//非捕獲性分組 (?:)
re = /(?:abc){2}/;
arr = re.exec(str);
alert(arr[1]);//undefined

候選(也就是所說的“或”) 複製代碼 代碼如下:re = /^a|bc$/;//將匹配開始位置的a或結束位置的bc
str ="add";
alert(re.test(str));//true
re = /^(a|bc)$/;//將匹配a或bc
str ="bc";
alert(re.test(str));//true

當包含分組的Regex進行過test,match,search這些方法之後,每個分組都被放在一個特殊的地方以備將來使用,這些儲存是分組中的特殊值,我們稱之為反向引用 複製代碼 代碼如下:var re = /(A?(B?(C?)))/;
/*上面的Regex將依次產生三個分組
(A?(B?(C?))) 最外面的
(B?(C?))
(C?)*/
str = "ABC";
re.test(str);//反向引用被儲存在RegExp對象的靜態屬性$1—$9中
alert(RegExp.$1+"\n"+RegExp.$2+"\n"+RegExp.$3);
//反向引用也可以在Regex中使用\1 ,\2...這類的形式使用
re = /\d+(\D)\d+\1\d+/;
str = "2008-1-1";
alert(re.test(str));//true
str = "2008-4_3";
alert(re.test(str));//false

使用反向引用可以要求字串中某幾個位置上的字元必須相同.另外,在replace這類方法中可用特殊字元序列來表示反向引用
Js代碼 複製代碼 代碼如下:re = /(\d)\s(\d)/;
str = "1234 5678";
alert(str.replace(re,"$2 $1"));//在這個裡面$1表示第一個分組1234,$2則表示5678

其它——〉正向前瞻,用來捕獲出現在特定字元之前的字元,只有當字元後面跟著某個特定字元才去捕獲它。與正向前瞻對應的有負向前瞻,它用匹配只有當字元後面不跟著某個特定字元時才去匹配它。在執行前瞻和負向前瞻之類的運算時,Regex引擎會留意字串後面的部分,然而卻不移動index 複製代碼 代碼如下://正向前瞻
re = /([a-z]+(?=\d))/i;
//我們要匹配後面跟一個數位單詞,然後將單詞返回,而不要返回數字
str = "abc every1 abc";
alert(re.test(str));//true
alert(RegExp.$1);//every
alert(re.lastIndex);//使用前瞻的好處是,前瞻的內容(?=\d)並不會當成一次匹配,下次匹配仍從它開始
//負向前瞻(?!)
re = /([a-z](?!\d))/;i
//將匹配後面不包含數位字母,並且不會返回(?!\d)中的內容
str = "abc1 one";
alert(re.test(str));
alert(RegExp.$1);//one

構建一個驗證電子郵箱地址有效性的Regex。電子郵箱地址有效性要求(我們姑且這樣定義):使用者名稱只能包含字母數字以及底線,最少一位,最多25位,使用者名稱後面緊跟@,後面是網域名稱,網域名稱名稱要求只能包含字母數字和減號(-),並且不能以減號開頭或結尾,然後後面是網域名稱尾碼(可以有多個),網域名稱尾碼必須是點號連上2-4位英文字母 複製代碼 代碼如下:var re = /^\w{1,15}(?:@(?!-))(?:(?:[a-z0-9-]*)(?:[a-z0-9](?!-))(?:\.(?!-)))+[a-z]{2,4}$/;

好像漏了些,比如,replace方法第二個參數作為函數的情況
恰巧上次在某君部落格裡看到一個面試題,讀取一個文字檔中的字串,統計其中的"9"出現的次數,用JS寫個也很簡單(不包含開啟檔案的代碼,開啟檔案可以用ActiveXObject等瀏覽器提供的對象弄) 複製代碼 代碼如下:var str="ADF9DF9DF9",//那個文字檔中的字串;
re=/9/gi,//匹配9
counter=0;//計數器
str.replace(re,function () {
counter++;//每出現一次匹配,函數就被執行一次,函數的傳回值用來替換原值
return "#";
});
//最後str 變成 ADF#DF#DF#"

至於傳遞給replace方法的函數接收的參數....樓下繼續
你說的那個問題:
$&是lastMatch的短名字
還有,不知道為什麼你的Regex中沒有對{}兩個特殊字元轉義

提到JS的相容性問題,這裡要提的是RegExp對象執行個體的compile 方法
compile方法用來將Regex編譯為內部格式以使其執行的更快

Js代碼 複製代碼 代碼如下:var re = new RegExp();
re.compile("[0-9]\\n");//注意要對斜杠多轉義一次,compile方法傳回值為re這個對象(編譯後的)

但經測試,這個方法在Safari及Chrome類似的瀏覽器,compile方法始終返回undefined,不可用

相關文章

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.