Regex是一種用來進行文本匹配的工具,其文法優美簡潔。在開發中,尋找、對比以及匹配字串是家常便飯的業務,通過Regex我們將這些業務描述成某些需求規則,來讓我們的代碼更美觀、實用。例如我們要驗證使用者輸入的密碼長度是否滿足6~18位的長度,新手最常見的驗證方式是判斷輸入的密碼長度
return (textField.text.length >= 6 && textField.text.leng <= 18);
儘管這種判斷方式沒有任何問題,而上面的驗證換做Regex的匹配字元就顯得短小精悍
^.{6,18}$
還有,大部分的固定電話都是0區號-八位元字的格式,那麼Regex的匹配如下
^0\\d{2}\-?\\d{8}$
再比如,對於密碼強度的認證。如今的密碼應該包括一個或以上的大寫字母以及小寫字母,對此Regex的匹配是
(^.*[A-Z]+.*[a-z]+.*$|^.*[a-z]+.*[A-Z]+.*$)
運算式字元解析
如果是新手開發人員,那麼很有可能不理解上面的Regex。那麼我們先看第一個匹配條件,匹配6-18位的密碼長度。根據題目的要求,就能夠輕易的判斷出{6,18}表示6-18位。其中,{n}匹配字元重複n次;{n,}匹配重複n次或更多次;{n,m}匹配重複n到m之間次數。
那麼讀者對^、.和$三個符號可能不明所以。^和$屬於特殊符號,前者表示匹配字串的開頭,後者表示匹配字串的結尾。由於我們有時需要在一段很長的字串中匹配某些小片段字串時(比如在圖文混編中匹配長字串中留空的Emoji),適當使用這兩個符號可以減少匹配次數,提高執行效率。
那麼結合這幾個字元代表含義,可以得出.符號表示任一字元(除分行符號之外)。那麼還可以得出{6,18}這個特殊符號表示的是前一個符號代表的位元。結合起來說^.{6,18}$匹配一段6至18位長度的字串,所以可以用來驗證密碼長度
當然了,.字元的匹配率太高,更多時候我們需要匹配的是具體到數字或者字母,甚至準確的數字和字母。那麼除了.字元以外,還有\d用來表示任意的單個數字,\w表示任意一個字母或數字或者直接使用0-9的任一數字表示具體數字。而特殊符號?表示前一個字元為0或者1個。
所以上面的^0\\d{2}\-?\\d{8}$匹配了以數字0開頭,接著兩個數字,後面跟著-號跟八個數字,然後結尾的字串,不管是010-88888888,還是02098989898都能進行正確匹配。
最後的一個運算式可能是最複雜的運算式,根據上面對部分符號的解析。我們可以把
^.*[A-Z]+.*[a-z]+.*$|^.*[a-z]+.*[A-Z]+.*$
拆分成 ^.*[A-Z]+.*[a-z]+.*$ 跟 ^.*[a-z]+.*[A-Z]+.*$
這兩個單獨的運算式,而中間的|不難猜到就是邏輯的或。我們將對前一個進行拆分,來一步步識別這個運算式的匹配規則。這裡教大家我拆分運算式的方法:我把運算式的字元分為兩類:值表達和修飾表達。所謂值表達就是說這個符號表示了某個值,就像\d表示數字,.表示任意非分行符號字元。修飾表達用來修飾值達成某種條件,比如{2}表示前面一個值重複兩次,*表示前一個值重複0次或者更多次。根據這種方法,那麼^.*[A-Z]+.*[a-z]+.*$可以拆分成部分:^$、 .* 、 [A-Z]+ 、 [a-z]+。
^$就不再多說。
.*這裡要介紹的就是*表示前一個值符號重複任意次數。
[A-Z]+中-表示從左邊的值到右邊的值之間所有值形成的閉集合;[]方括弧表示的值必須是括弧中間集合的子集,要注意的是括弧裡面可以有多個集合,比如[A-Z0-9a-z]表示匹配任意一個大小寫字母或數字;+同*有點像,但是+表示的是至少一個的重複值。
結合上面的解析,那麼^.*[A-Z]+.*[a-z]+.*$表示以任意數量的字元開頭,然後跟著一個大寫字母,大寫字母後面有任意數量的字元以及一個小寫字母,然後又是任意數量的數字、字母或者字元。而^.*[a-z]+.*[A-Z]+.*$表示小寫字母在大寫字母前面任意數量的字元的位置,兩個結合匹配可以確保字串中包括至少一個小寫字母和一個大寫字母。
ps:有一點要注意,上面展示的運算式解析時\d這些特殊符號在我們的代碼中多了一個\,這是因為\本身是轉義符號,為了保證運算式能正常匹配,我們要給\進行一次轉義,所以就變成了\\。基本上所有的符號字元都需要轉義。
文法/字元說明表
值表達
. 匹配除分行符號外的任一字元
\w 匹配字母或者數位字元
\W 匹配任意不是字母或數位字元
\s 匹配任意的空白符(空格、定位字元、分行符號)
\S 匹配任意不是空白符的字元
\d 匹配任一數字
\D 匹配任意非數位字元
\b 匹配單詞的結尾或者開頭的字元
\B 匹配任意不是單詞結尾或開頭的字元
[^x] 匹配任意非x的字元。如[^[a-z]]匹配非小寫字母的任一字元
^ 匹配字串的開頭
$ 匹配字串的結尾
修飾表達
* 匹配重複任意次數
+ 匹配重複一次以上的次數
? 匹配一次或零次
{n} 匹配重複n次
{n,} 匹配重複n次或n次以上
{n,m} 匹配重複最少n次最多m次
除了上面列出的字元外,還有包括表示位置指定等較難運用的其他Regex,但上面的字元已經足夠我們正常使用了。想瞭解更多知識可以度娘Google。
代碼實操
上面我們只是簡單的講解了Regex中各個字元代表的意義,那麼在iOS開發中應該怎麼使用。對於有意使用正則規則來匹配的開發人員,我的建議是封裝成為類別方法,一次封裝,多次調用。下面用我自己封裝的代碼進行說明。這些方法通過擴充UITextField方法來實現:
@interface UITextField (LXDValidate)
/*! 判斷文字框是否為空白(非Regex)*/
- (BOOL)isEmpty;
/*! 判斷郵箱是否正確*/
- (BOOL)validateEmail;
/*! 判斷驗證碼是否正確*/
- (BOOL)validateAuthen;
/*! 判斷密碼格式是否正確*/
- (BOOL)validatePassword;
/*! 判斷手機號碼是否正確*/
- (BOOL)validatePhoneNumber;
/*! 自己寫正則傳入進行判斷*/
- (BOOL)validateWithRegExp: (NSString *)regExp;
@end
方法實現檔案:
#import "UITextField+LXDValidate.h"@implementation UITextField (LXDValidate)- (BOOL)isEmpty{return self.text.length == ;}- (BOOL)validateEmail{return [self validateWithRegExp: @"^[a-zA-Z-]{,}@[a-z-A-Z]{,}\\.[a-zA-Z]{,}$"];}- (BOOL)validateAuthen{return [self validateWithRegExp: @"^\\d{,}$"];}- (BOOL)validatePassword{NSString * length = @"^\\w{,}$"; //長度NSString * number = @"^\\w*\\d+\\w*$"; //數字NSString * lower = @"^\\w*[a-z]+\\w*$"; //小寫字母NSString * upper = @"^\\w*[A-Z]+\\w*$"; //大寫字母return [self validateWithRegExp: length] && [self validateWithRegExp: number] && [self validateWithRegExp: lower] && [self validateWithRegExp: upper];}- (BOOL)validatePhoneNumber{NSString * reg = @"^\\d{}$";return [self validateWithRegExp: reg];}- (BOOL)validateWithRegExp: (NSString *)regExp{NSPredicate * predicate = [NSPredicate predicateWithFormat: @"SELF MATCHES %@", regExp];return [predicate evaluateWithObject: self.text];}@end
以上內容是小編給大家介紹的有關IOS開發常用的Regex,希望大家喜歡。