W3C那幫人的腦袋被驢踢了,直到javascript1.8.1才支援trim函數(與trimLeft,trimRight),可惜現在只有firefox3.5支援。由於去除字串兩邊的空白實在太常用,各大類庫都有它的影子。加之,外國人都很有研究精神,搞鼓了相當多實現。
實現1
1.
String.prototype.trim =
function
() {
2.
return
this
.replace(/^\s\s*/,
''
).replace(/\s\s*$/,
''
);
3.
}
看起來不怎麼樣,動用了兩次正則替換,實際速度非常驚人,主要得益於瀏覽器的內部最佳化。一個著名的例子字串拼接,直接相加比用Array做成的StringBuffer還快。base2類庫使用這種實現。
實現2
1.
String.prototype.trim =
function
() {
2.
return
this
.replace(/^\s+/,
''
).replace(/\s+$/,
''
);
3.
}
和實現1很相似,但稍慢一點,主要原因是它最先是假設至少存在一個空白符。Prototype.js使用這種實現,不過其名字為strip,因為Prototype的方法都是力求與Ruby同名。
實現3
1.
String.prototype.trim =
function
() {
2.
return
this
.substring(Math.max(
this
.search(/\S/), 0),
this
.search(/\S\s*$/) + 1);
3.
}
以截取方式取得空白部分(當然允許中間存在空白符),總共調用了四個原生方法。設計得非常巧妙,substring以兩個數字作為參數。Math.max以兩個數字作參數,search則返回一個數字。速度比上面兩個慢一點,但比下面大多數都快。
實現4
1.
String.prototype.trim =
function
() {
2.
return
this
.replace(/^\s+|\s+$/g,
''
);
3.
}
這個可以稱得上實現2的簡化版,就是利用候選操作符串連兩個正則。但這樣做就失去了瀏覽器最佳化的機會,比不上實現3。由於看來很優雅,許多類庫都使用它,如JQuery與mootools
實現5
1.
String.prototype.trim =
function
() {
2.
var
str =
this
;
3.
str = str.match(/\S+(?:\s+\S+)*/);
4.
return
str ? str[0] :
''
;
5.
}
match是返回一個數組,因此原字串符合要求的部分就成為它的元素。為了防止字串中間的空白符被排除,我們需要動用到非捕獲性分組(?:exp)。由於數組可能為空白,我們在後面還要做進一步的判定。好像瀏覽器在處理分組上比較無力,一個字慢。所以不要迷信正則,雖然它基本上是萬能的。
實現6
1.
String.prototype.trim =
function
() {
2.
return
this
.replace(/^\s*(\S*(\s+\S+)*)\s*$/,
'$1'
);
3.
}
把符合要求的部分提供出來,放到一個Null 字元串中。不過效率很差,尤其是在IE6中。
實現7
1.
String.prototype.trim =
function
() {
2.
return
this
.replace(/^\s*(\S*(?:\s+\S+)*)\s*$/,
'$1'
);
3.
}
和實現6很相似,但用了非捕獲分組進行了優點,效能效之有一點點提升。
實現8
1.
String.prototype.trim =
function
() {
2.
return
this
.replace(/^\s*((?:[\S\s]*\S)?)\s*$/,
'$1'
);
3.
}
沿著上面兩個的思路進行改進,動用了非捕獲分組與字元集合,用?頂替了*,效果非常驚人。尤其在IE6中,可以用瘋狂來形容這次效能的提升,直接秒殺Firefox。
實現9
1.
String.prototype.trim =
function
() {
2.
return
this
.replace(/^\s*([\S\s]*?)\s*$/,
'$1'
);
3.
}
這次是用懶惰匹配頂替非捕獲分組,在Firefox中得到改善,IE沒有上次那麼瘋狂。
實現10
01.
String.prototype.trim =
function
() {
02.
var
str =
this
,
03.
whitespace =
' \n\r\t\f\x0b\xa0\u2000\u2001\u2002\u2003\u2004\u2005\u2006\u2007\u2008\u2009\u200a\u200b\u2028\u2029\u3000'
;
04.
for
(
var
i = 0,len = str.length; i < len; i++) {
05.
if
(whitespace.indexOf(str.charAt(i)) === -1) {
06.
str = str.substring(i);
07.
break
;
08.
}
09.
}
10.
for
(i = str.length - 1; i >= 0; i--) {
11.
if
(whitespace.indexOf(str.charAt(i)) === -1) {
12.
str = str.substring(0, i + 1);
13.
break
;
14.
}
15.
}
16.
return
whitespace.indexOf(str.charAt(0)) === -1 ? str :
''
;
17.
}
我只想說,搞出這個的人已經不是用牛來形容,已是神一樣的層級。它先是把可能的空白符全部列出來,在第一次遍曆中砍掉前面的空白,第二次砍掉後面的空白。全過程只用了indexOf與substring這個專門為處理字串而生的原生方法,沒有使用到正則。速度快得驚人,估計直逼上內部的二進位實現,並且在IE與Firefox(其他瀏覽器當然也毫無疑問)都有良好的表現。速度都是零毫秒層級的。
實現11
01.
String.prototype.trim =
function
() {
02.
var
str =
this
,
03.
str = str.replace(/^\s+/,
''
);
04.
for
(
var
i = str.length - 1; i >= 0; i--) {
05.
if
(/\S/.test(str.charAt(i))) {
06.
str = str.substring(0, i + 1);
07.
break
;
08.
}
09.
}
10.
return
str;
11.
}
實現10已經告訴我們普通的原生字串截取方法是遠勝於正則替換,雖然是複雜一點。但只要正則不過於複雜,我們就可以利用瀏覽器對正則的最佳化,改善程式執行效率,如實現8在IE的表現。我想通常不會有人在項目中應用實現10,因為那個whitespace 實現太長太難記了(當然如果你在打造一個類庫,它絕對是首先)。實現11可謂其改進版,前面部分的空白由正則替換負責砍掉,後面用原生方法處理,效果不遜於原版,但速度都是非常逆天。
實現12
1.
String.prototype.trim =
function
() {
2.
var
str =
this
,
3.
str = str.replace(/^\s\s*/,
''
),
4.
ws = /\s/,
5.
i = str.length;
6.
while
(ws.test(str.charAt(--i)));
7.
return
str.slice(0, i + 1);
8.
}
實現10與實現11在寫法上更好的改進版,注意說的不是效能速度,而是易記與使用上。和它的兩個前輩都是零毫秒層級的,以後就用這個來工作與嚇人。
下面是老外給出的比較結果,執行背景是對Magna Carta 這文章(超過27,600字元)進行trim操作。
實現 |
Firefox 2 |
IE 6 |
trim1 |
15ms |
< 0.5ms |
trim2 |
31ms |
< 0.5ms |
trim3 |
46ms |
31ms |
trim4 |
47ms |
46ms |
trim5 |
156ms |
1656ms |
trim6 |
172ms |
2406ms |
trim7 |
172ms |
1640ms |
trim8 |
281ms |
< 0.5ms |
trim9 |
125ms |
78ms |
trim10 |
< 0.5ms |
< 0.5ms |
trim11 |
< 0.5ms |
< 0.5ms |
trim12 |
< 0.5ms |
< 0.5ms |
原文連結:http://blog.stevenlevithan.com/archives/faster-trim-javascript