字串
一、概述
字串在javascript中幾乎無處不在,在你處理使用者的輸入資料的時候,在讀取或設定DOM對象的屬性時,在操作cookie時,當然還有更多...。JavaScript的核心部分提供了一組屬性和方法用於通用的字串操作,如分割字串,改變字串的大小寫,操作子字串等。
當前的大部分瀏覽器也能從強大的Regex獲益,因為它極大地簡化了大量的字串操作任務,不過它也需要你克服一條有些陡峭的學習曲線。在這裡,主要是介紹字串本身的一些操作,Regex會在以後的隨筆中涉及。
二、字串的建立
建立一個字串有幾種方法。最簡單的是用引號將一組字元包含起來,可以將其賦值給一個字串變數。
var myStr = "Hello, String!";
可以用雙引號或單引號將字串包含,但要注意,作為界定字串的一對引號必須是相同的,不能混用。
像var myString = "Fluffy is a pretty cat.'; 這樣的聲明就是非法的。
允許使用兩種引號,使得某些操作變得簡單,比如將一種嵌入另外一種:
document.write("<img src='/UploadPic/2007-4/200741192457191.jpg' height='30' width='100' alt='Logo'>");
我們在上面指令碼建立了幾個字串,但本質上,它們並不是真正的字串對象,準確地說,它們是字串類型的值。要建立一個字串對象,可使用如下語句:var strObj = new String("Hello, String!");
使用typeof運算子查看會發現,上面的myStr類型為string,而strObj類型為object。
如果想知道字串的長度,使用其length屬性:string.length。
得到字串的指定位置的字元使用方法:string.charAt(index);
三、字串的拼接
問題:
將兩個或多個字串拼接為一個大的字串
解決方案:
非常簡單,就用一個"+"將兩個字串"相加":
var longString = "One piece " + "plus one more piece.";
要將多個字串累積為一個字串,還可以使用"+="操作符:
var result = "";
result += "My name is Anders"
result += " and my age is 25";
要在字串中添加分行符號,需要使用逸出字元"\n":
var confirmString = "You did not enter a response to the last " +
"question.\n\nSubmit form anyway?";
var confirmValue = confirm(confirmString);
但這種方法只能用在像警告、確認對話方塊之類的情況下,如果將這段文本作為HTML內容呈現,就無效了,此時用"<br>"代替它:
var htmlString = "First line of string.<br>Second line of string.";
document.write(htmlString);
String對象還提供了方法concat(),它完成與"+"相同的功能:
string.concat(value1, value2, ...)
不過concat()方法顯然不如"+"來得直觀簡潔。
四、訪問字串的子串
問題:
獲得一字串的一部分的副本。
解決方案:
使用substring()或slice()方法(NN4+, IE4+),下面說明它們的具體用法。
substring()的原型為: string.substring(from, to)
第一個參數from指定了子字串在原字串中的起始位置(基於0的索引);第二個參數to是可選的,它指定了子字串在原字串的結束位置(基於0的索引),一般情況下,它應比from大,如果它被省略,那麼子字串將一直到原字串的結尾處。
如果參數from不小心比參數to大了會怎樣?JavaScript會自動調解子字串的起止位置,也就是說,substring()總是從兩個參數中較小的那個開始,到較大的那個結束。不過要注意,它包含起始位置的那個字元,但不包含結束位置的那個字元。
var fullString = "Every dog has his day.";
var section = fullString.substring(0, 4); // section is "Ever".
section = fullString.substring(4, 0); // section is also "Ever".
section = fullString.substring(1, 1); // section is an empty string.
section = fullString.substring(-2, 4); // section is "Ever", same as fullString.substring(0, 4); slice()的原型為: string.slice(start, end)
參數start表示子串的起始位置,如果為負數,那麼可以理解為倒數第幾個開始,例如-3表示從倒數第三個開始;參數end表示結束位置,與start一樣,它也可以為負數,其含義也表示到倒數第幾個結束。slice()的參數可以為負數,所以要比substring()更加靈活,但沒那麼寬容了,如果start比end要大,它將返回一個Null 字元串(樣本略)。
還有一個方法是substr(),其原型為: string.substr(start, length)
從原型可以看出它的參數的含義,start表示起始位置,length則表示子字串的長度。JavaScript標準不提倡使用該方法。
五、字串的大小寫轉換
問題:
在你的頁面上有文字框接收使用者的輸入資訊,比如城市,然後你會根據他的城市的不同做不同的處理,這時自然會用到字串比較,那麼在比較前,最好進行大小寫轉換,這樣只要考慮轉換後的情形即可;或者要在頁面上收集資料,然後將這些資料存放區在資料庫,而資料庫恰好只接收大寫字元;在這些情況下,我們都要考慮對字串進行大小寫轉換。
解決方案:
使用toLowerCase()和toUpperCase()方法:
var city = "ShanGHai";
city = city.toLowerCase(); // city is "shanghai" now.
六、判斷兩個字串是否相等
問題:
比如,你想拿使用者的輸入值與已知的字串比較
解決方案:
先將使用者的輸入值全部轉換為大寫(或小寫),然後再行比較:
var name = document.form1.txtUserName.value.toLowerCase();
if(name == "urname")
{
// statements go here.
}
JavaScript有兩種相等運算子。一種是完全向後相容的,標準的"==",如果兩個運算元類型不一致,它會在某些時候自動對運算元進行類型轉換,考慮下面的指派陳述式:
var strA = "i love you!";
var strB = new String("i love you!");
這兩個變數含有相同的字元序列,但資料類型卻不同,前者為string,後者為object,在使用"=="操作符時,JavaScript會嘗試各種求值,以檢測兩者是否會在某種情況下相等。所以下面的運算式結果為true: strA == strB。
第二種操作符是"嚴格"的"===",它在求值時不會這麼寬容,不會進行類型轉換。所以運算式strA === strB的值為false,雖然兩個變數持有的值相同。
有時代碼的邏輯要求你判斷兩個值是否不相等,這裡也有兩個選擇:"!="和嚴格的"!==",它們的關係就類似於"=="和"==="。
討論:
"=="和"!="在求值時會儘可能地尋找值的匹配性,但你可能還是想在比較前進行顯式的類型轉換,以"協助"它們完成工作。比如,如果想判斷一個使用者的輸入值(字串)是否等於一個數字,你可以讓"=="幫你完成類型轉換:
if(document.form1.txtAge.value == someNumericVar) { ... }
也可以提前轉換:
if(parseInt(document.form1.txtAge.value) == someNumericVar) { ... }
如果你比較習慣於強型別的程式設計語言(比如C#,Java等),那麼這裡你可以延續你的習慣(類型轉換),這樣也會增強程式的可讀性。
有一種情況需要注意,就是電腦的地區設定。如果用"<"和">"來比較字串,那麼JavaScript把它們作為Unicode來比較,但顯然,人們在瀏覽網頁時不會把文本當作Unicode來閱讀:) 比如在西班牙語中,按照傳統的排序,"ch"將作為一個字元排在"c"和"d"之間。localeCompare()提供了一種方式,可以協助你使用預設區域設定下的字元定序。
var strings; // 要排序的字串數組,假設已經得到初始化
strings.sort(function(a,b) { return a.localeCompare(b) }); // 調用sort()方法進行排序
七、字串的尋找
問題:
判斷一個字串是否包含另一個字串。
解決方案:
使用string的indexOf()方法:
strObj.indexOf(subString[, startIndex])
strObj為要進行判斷的字串,subString為要在strObj尋找的子字串,startIndex是可選的,表示尋找的開始位置(基於0的索引),如果startIndex省略,則從strObj開始處尋找,如果startIndex小於0,則從0開始,如果startIndex大於最大索引,則從最大索引處開始。
indexOf()返回strObj中subString的開始位置,如果沒有找到,則返回-1。在指令碼中,可以這麼使用:
if(largeString.indexOf(shortString) != -1)
{
// 如果包含,進行相應處理;
}
也許一個字串會包含另一字串不止一次,這時第二個參數startIndex也許會派上用場,下面這個函數示範如何求得一個字串包含另外一個字串的次數:
function countInstances(mainStr, subStr)
{
var count = 0;
var offset = 0;
do
{
offset = mainStr.indexOf(subStr, offset);
if(offset != -1)
{
count++;
offset += subStr.length;
}
}while(offset != -1)
return count;
}
String對象有一個與indexOf()對應的方法,lastIndexOf():
strObj.lastIndexOf(substring[, startindex])
strObj為要進行判斷的字串,subString為要在strObj尋找的子字串,startIndex是可選的,表示尋找的開始位置(基於0的索引),如果startIndex省略,則從strObj末尾處尋找,如果startIndex小於0,則從0開始,如果startIndex大於最大索引,則從最大索引處開始。該方法自右向左尋找,返回subString在strObj中最後出現的位置,如果沒有找到,返回-1。
八、在Unicode值和字串中的字元間轉換
問題:
獲得一個字元的Unicode編碼值,反之亦然。
解決方案:
要獲得字元的Unicode編碼,可以使用string.charCodeAt(index)方法,其定義為:
strObj.charCodeAt(index)
index為指定字元在strObj對象中的位置(基於0的索引),傳回值為0與65535之間的16位整數。例如:
var strObj = "ABCDEFG";
var code = strObj.charCodeAt(2); // Unicode value of character 'C' is 67
如果index指定的索引處沒有字元,則傳回值為NaN。
要將Unicode編碼轉換為一個字元,使用String.fromCharCode()方法,注意它是String對象的一個"靜態方法",也就是說在使用前不需要建立字串執行個體:
String.fromCharCode(c1, c2, ...)
它接受0個或多個整數,返回一個字串,該字串包含了各參數指定的字元,例如:
var str = String.fromCharCode(72, 101, 108, 108, 111); // str == "Hello"
討論:
Unicode包含了這個世界上很多書寫語言的字元集,但別因為Unicode包含一個字元就期望這個字元能夠在警告對話方塊、文字框或頁面呈現時正常顯示。如果字元集不可用,在頁面將顯示為問號或其它符號。一台典型的北美的電腦將不能在螢幕上顯示中文字元,除非中文的字元集及其字型已經安裝。
參考:
JavaScript And Dhtml Cookbook(Oreilly) ;
JavaScript-The Definitive Guide(4th Edition);