這是一個建立於 的文章,其中的資訊可能已經有所發展或是發生改變。
將字串裡面的英文小寫轉成大寫,是一個很簡單的操作。每個字元的編碼可以認為是整數,Golang裡面的byte和rune是uint8和int32。其它語言大同小異。在編碼錶當中,位置是是從A到Z,接著是a到z,A對應的整數是65,a對應的整數是97,中間差了26個英文字母和6個其它字元的長度共32。所以轉換的方法就是,將小寫字母的值,剪掉32即可。
還是編碼的問題。最早的出現的編碼是ASCII,從128個增加到256個字元。再到後面的Unicode、GBK等,這些新出的編碼和最早的ASCII都是相容的,也就是說,不同的編碼裡面,前256位都是一樣的。所以,在這裡的英文字元轉大寫問題,不存在編碼問題。
這個題目在Golang的strings包裡有專門的實現ToUpper,此函數內部封裝了unicode包,在此包的letter.go檔案內,是具體的實現。
const MaxASCII = '\u007F'func toUpper(r rune) rune {if r <= MaxASCII {if 'a' <= r && r <= 'z' {r -= 'a' - 'A'}return r}return r}func ToUpper(s []rune) (res []rune) {for i := 0; i < len(s); i++ {res = append(res, toUpper(s[i]))}return res}func main() {a := "Hello, 世界"fmt.Println(string(ToUpper([]rune(a))))}
大Golang支援UTF8和Unicode兩種編碼方式。分別對應的資料類型是byte和rune。通過[]byte(str)和[]rune(str)可以將字串轉成UTF8和UTF16兩種解析方式。解析的字串可能是中文,所以要按照rune處理。對於中文等其他字元,不做處理,所以增加了if r <= MaxASCII過濾。
還有要注意的一點,Golang語言層面實現了字串string。它不同於C語言裡面的字元數組,所以不能夠通過下標修改字串內容。只能通過下標讀取。
本文所涉及到的完整源碼請參考。
######參考文獻+ 【1】Source file src/pkg/strings/strings.go - The Go Programming Language+ 【2】ASCII - Wikipedia+ 【3】Source file src/pkg/unicode/letter.go - The Go Programming Language
原文連結:把一個字串中的字元從小寫轉為大寫,轉載請註明來源!