把一個字串中的字元從小寫轉為大寫

來源:互聯網
上載者:User
這是一個建立於 的文章,其中的資訊可能已經有所發展或是發生改變。

將字串裡面的英文小寫轉成大寫,是一個很簡單的操作。每個字元的編碼可以認為是整數,Golang裡面的byteruneuint8int32。其它語言大同小異。在編碼錶當中,位置是是從AZ,接著是azA對應的整數是65,a對應的整數是97,中間差了26個英文字母和6個其它字元的長度共32。所以轉換的方法就是,將小寫字母的值,剪掉32即可。

還是編碼的問題。最早的出現的編碼是ASCII,從128個增加到256個字元。再到後面的Unicode、GBK等,這些新出的編碼和最早的ASCII都是相容的,也就是說,不同的編碼裡面,前256位都是一樣的。所以,在這裡的英文字元轉大寫問題,不存在編碼問題。

這個題目在Golang的strings包裡有專門的實現ToUpper,此函數內部封裝了unicode包,在此包的letter.go檔案內,是具體的實現。

const MaxASCII = '\u007F'func toUpper(r rune) rune {if r <= MaxASCII {if 'a' <= r && r <= 'z' {r -= 'a' - 'A'}return r}return r}func ToUpper(s []rune) (res []rune) {for i := 0; i < len(s); i++ {res = append(res, toUpper(s[i]))}return res}func main() {a := "Hello, 世界"fmt.Println(string(ToUpper([]rune(a))))}

大Golang支援UTF8和Unicode兩種編碼方式。分別對應的資料類型是byterune。通過[]byte(str)[]rune(str)可以將字串轉成UTF8和UTF16兩種解析方式。解析的字串可能是中文,所以要按照rune處理。對於中文等其他字元,不做處理,所以增加了if r <= MaxASCII過濾。

還有要注意的一點,Golang語言層面實現了字串string。它不同於C語言裡面的字元數組,所以不能夠通過下標修改字串內容。只能通過下標讀取。

本文所涉及到的完整源碼請參考。

######參考文獻+ 【1】Source file src/pkg/strings/strings.go - The Go Programming Language+ 【2】ASCII - Wikipedia+ 【3】Source file src/pkg/unicode/letter.go - The Go Programming Language

原文連結:把一個字串中的字元從小寫轉為大寫,轉載請註明來源!

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.