Ruby中操作字串的一些基本方法
這篇文章主要介紹了Ruby中操作字串的一些基本方法,包括對字串的壓縮和解壓縮等處理,需要的朋友可以參考下
在Ruby中的String對象持有和操縱的任意序列的一個或多個位元組,通常表示人類語言的字元表示。
簡單的字串文本括在單引號(單引號字元)。引號內的文本的字串值:
?
1 |
'This is a simple Ruby string literal' |
如果需要內放置一個單引號,單引號的字串文字,在它前面加上一個反斜線Ruby解譯器不認為終止字串:
?
1 |
'Won't you read O'Reilly's book?' |
反斜線也可以轉義另一個反斜線,這樣第二個反斜線本身不是解釋為逸出字元。
以下是字串相關的功能Ruby的。
運算式替換:
運算式替換嵌入任何Ruby運算式的值轉換成字串使用的一種手段,可用 #{ and }替換:
?
1 2 3 4 5 6 |
#!/usr/bin/ruby x, y, z = 12, 36, 72 puts "The value of x is #{ x }." puts "The sum of x and y is #{ x + y }." puts "The average was #{ (x + y + z)/3 }." |
這將產生以下結果:
?
1 2 3 |
The value of x is 12. The sum of x and y is 48. The average was 40. |
一般分隔的字串:
一般分隔的字串,可以建立字串匹配任意分隔字元,比如,雖然包含在一對,如:., !, (, {, <, 等,前面加上一個百分比符號(%). Q, q 和 x,有特殊的含義一般可以分隔的字串。
?
1 2 3 4 |
%{Ruby is fun.} equivalent to "Ruby is fun." %Q{ Ruby is fun. } equivalent to " Ruby is fun. " %q[Ruby is fun.] equivalent to a single-quoted string %x!ls! equivalent to back tick command output `ls` |
逸出字元:
下表是轉義或反斜線符號可以表示非列印字元列表。
注: 在雙引號的字串,被解釋為逸出字元,在一個單引號字元的逸出字元被保留。
字元編碼方式:
Ruby的預設字元集是ASCII碼,字元可能會由單位元組表示。如果使用UTF-8或另一種現代的字元集,字元可能會以四個位元組表示。
可以更改字元集使用$KCODE的在程式的開始行,像這樣:
?
以下是 $KCODE 可能的值
字串的內建方法:
我們需要有一個String對象執行個體調用一個String方法。以下的方法來建立String對象的一個執行個體:
?
1 |
new [String.new(str="")] |
這將返回一個新的字串對象,其中包含str的一個副本。現在使用str的對象,我們可以任何可用執行個體方法的。例如:
?
1 2 3 4 |
#!/usr/bin/ruby myStr = String.new("THIS IS TEST") foo = myStr.downcase |
?
這將產生以下結果:
?
字串的解壓指令:
下表列出瞭解壓指令方法 String#unpack.
例子:
試試下面的例子來解壓縮各種資料。
?
1 2 3 4 5 6 7 8 |
"abc abc ".unpack('A6Z6') #=> ["abc", "abc "] "abc ".unpack('a3a3') #=> ["abc", " 0000"] "abc abc ".unpack('Z*Z*') #=> ["abc ", "abc "] "aa".unpack('b8B8') #=> ["10000110", "01100001"] "aaa".unpack('h2H2c') #=> ["16", "61", 97] "xfexffxfexff".unpack('sS') #=> [-2, 65534] "now=20is".unpack('M*') #=> ["now is"] "whole".unpack('xax2aX2aX1aX2a') #=> ["h", "e", "l", "l", "o"] |