本文我們學習如何用Perl對字串或者數字數組進行排序。
Perl有個內建函數叫做sort毫無疑問的可以排序一個數組。 其最簡單的形式是傳遞一個數組,它會返回排序後的元素組成的數組。@sorted = sort @original。
基於ASCII碼排序
複製代碼 代碼如下:
#!/usr/bin/perl
use strict;
use warnings;
use 5.010;
use Data::Dumper qw(Dumper);
my @words = qw(foo bar zorg moo);
say Dumper \@words;
my @sorted_words = sort @words;
say Dumper \@sorted_words;
上邊的例子將會列印
複製代碼 代碼如下:
$VAR1 = [
'foo',
'bar',
'zorg',
'moo'
];
$VAR1 = [
'bar',
'foo',
'moo',
'zorg'
];
第一個輸出顯示了排序前的數組,第二個是排序後的。
這是最簡單的情形,但是可能未必是你想要的。 比如,如果一些單詞以大寫字母開頭怎麼辦?
複製代碼 代碼如下:
my @words = qw(foo bar Zorg moo);
@sorted_names裡的結果將是:
$VAR1 = [
'Zorg',
'bar',
'foo',
'moo'
];
你會發現,以大寫字母開頭的單詞排在了第一位。 這是因為sort預設根據ASCII碼錶排序,所有的大寫字母都排在小寫字母前邊。
比較函數
Perl的sort的工作方式是這樣的,它遍曆原始數組的每兩個元素;每次把左邊的值放入變數$a,把右邊的值放入變數$b。 然後調用比較函數。如果$a的內容應該在左邊的話,“比較函數”會返回1;如果$b應該在左邊的話,返回-1,兩者一樣的話,返回0。
通常你看不到比較函數,sort會根據ASCII碼錶對值進行比較,不過如果你想的話,你可以顯式的寫出來:
複製代碼 代碼如下:
sort { $a cmp $b } @words;
這段代碼會跟沒有使用塊的sort @words達到同樣的效果。
這裡你可以看到,預設perl使用cmp作為比較函數。這是因為正是cmp可以做這裡邊我們需要的工作。 它比較兩邊的字串的值,如果左邊參數“小於”右邊參數,就返回1;如果左邊參數“大於”右邊參數,就返回-1;如果相等,就返回0。
按字母順序排列
如果你想忽略字串的大小寫來排序——即通常所謂的字母序,你可以像下一個例子這麼做:
複製代碼 代碼如下:
my @sorted_words = sort { lc($a) cmp lc($b) } @words;
這裡為了比較,我們調用lc函數返回參數的小寫版本。然後cmp比較這些小寫版本並決定原始字串誰先誰後。
結果是
複製代碼 代碼如下:
$VAR1 = [
'bar',
'foo',
'moo',
'Zorg'
];
Perl對數值排序
如果對數值數組使用sort進行預設的排序,結果可能不是我們期望的。
複製代碼 代碼如下:
my @numbers = (14, 3, 12, 2, 23);
my @sorted_numbers = sort @numbers;
say Dumper \@sorted_numbers;
$VAR1 = [
12,
14,
2,
23,
3
];
仔細一想的話,這並不奇怪。比較函數看到12和3時,它按字串進行比較。這意味著比較兩個字串的第一個字元"1"和"3"。 在ASCII碼錶裡,"1"在"3"前邊,因此字串"12"會排在字串"3"前面。
Perl不會很神奇地猜到你想按數字對這些值排序。
儘管我們可以寫一個比較函數來按數字比較兩個值。但這裡我們使用<=>(也被稱作宇宙飛船操作符), 它會按數字來比較兩個參數並返回1、-1或者0。
複製代碼 代碼如下:
my @sorted_numbers = sort { $a <=> $b } @numbers;
結果是:
複製代碼 代碼如下:
$VAR1 = [
2,
3,
12,
14,
23
];