Perl的經典用法分享

來源:互聯網
上載者:User

用Open() 函數開啟檔案

開啟檔案的常用方法是:

複製代碼 代碼如下:open(FH, "< $filename")
or die "Couldn't open $filename for reading: $!";

open() 函數通常帶有兩個參數,第一個為檔案控制代碼,用於指向開啟的檔案,第二個參數是檔案名稱及模式(檔案的開啟模式)的混合體,如果檔案被成功開啟,open()函數返回true,否則為false。我們用“or”來測試該條件。
上述代碼中的模式由小於字元(<)來表示。如果檔案不存在,open()將返回false。此時,你可以讀檔案控制代碼,但不可以寫。
大於字元表示寫。如果檔案不存在,就會被建立。如果檔案存在,檔案被清除,以前的資料將會丟失。你可以寫入檔案控制代碼,但不可以讀入。

複製代碼 代碼如下: # 如果檔案不存在,就建立它
open(FH, "> $filename")
or die "Couldn't open $filename for writing: $!";

如果檔案不存在,添加模式(用兩個大於符號表示)可以用來建立新檔案,如果檔案存在,該模式並不會清除原來的資料。
同“<”或“讀”模式一樣,你只能對檔案控制代碼進行寫操作。 (所以的寫入內容都添加到檔案尾)。企圖進行讀操作,會產生運行錯誤。

複製代碼 代碼如下:open(FH, ">> $filename")
or die "Couldn't open $filename for appending: $!";

通過“+<”模式,你可以既可以讀檔案,又可以寫檔案。你可以通過tell() 函數在檔案內部移動,通過seek()函數進行定位。如果檔案不存在,就會被建立。如果檔案已經存在,原來的資料不會被清除。
如果你打算清除原來的檔案內容,或者自己調用truncate() 函數,或者使用“+>”模式。

複製代碼 代碼如下:open(FH, "+> $filename")
or die "Couldn't open $filename for reading and writing: $!";

注意“+<”和“+>”的區別,兩者都可以可讀可寫。前者為非破壞性寫,後者為破壞性寫。
錯誤
錯誤是如何出現的?很多地方都會出現錯誤:如目錄不存在,檔案不可寫入,你的程式丟失了檔案控制代碼等等。
你應該檢查系統調用的結果 (如open() 和sysopen()),看看是否調用成功。
為了協助使用者查錯,通常使用“or die()”,你應記住這些用法。首先,應寫出系統調用失敗(“open”)的資訊。其次,應寫出檔案名稱的資訊,以便修正錯誤時更容易地定位。第三,要寫出開啟檔案的方式, (“for writing,”“for appending”)。第四,輸出作業系統的出錯資訊(包含在$!中)。這樣,一旦出現檔案不能開啟的問題,使用你的程式的使用者會大體上知道為什麼不能開啟。有時,我們把第一個和第三個合并在一起:
or die "unable to append to $filename: $!";

如果在open() 和出錯資訊中都寫了檔案的全名,你會冒改變了open() 的風險,使得出錯資訊不合時宜或不正確。

複製代碼 代碼如下: # 下面會出現虛假的出錯資訊
open(FH, "</var/run/file.pid")
or die "Can't open /var/log/file.pod for writing : $!";

用 Sysopen()進行更多的控制
為了更好的控制檔案的開啟檔案,可以使用 sysopen() 函數:複製代碼 代碼如下:use Fcntl;
sysopen(FH, $filename, O_RDWR|O_CREAT, 0666)
or die "Can't open $filename for reading/writing/creating : $!";

函數 sysopen() 帶有四個參數,第一個是同open()函數類似的檔案控制代碼參數,第二個參數是不帶模式資訊的檔案名稱,第三個參數是模式參數,由Fcntl 模組提供的邏輯OR運算組合起來的常數構成,第四個參數(可選),為八進位屬性值(0666表示資料檔案, 0777表示程式)。如果檔案可以被開啟,sysopen() 返回true,如果開啟失敗,則返回false。
不同於open()函數,sysopen()不提供模式說明的簡寫方式,而是把一些常數組合起來,而且,每個模式常數有唯一的含義,只有通過邏輯OR運算才能將它們組合起來,你可以設定多個行為的組合。
O_RDONLYRead-only
O_WRONLY Write-only
O_RDWR Reading and writing
O_APPEND Writes go to the end of the file
O_TRUNC Truncate the file if it existed
O_CREAT Create the file if it didn't exist
O_EXCLError if the file already existed (used with O_CREAT)

當你需要小心行事的時候,就使用sysopen() 函數,例如,如果你打算新增內容到檔案中,如果檔案不存在,不建立新檔案,你可以這樣寫:
sysopen(LOG, "/var/log/myprog.log", O_APPEND, 0666)
or die "Can't open /var/log/myprog.log for appending: $!";

讀入單個記錄
有一個容易的方法讀入filehandles:用 <FH> 操作符。在標量內容下,它返迴文件中的下一個記錄,或者返回未定義出錯資訊。我們可以使用它來把一行讀入到一個變數中:
$line = <FH>;
die "Unexpected end-of-file" unless defined $line;
在迴圈語句中,我們可以這樣寫:

複製代碼 代碼如下: while (defined ($record = <FH>)) { # long-winded
# $record is set to each record in the file, one at a time
}

因為要大量進行這樣的工作,通常再進行一下簡化,
把記錄放到$_ 中,而不是$record中:複製代碼 代碼如下:while (<FH>) {
# $_ 每次為檔案中的一個記錄
}
在Perl 5.004_04中,我們可以這樣做:
while ($record = <FH>) {
# $record 每次為檔案中的一個記錄
}

defined() 將自動加上,在Perl 5.004_04以前的版本中,該命令給出一個警示。要瞭解所用的Perl版本,可在命令列下打入:
perl -v
一旦我們讀出了一個記錄,通常打算去掉記錄分隔字元,(預設值為分行符號字元):
chomp($record);
Perl 4.0版本僅有chop()操作,去掉串的最後一個字元, 不管該字元是什麼。chomp() 沒有這麼大的破壞性,如果有行分隔字元存在,它僅去掉行分隔字元。如果你打算去掉行分隔字元,就用chomp() 來代替chop()。
讀入多個記錄
如果你調用<FH>,返迴文件中剩餘的記錄。如果你處於檔案尾,則返回空表:複製代碼 代碼如下:@records = <FH>;
if (@records) {
print "There were ", scalar(@records), " records read. ";
}

在下面的一步中,進行賦值和測試兩項工作:複製代碼 代碼如下:if (@records = <FH>) {
print "There were ", scalar(@records), " records read. ";
}

chomp() 也可適用對數組操作:
@records = <FH>;
chomp(@records);
對於任何錶達式,都可以進行chomp操作,故你可以在下面的一步中這樣寫:
chomp(@records = <FH>);

什麼是記錄?
記錄的預設定義為:“行”。
記錄的定義由$/ 變數控制的,該變數存放所輸入的記錄的分隔字元,因為分行符號字元(根據定義!)是用來分隔行的,故其預設值為串“ ”。
例如,你可以用任何你想要替換的符號來代替“ ”。
$/ = ";";
$record = <FH>; # 讀入下一個用分號分隔的記錄
$/可以取其它兩個有趣的值:空串("") 和undef。
讀入段落
$/ =""的寫法是用來指示Perl讀入段落的,段落是由兩個或兩個以上的分行符號構成的文字區塊。這不同於設定為" ",後者僅讀入由兩行組成的文字區塊。在這種情況下,將出現這樣一個問題:如果有連續的空行存在,例如“text ”,你既可以把它解釋為一個段落 ("text"),也可以解釋為兩個段落 ("text", 後面跟兩個分行符號,以及一個空段落,後面跟兩個空行。)
在讀入文本時,第二個解釋用途不大。如果你正在讀的段落出現上述情況,你不必過濾出“空”段落。

複製代碼 代碼如下:$/ = " ";
while (<FH>) {
chomp;
next unless length; # 跳過空段
# ...
}

你可以把 $/設定為undef,它用於讀入後面跟著兩個或多個分行符號組成的段落: undef $/;
while (<FH>) {
chomp;
# ...
}

讀入整個檔案
$/ 的其它有趣的值為undef。如果設定為該值,就將告訴Perl,讀命令將把檔案的剩餘部分作為一個串返回:

複製代碼 代碼如下:undef $/;
$file = <FH>;

因為改變了 $/的值,將會影響以後的每次讀操作,而不僅是下一個讀操作。通常,你需要將該操作限制在局部。通過下面的例子,可以把檔案控制代碼的內容讀入到一個串中:複製代碼 代碼如下:{
local $/ = undef;
$file = <FH>;
}

記住:Perl變數可讀入很長的串。儘管你的檔案大小不可以超出你的虛擬記憶體容量的限度,你仍可以讀入儘可能多的資料。
用Regex對檔案進行操作
一旦你有個包含了整個串的變數,你可以使用Regex,對整個檔案進行操作,而不是對檔案中的某個塊進行操作。有兩個有用的Regex標記/s和/m。一般,Perl的Regex對行進行處理,你可以這樣寫:複製代碼 代碼如下:undef $/;
$line = <FH>;
if ($line =~ /(b.*grass)$/) {
print "found ";
}

如果把我們的檔案填入如下內容:
browngrass
bluegrass
則輸出為:
found bluegrass
它沒有找到“browngrass”,這是因為$ 僅在串尾尋找其匹配, (或者在串結束前的一行)。如果在包含很多行的串中,用"^" 和"$" 來匹配,, 我們可以使用 /m ("multiline") 選項:
if ($line =~ /(b.*grass)$/m) {}
現在程式會把如下的資訊輸出:
found browngrass
類似地,句點可以匹配除了分行符號之外的所有字元:複製代碼 代碼如下:while (<FH>) {
if (/19(.*)$/) {
if ( < 20) {
$year = 2000+;
} else {
$year = 1900+;
}
}
}

如果我們從檔案中讀入“1981”,$_ 將包含“1981 ”。Regex中的句點匹配“8”和“1”, 而不匹配“ ”。這裡正需要這樣做,因為分行符號不是日期的組成部分。
對於一個包含很多行的串,我們也許要提取其中的大的塊,這些塊可能會跨越行分隔字元。在這種情況下,我們可以使用 /s 選項,並用句點來匹配除了分行符號以外的所有字元。複製代碼 代碼如下:if (ms) {
print "Found bold text: ";
}

此處,我用了{}來表示Regex的起始和結束,而不用斜杠,所以,我就可以告訴 Perl我配對,起始字元為"m",結束字元為"s"。你可以把/s 和/m 選項組合使用:複製代碼 代碼如下:if (m{^<FONT COLOR="red">(.*?)</FONT>}sm) {
# ...
}

總結
有兩種方法開啟檔案:open()函數的特點是快速簡捷,而sysopen()函數功能強大而複雜。通過 <FH> 操作符,可以讀入一個記錄,$/ 變數可以讓你控制記錄是什麼。如果你打算把很多行的內容讀入到一個串中,不要使用忘記/s和/m 這兩個Regex標記。

相關文章

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.