Perl的檔案操作(2)(適合初學者)

來源:互聯網
上載者:User
 

讀入多個記錄
如果你調用,返迴文件中剩餘的記錄。如果你處於檔案尾,則返回空表:

@records = ;

if (@records) {

print "There were ", scalar(@records), " records read.n";

}

在下面的一步中,進行賦值和測試兩項工作:

if (@records = ) {

print "There were ", scalar(@records), " records read.n";

}

chomp() 也可適用對數組操作:

@records = ;

chomp(@records);

對於任何錶達式,都可以進行chomp操作,故你可以在下面的一步中這樣寫:

chomp(@records = );

什麼是記錄?

記錄的預設定義為:“行”。

記錄的定義由$/ 變數控制的,該變數存放所輸入的記錄的分隔字元,因為分行符號字元(根據定義!)是用來分隔行的,故其預設值為串“n”。

例如,你可以用任何你想要替換的符號來代替“n”。

$/ = ";";

$record = ; # 讀入下一個用分號分隔的記錄

$/可以取其它兩個有趣的值:空串("") 和undef。

讀入段落
$/ =""的寫法是用來指示Perl讀入段落的,段落是由兩個或兩個以上的分行符號構成的文字區塊。這不同於設定為"nn",後者僅讀入由兩行組成的文字區塊。在這種情況下,將出現這樣一個問題:如果有連續的空行存在,例如“textnnnn”,你既可以把它解釋為一個段落 ("text"),也可以解釋為兩個段落 ("text", 後面跟兩個分行符號,以及一個空段落,後面跟兩個空行。)

在讀入文本時,第二個解釋用途不大。如果你正在讀的段落出現上述情況,你不必過濾出“空”段落。

$/ = "nn";

while () {

chomp;

next unless length; # 跳過空段

# ...

}

你可以把 $/設定為undef,它用於讀入後面跟著兩個或多個分行符號組成的段落: undef $/;

while () {

chomp;

# ...

}

讀入整個檔案

$/ 的其它有趣的值為undef。如果設定為該值,就將告訴Perl,讀命令將把檔案的剩餘部分作為一個串返回:

undef $/;

$file = ;

因為改變了 $/的值,將會影響以後的每次讀操作,而不僅是下一個讀操作。通常,你需要將該操作限制在局部。通過下面的例子,可以把檔案控制代碼的內容讀入到一個串中:

{

local $/ = undef;

$file = ;

}

記住:Perl變數可讀入很長的串。儘管你的檔案大小不可以超出你的虛擬記憶體容量的限度,你仍可以讀入儘可能多的資料。
用Regex對檔案進行操作
一旦你有個包含了整個串的變數,你可以使用Regex,對整個檔案進行操作,而不是對檔案中的某個塊進行操作。有兩個有用的Regex標記/s和/m。一般,Perl的Regex對行進行處理,你可以這樣寫:

undef $/;

$line = ;

if ($line =~ /(b.*grass)$/) {

print "found $1n";

}

如果把我們的檔案填入如下內容:
browngrass

bluegrass

則輸出為:

found bluegrass

它沒有找到“browngrass”,這是因為$ 僅在串尾尋找其匹配, (或者在串結束前的一行)。如果在包含很多行的串中,用"^" 和"$" 來匹配,, 我們可以使用 /m ("multiline") 選項:

if ($line =~ /(b.*grass)$/m) {}

現在程式會把如下的資訊輸出:

found browngrass

類似地,句點可以匹配除了分行符號之外的所有字元:

while () {

if (/19(.*)$/) {

if ($1 < 20) {

$year = 2000+$1;

} else {

$year = 1900+$1;

}

}

}

如果我們從檔案中讀入“1981”,$_ 將包含“1981n”。Regex中的句點匹配“8”和“1”, 而不匹配“n”。這裡正需要這樣做,因為分行符號不是日期的組成部分。

對於一個包含很多行的串,我們也許要提取其中的大的塊,這些塊可能會跨越行分隔字元。在這種情況下,我們可以使用 /s 選項,並用句點來匹配除了分行符號以外的所有字元。

if (m{(.*?)}s) {

print "Found bold text: $1n";

}

此處,我用了{}來表示Regex的起始和結束,而不用斜杠,所以,我就可以告訴 Perl我配對,起始字元為"m",結束字元為"s"。你可以把/s 和/m 選項組合使用:

if (m{^(.*?)}sm) {

# ...

}

總結
有兩種方法開啟檔案:open()函數的特點是快速簡捷,而sysopen()函數功能強大而複雜。通過 操作符,可以讀入一個記錄,$/ 變數可以讓你控制記錄是什麼。如果你打算把很多行的內容讀入到一個串中,不要使用忘記/s和/m 這兩個Regex標記。

相關文章

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.