執行個體代碼:
複製代碼 代碼如下:
#! /usr/bin/perl -w
$path = '/root/Documents'; # 當前工作目錄
$dir = "$path/images"; # 要遍曆的目錄
$log_file = "$path/access_201209.log"; # nginx日誌0903~0907, filesize: 5.4G
$result_file = 'result.f'; # 放置結果的檔案
if(!open $output, ">>$result_file") { # 以追加的形式開啟檔案
die " Open file failed: $!";
}
&find_dir($dir);
sub find_dir() {
my $base_dir = $_[0]; # $_[0]表示子常式(函數)的第一個參數
if( !opendir(DIR,"$base_dir") ) {
warn "open dir failed: $! \n";
}
my @father_dir = readdir(DIR); # 資源轉儲
closedir(DIR);
$base_dir =~ s/\/$//; # 刪除目錄最後面的 /
foreach $sub_dir (@father_dir) {
if($sub_dir =~ /^\./) { # 過濾掉 . 和 .. 以及 隱藏檔案
next;
}
if(-d "$base_dir/$sub_dir") { # 如果是目錄則回調
&find_dir("$base_dir/$sub_dir"); # 引用遞迴函式,避免在記憶體中開闢多個副本
}elsif (-f "$base_dir/$sub_dir") { # 如果是檔案則....
# 檔案前面保留一個空格,這樣才能保證不會搜尋到 theme_skin/blue/images 這樣的目錄
my $this_file = " $base_dir/$sub_dir";
$this_file =~ s/$path//; # 刪除掉字串 /root/Documents
# 使用Linux命令,在 [$log_file檔案] 中尋找 [$this_file字串] 並統計字串出現的次數
my $result = `grep -c "$this_file" $log_file`; # $this_file要用雙引號括起來,防止圖片名稱中有空格造成程式錯誤
chomp $result ; # 刪除Linux執行命令後,傳回值所帶有的分行符號
print $output "$this_file : $result \n"; # 將處理結果寫入$output指定的檔案
# 已經記錄過的檔案刪除掉,這樣每次終止指令碼的時候,都能繼續之前的內容進行尋找
unlink "$base_dir/$sub_dir";
}
}
}
print "\n Finished \n";
# 現在開啟 result.f 檔案,把 /images/ 替換成 images/ 這樣才能在當前工作目錄中刪除檔案
# Linux命令尋找5天內被訪問0次的記錄,並刪除
# 數字0 左右兩邊要有空格,防止找到檔案名稱中含有0的記錄
# 方法 1 :
# gawk -F ':' '$2 ~ / 0 / {print $1}' result.f | xargs rm -rf
# 方法 2 : (完全等同 方法1)
# grep ' 0 ' result.f | gawk -F ':' '{print $1}' | xargs rm -rf