Perl遍曆目錄和使用Linux命令分析日誌的代碼執行個體分享_應用技巧

來源:互聯網
上載者:User

執行個體代碼:

複製代碼 代碼如下:

#! /usr/bin/perl -w
$path = '/root/Documents';  # 當前工作目錄
$dir = "$path/images"; # 要遍曆的目錄
$log_file = "$path/access_201209.log"; # nginx日誌0903~0907,  filesize: 5.4G
$result_file = 'result.f';  # 放置結果的檔案

if(!open $output, ">>$result_file") { # 以追加的形式開啟檔案
         die " Open file failed: $!";
}
&find_dir($dir);

sub find_dir() {
        my $base_dir = $_[0]; # $_[0]表示子常式(函數)的第一個參數
        if( !opendir(DIR,"$base_dir") ) {
                warn "open dir failed: $! \n";
        }
        my @father_dir = readdir(DIR); # 資源轉儲
        closedir(DIR);                 

        $base_dir =~ s/\/$//; # 刪除目錄最後面的 /
        foreach $sub_dir (@father_dir) {
                if($sub_dir =~ /^\./)  { # 過濾掉 . 和 .. 以及 隱藏檔案
                        next;
                }

                if(-d "$base_dir/$sub_dir") { # 如果是目錄則回調
                     &find_dir("$base_dir/$sub_dir"); # 引用遞迴函式,避免在記憶體中開闢多個副本

                }elsif (-f "$base_dir/$sub_dir") { # 如果是檔案則....

                 # 檔案前面保留一個空格,這樣才能保證不會搜尋到 theme_skin/blue/images 這樣的目錄
                 my $this_file = " $base_dir/$sub_dir";
                 $this_file =~ s/$path//;           # 刪除掉字串 /root/Documents

                 # 使用Linux命令,在 [$log_file檔案] 中尋找 [$this_file字串] 並統計字串出現的次數
                 my $result = `grep -c  "$this_file"  $log_file`;  # $this_file要用雙引號括起來,防止圖片名稱中有空格造成程式錯誤
                 chomp  $result ;  # 刪除Linux執行命令後,傳回值所帶有的分行符號
                 print $output "$this_file :         $result \n";  # 將處理結果寫入$output指定的檔案

                 # 已經記錄過的檔案刪除掉,這樣每次終止指令碼的時候,都能繼續之前的內容進行尋找
                 unlink "$base_dir/$sub_dir";
                }
        }
}

print "\n Finished \n";

# 現在開啟 result.f 檔案,把 /images/ 替換成 images/   這樣才能在當前工作目錄中刪除檔案
# Linux命令尋找5天內被訪問0次的記錄,並刪除
# 數字0 左右兩邊要有空格,防止找到檔案名稱中含有0的記錄

# 方法 1 :
# gawk -F ':' '$2 ~ / 0 / {print $1}' result.f | xargs rm -rf

# 方法 2 :  (完全等同 方法1)
# grep ' 0 ' result.f | gawk -F ':' '{print $1}' | xargs rm -rf

相關文章

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.