Linux命令列裡的“瑞士軍刀”

來源:互聯網
上載者:User

這裡說的“瑞士軍刀”是指那些簡單的一句命令就能完成其它進階語言一大片代碼才能完成的工作。

下面的這些內容是Quora網站上Joshua Levy網友的總結:

通過sort/uniq擷取檔案內容的交集、合集和不同之處:假設有a、b兩個文字檔,檔案本身已經去除了重複內容。下面是效率最高的方法,可以處理任何體積的檔案,甚至幾個G的檔案。(Sort對記憶體沒有要求,但也許你需要用 -T 參數。)可以試著比較一下,你可以看看如果用Java來處理磁碟上檔案的合并,需要用多少行代碼。

複製代碼 代碼如下:cat a b | sort | uniq > c # c 是a和b的合集
cat a b | sort | uniq -d > c # c 是a和b的交集
cat a b b | sort | uniq -u > c # c 是a和b的不同

匯總一個常值內容裡第三列數位和(這個方法要比用Python來做快3倍並只需1/3的代碼量):

複製代碼 代碼如下: awk ‘{ x += $3 } END { print x }' myfile

如果你想查看一個分類樹裡的檔案的體積和修改日期,用下面的方法,相當於你挨個目錄做”ls -l”,而且輸出的形式比你用”ls -lR”更可讀: 複製代碼 代碼如下:find . -type f -ls

使用xargs命令。這個命令非常的強大。注意每行上你可以控制多少個東西的執行。如果你不確定它是正確的執行,先使用xargs echo。同樣,-I{} 也非常有用。例子:

複製代碼 代碼如下:find . -name \*.py | xargs grep some_function
cat hosts | xargs -I{} ssh root@{} hostname

假設你有一個文字檔,比如一個web伺服器日誌,在某些行上有一些值,比如URL中的acct_id參數。如果你想統計每個acct_id的所有請求記錄:

複製代碼 代碼如下:cat access.log | egrep -o ‘acct_id=[0-9]+' | cut -d= -f2 | sort | uniq -c | sort -rn ]

[英文原文:What are the most useful "Swiss army knife" one-liners on Unix?

相關文章

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

Tags Index: