shell中使用sort和uniq實現兩檔案的並集,交集和差集

來源:互聯網
上載者:User

網上轉的,不錯,比使用awk容易點


給定兩個檔案 a.txt 和 b.txt ,每行是一個記錄(假設沒有重複),要求輸出兩集合的交集、並集、差集,輸出的結果只包括唯一項。交集定義為同時出現在兩個檔案中的記錄項,並集定義為出現在任何一個檔案中的記錄項,差集(A-B)定義為出現在A中而且不出現在B中的記錄,對稱差集定義為只出現在一個檔案中的記錄。
假設 a.txt 包括 a, c, b 三行。假設 b.txt 包括 d, e, c, b 四行。

交集,把兩個檔案放到一起排序,只輸出次數多於一次的項:
$ sort a.txt b.txt | uniq -d
b
c

並集,把兩個檔案放到一起排序,重複的項只算一次:
$ sort a.txt b.txt | uniq
a
b
c
d
e

差集(A-B),把B的元素重複2份和A的元素放到一起排序,只輸出出現一次的項:
$ sort a.txt b.txt b.txt | uniq -u
a

對稱差,把兩個檔案放到一起排序,只輸出出現一次的項:
$ sort a.txt b.txt | uniq -u
a
d

e


轉自:http://blog.csdn.net/yinxusen/article/details/7450213

相關文章

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.