【awk】詭異的錯誤,linux和windows換行的區別

來源:互聯網
上載者:User

題目:檔案a,每行兩列,格式為url ip,檔案b每行一列,格式為url,通過awk實現找出b檔案中的url是否在a檔案中,如存在,將此url和對應的ip輸出(檔案大小不考慮) 

編寫檔案a如下:

 

www.baidu.com 61.135.169.125
im.baidu.com 123.125.115.69
zhidao.baidu.com 123.125.115.90
tieba.baidu.com 123.125.65.93
mp3.baidu.com 123.125.114.76
img.baidu.com 123.125.114.171
video.baidu.com 123.125.114.32

編寫檔案b如下:

im.baidu.com
mp3.baidu.com
video.baidu.com

預期輸出結果為:

im.baidu.com 123.125.115.69
mp3.baidu.com 123.125.114.76
video.baidu.com 123.125.114.32

設計awk命令如下:
awk 'ARGIND==1{s[$0]}ARGIND==2{if($1 in s) print $0}' b a
實際輸出結果為空白。
————————————————————————————————————
解決方案:
檔案a和b是在windows下編寫的,而windows下的換行為/r/n,linux下為/n。因此a檔案的$0實則在末尾包含了“/r”。因此,重寫awk代碼如下:
awk 'ARGIND==1{s[$1]}ARGIND==2{if($1"/r" in s) print $0}' b a
得到預期的輸入結果。
另外,要是windows和linux下的檔案都有效,則可寫代碼如下:
awk 'ARGIND==1{s[$1]}ARGIND==2{if(($1"/r" in s)||($1 in s)) print $0}' b<br /> a
————————————————————————————————————
參考資料:http://hi.baidu.com/fangm/blog/item/2e13fdfab2f739ddb48f31cb.html

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.