python小例子之刪除文字標籤

來源:互聯網
上載者:User

標籤:Regex   python學習   python小例子   

Python 練習冊,每天一個小程式


By 白熊花田(http://blog.csdn.net/whiterbear) 轉載需註明出處,謝謝。

問題描述:


我們在網上下載或者複製別人代碼的時候經常會遇到下載的代碼中包含行數標籤的情況。如:

這些代碼中包含著行數如1.,2.等,如果我們想直接運行或者copy代碼需要自己手動的刪除這些標籤。既然學了python,我們寫一段指令碼來處理它吧。


思路分析:


首先,我們逐行的讀取文本。

利用Regex,可以順利地匹配出所有的這些標籤以及後面跟隨的“\t”,Regex為:“\d+.\t”。

接著我們將匹配的結果在這一行中刪除它,使用string模組的replace方法,將匹配的結果用‘’代替。

最後,我們儲存每次刪除了行數標籤的結果行,然後將這些行寫入原文本。注意,以w的方式開啟文本會刪除原常值內容。


代碼:

# -*- coding:utf-8 -*-import reimport osimport sysreload(sys)sys.setdefaultencoding('utf-8')ls = os.lineseplabel_regex = r'\d+.\t'content = []for line in open('source.txt', 'r'):mm = re.search(label_regex, line)if mm:mm = mm.group()content.append(line.replace(mm, '').rstrip())else:breakf = open('source.txt', 'w')f.writelines(['%s%s' % (x,ls) for x in content])

結果:



python小例子之刪除文字標籤

相關文章

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.