Python實現批量讀取word中表格資訊的方法

來源:互聯網
上載者:User
本文執行個體講述了Python實現批量讀取word中表格資訊的方法。分享給大家供大家參考。具體如下:

單位收集了很多word格式的調查表,領導需要收集表單裡的資訊,我就把所有調查表放一個檔案裡,寫了個python小程式把所需的資訊列印出來

#coding:utf-8import osimport win32comfrom win32com.client import Dispatch, constantsfrom docx import Documentdef parse_doc(f):  """讀取doc,返回姓名和行業  """  doc = w.Documents.Open( FileName = f )  t = doc.Tables[0] # 根據檔案中的圖表選擇資訊  name = t.Rows[0].Cells[1].Range.Text    situation = t.Rows[0].Cells[5].Range.Text  people = t.Rows[1].Cells[1].Range.Text  title = t.Rows[1].Cells[3].Range.Text    print name, situation, people,title  doc.Close()def parse_docx(f):  """讀取docx,返回姓名和行業  """  d = Document(f)  t = d.tables[0]  name = t.cell(0,1).text  situation = t.cell(0,8).text  people = t.cell(1,2).text  title = t.cell(1,8).text  print name, situation, people,titleif __name__ == "__main__":  w = win32com.client.Dispatch('Word.Application')  # 遍曆檔案  PATH = "H:\work\\aaa" # windows檔案路徑  doc_files = os.listdir(PATH)  for doc in doc_files:    if os.path.splitext(doc)[1] == '.docx':      try:        parse_docx(PATH+'\\'+doc)      except Exception as e:        print e    elif os.path.splitext(doc)[1] == '.doc':      try:        parse_doc(PATH+'\\'+doc)      except Exception as e:        print e

希望本文所述對大家的Python程式設計有所協助。

  • 聯繫我們

    該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

    如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

    A Free Trial That Lets You Build Big!

    Start building with 50+ products and up to 12 months usage for Elastic Compute Service

    • Sales Support

      1 on 1 presale consultation

    • After-Sales Support

      24/7 Technical Support 6 Free Tickets per Quarter Faster Response

    • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.