python讀取檔案

來源:互聯網
上載者:User

標籤:

1.open

使用open開啟檔案後一定要記得調用檔案對象的close()方法。比如可以用try/finally語句來確保最後能關閉檔案。

file_object = open(‘thefile.txt‘ )
try :
     all_the_text =  file_object.read( )
finally :
     file_object.close( )


註:不能把open語句放在try塊裡,因為當開啟檔案出現異常時,檔案對象file_object無法執行close()方法。

2.讀檔案 讀文字檔 input = open(‘data‘, ‘r‘ )
#第二個參數預設為r
input = open(‘data‘ )

 

讀二進位檔案 input = open(‘data‘, ‘rb‘)

 

讀取所有內容 file_object = open(‘thefile.txt‘ )
try :
     all_the_text =  file_object.read( )
finally :
     file_object.close( )

 

讀固定位元組 file_object = open(‘abinfile‘, ‘rb‘ )
try :
    while  True:
         chunk = file_object.read(100 )
        if not  chunk:
            break
         do_something_with(chunk)
finally :
     file_object.close( )

 

讀每行 list_of_all_the_lines = file_object.readlines( )


如果檔案是文字檔,還可以直接遍曆檔案對象擷取每行:

for line in  file_object:
     process line

 

3.寫檔案 寫文字檔 output = open(‘data‘, ‘w‘)

 

寫二進位檔案 output = open(‘data‘, ‘wb‘)

 

追加寫檔案 output = open(‘data‘, ‘w+‘)

 

寫資料 file_object = open(‘thefile.txt‘, ‘w‘ )
file_object.write(all_the_text)
file_object.close( )

 

寫入多行 file_object.writelines(list_of_text_strings)


注意,調用writelines寫入多行在效能上會比使用write一次性寫入要高。

在處理記錄檔的時候,常常會遇到這樣的情況:記錄檔巨大,不可能一次性把整個檔案讀入到記憶體中進行處理,例如需要在一台實體記憶體為 2GB 的機器上處理一個 2GB 的記錄檔,我們可能希望每次只處理其中 200MB 的內容。
在 Python 中,內建的 File 對象直接提供了一個 readlines(sizehint) 函數來完成這樣的事情。以下面的代碼為例:

file = open(‘test.log‘, ‘r‘) sizehint = 209715200   # 200M position = 0 lines = file.readlines(sizehint) while not file.tell() - position < 0:      position = file.tell()      lines = file.readlines(sizehint)


每次調用 readlines(sizehint) 函數,會返回大約 200MB 的資料,而且所返回的必然都是完整的行資料,大多數情況下,返回的資料的位元組數會稍微比 sizehint 指定的值大一點(除最後一次調用 readlines(sizehint) 函數的時候)。通常情況下,Python 會自動將使用者指定的 sizehint 的值調整成內部緩衝大小的整數倍。

file在python是一個特殊的類型,它用於在python程式中對外部的檔案進行操作。在python中一切都是對象,file也不例外,file有file的方法和屬性。下面先來看如何建立一個file對象:

  • file(name[, mode[, buffering]])

file()函數用於建立一個file對象,它有一個別名叫open(),可能更形象一些,它們是內建函數。來看看它的參數。它參數都是以字串的形式傳遞的。name是檔案的名字。
mode是開啟的模式,可選的值為r w a U,分別代表讀(預設) 寫 添加支援各種分行符號的模式。用w或a模式開啟檔案的話,如果檔案不存在,那麼就自動建立。此外,用w模式開啟一個已經存在的檔案時,原有檔案的內容會被清空,因為一開始檔案的操作的標記是在檔案的開頭的,這時候進行寫操作,無疑會把原有的內容給抹掉。由於曆史的原因,分行符號在不同的系統中有不同模式,比如在 unix中是一個/n,而在windows中是‘/r/n’,用U模式開啟檔案,就是支援所有的換行模式,也就說‘/r’ ‘/n‘ ‘/r/n‘都可表示換行,會有一個tuple用來存貯這個檔案中用到過的分行符號。不過,雖說換行有多種模式,讀到python中統一用/n代替。在模式字元的後面,還可以加上+ b t這兩種標識,分別表示可以對檔案同時進行讀寫操作和用二進位模式、文字模式(預設)開啟檔案。
buffering如果為0表示不進行緩衝;如果為1表示進行“行緩衝“;如果是一個大於1的數表示緩衝區的大小,應該是以位元組為單位的。

file對象有自己的屬性和方法。先來看看file的屬性。

  • closed #標記檔案是否已經關閉,由close()改寫
  • encoding #檔案編碼
  • mode #開啟模式
  • name #檔案名稱
  • newlines #檔案中用到的換行模式,是一個tuple
  • softspace #boolean型,一般為0,據說用於print


file的讀寫方法:

  • F.read([size]) #size為讀取的長度,以byte為單位
  • F.readline([size]) 
    #讀一行,如果定義了size,有可能返回的只是一行的一部分
  • F.readlines([size]) 
    #把檔案每一行作為一個list的一個成員,並返回這個list。其實它的內部是通過迴圈調用readline()來實現的。如果提供size參數,size是表示讀取內容的總長,也就是說可能唯讀到檔案的一部分。
  • F.write(str) 
    #把str寫到檔案中,write()並不會在str後加上一個分行符號
  • F.writelines(seq) 
    #把seq的內容全部寫到檔案中。這個函數也只是忠實地寫入,不會在每行後面加上任何東西。

file的其他方法:

  • F.close() 
    #關閉檔案。python會在一個檔案不用後自動關閉檔案,不過這一功能沒有保證,最好還是養成自己關閉的習慣。如果一個檔案在關閉後還對其進行操作會產生ValueError
  • F.flush() 
    #把緩衝區的內容寫入硬碟
  • F.fileno() 
    #返回一個長整型的”檔案標籤“
  • F.isatty() 
    #檔案是否是一個終端裝置檔案(unix系統中的)
  • F.tell() 
    #返迴文件操作標記的當前位置,以檔案的開頭為原點
  • F.next() 
    #返回下一行,並將檔案操作標記位移到下一行。把一個file用於for ... in file這樣的語句時,就是調用next()函數來實現遍曆的。
  • F.seek(offset[,whence]) 
    #將檔案打操作標記移到offset的位置。這個offset一般是相對於檔案的開頭來計算的,一般為正數。但如果提供了whence參數就不一定了,whence可以為0表示從頭開始計算,1表示以當前位置為原點計算。2表示以檔案末尾為原點進行計算。需要注意,如果檔案以a或a+的模式開啟,每次進行寫操作時,檔案操作標記會自動返回到檔案末尾。
  • F.truncate([size]) 
    #把檔案裁成規定的大小,預設的是裁到當前檔案操作標記的位置。如果size比檔案的大小還要大,依據系統的不同可能是不改變檔案,也可能是用0把檔案補到相應的大小,也可能是以一些隨機的內容加上去。

python讀取檔案

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.