python檔案操作

來源:互聯網
上載者:User

標籤:封裝   參數   沒有   需要   truncate   類型   命令   指令碼   無法   

一 介紹

電腦系統分為:電腦硬體,作業系統,應用程式三部分。

我們用python或其他語言編寫的應用程式若想要把資料永久儲存下來,必須要儲存於硬碟中,這就涉及到應用程式要操作硬體,眾所周知,應用程式是無法直接操作硬體的,這就用到了作業系統。作業系統把複雜的硬體操作封裝成簡單的介面給使用者/應用程式使用,其中檔案就是作業系統提供給應用程式來操作硬碟虛擬概念,使用者或應用程式通過操作檔案,可以將自己的資料永久儲存下來。

有了檔案的概念,我們無需再去考慮操作硬碟的細節,只需要關注操作檔案的流程:

#1. 開啟檔案,得到檔案控制代碼並賦值給一個變數
#2. 通過控制代碼對檔案進行操作
#3. 關閉檔案

 

二 在python中

#1. 開啟檔案,得到檔案控制代碼並賦值給一個變數
f=open(‘a.txt‘,‘r‘,encoding=‘utf-8‘) #預設開啟模式就為r

#2. 通過控制代碼對檔案進行操作
data=f.read()

#3. 關閉檔案
f.close()

 

三 f=open(‘a.txt‘,‘r‘)的過程分析

#1、由應用程式向作業系統發起系統調用open(...)

#2、作業系統開啟該檔案,並返回一個檔案控制代碼給應用程式

#3、應用程式將檔案控制代碼賦值給變數f

 

四 強調!!!

#強調第一點:
開啟一個檔案包含兩部分資源:作業系統級開啟的檔案+應用程式的變數。在操作完畢一個檔案時,必須把與該檔案的這兩部分資源一個不落地回收,回收方法為:
1、f.close() #回收作業系統級開啟的檔案
2、del f #回收應用程式級的變數

其中del f一定要發生在f.close()之後,否則就會導致作業系統開啟的檔案還沒有關閉,白白佔用資源,
而python自動的記憶體回收機制決定了我們無需考慮del f,這就要求我們,在操作完畢檔案後,一定要記住f.close()

雖然我這麼說,但是很多同學還是會很不要臉地忘記f.close(),對於這些不長腦子的同學,我們推薦傻瓜式操作方式:
使用with關鍵字來幫我們管理上下文
with open(‘a.txt‘,‘w‘) as f:
   pass

with open(‘a.txt‘,‘r‘) as read_f,open(‘b.txt‘,‘w‘) as write_f:
   data=read_f.read()
   write_f.write(data)

強調第一點:資源回收

 

#強調第二點:
f=open(...)是由作業系統開啟檔案,那麼如果我們沒有為open指定編碼,
那麼開啟檔案的預設編碼很明顯是作業系統說了算了,作業系統會用自己的預設編碼
去開啟檔案,在windows下是gbk,在linux下是utf-8。
這就用到了上節課講的字元編碼的知識:若要保證不亂碼,檔案以什麼方式存的,
就要以什麼方式開啟。

f=open(‘a.txt‘,‘r‘,encoding=‘utf-8‘)

 

五 開啟檔案的模式

檔案控制代碼 = open(‘檔案路徑‘, ‘模式‘)

#1. 開啟檔案的模式有(預設為文字模式):
r ,唯讀模式【預設模式,檔案必須存在,不存在則拋出異常】
w,唯寫模式【不可讀;不存在則建立;存在則清空內容】
a, 之追加寫入模式【不可讀;不存在則建立;存在則只追加內容】

#2. 對於非文字檔,我們只能使用b模式,"b"表示以位元組的方式操作
(而所有檔案也都是以位元組的形式儲存的,使用這種模式無需考慮文字檔的字元編碼、
圖片檔案的jgp格式、視頻檔案的avi格式)
rb 
wb
ab
註:以b方式開啟時,讀取到的內容是位元組類型,寫入時也需要提供位元組類型,
不能指定編碼

#3. 瞭解部分
"+" 表示可以同時讀寫某個檔案
r+, 讀寫【可讀,可寫】
w+,寫讀【可讀,可寫】
a+, 寫讀【可讀,可寫】


x, 唯寫模式【不可讀;不存在則建立,存在則報錯】
x+ ,寫讀【可讀,可寫】
xb

 

六 操作檔案的方法
#掌握
f.read() #讀取所有內容,游標移動到檔案末尾
f.readline() #讀取一行內容,游標移動到第二行首部
f.readlines() #讀取每一行內容,存放於列表中

f.write(‘1111\n222\n‘) #針對文字模式的寫,需要自己寫分行符號
f.write(‘1111\n222\n‘.encode(‘utf-8‘)) #針對b模式的寫,需要自己寫分行符號
f.writelines([‘333\n‘,‘444\n‘]) #檔案模式
f.writelines([bytes(‘333\n‘,encoding=‘utf-8‘),‘444\n‘.encode(‘utf-8‘)]) #b模式

#瞭解
f.readable() #檔案是否可讀
f.writable() #檔案是否可讀
f.closed #檔案是否關閉
f.encoding #如果檔案開啟模式為b,則沒有該屬性
f.flush() #立刻將檔案內容從記憶體刷到硬碟
f.name

 

練習,利用b模式,編寫一個cp工具,要求如下:

  1. 既可以拷貝文本又可以拷貝視頻,圖片等檔案

  2. 使用者一旦參數錯誤,列印命令的正確使用方法,如usage: cp source_file target_file

  提示:可以用import sys,然後用sys.argv擷取指令碼後面跟的參數

import sys
if len(sys.argv) != 3:
   print(‘usage: cp source_file target_file‘)
   sys.exit()

source_file,target_file=sys.argv[1],sys.argv[2]
with open(source_file,‘rb‘) as read_f,open(target_file,‘wb‘) as write_f:
   for line in read_f:
       write_f.write(line)

 

七檔案內游標移動

1: read(3):

  a. 檔案開啟檔案為文字模式時,代表讀取3個字元

  b. 檔案開啟檔案為b模式時,代表讀取3個位元組

2: tell() 返迴文件的當前位置

3: 其餘的檔案內游標移動都是以位元組為單位如seek,tell,truncate

注意:

  a. seek有三種移動方式0,1,2,其中1和2必須在b模式下進行,但無論哪種模式,都是以bytes為單位移動的,常用seek(0)移動到開頭,seek(0, 2)移動到最後面 。

  b. truncate是截斷檔案,所以檔案的開啟檔案必須可寫,但是不能用w或w+等方式開啟,因為那樣直接清空檔案了,所以truncate要在r+或a或a+等模式下測試效果

 

八 檔案的修改

檔案的資料是存放於硬碟上的,因而只存在覆蓋、不存在修改這麼一說,我們平時看到的修改檔案,都是類比出來的效果,具體的說有兩種實現方式:

 

方式一:將硬碟存放的該檔案的內容全部載入到記憶體,在記憶體中是可以修改的,修改完畢後,再由記憶體覆蓋到硬碟(word,vim,nodpad++等編輯器)

import os

with open(‘a.txt‘) as read_f,open(‘.a.txt.swap‘,‘w‘) as write_f:
   data=read_f.read() #全部讀入記憶體,如果檔案很大,會很卡
   data=data.replace(‘alex‘,‘SB‘) #在記憶體中完成修改

   write_f.write(data) #一次性寫入新檔案

os.remove(‘a.txt‘)
os.rename(‘.a.txt.swap‘,‘a.txt‘)

 

方式二:將硬碟存放的該檔案的內容一行一行地讀入記憶體,修改完畢就寫入新檔案,最後用新檔案覆蓋源檔案

import os

with open(‘a.txt‘) as read_f,open(‘.a.txt.swap‘,‘w‘) as write_f:
   for line in read_f:
       line=line.replace(‘alex‘,‘SB‘)
       write_f.write(line)

os.remove(‘a.txt‘)
os.rename(‘.a.txt.swap‘,‘a.txt‘)

python檔案操作

相關文章

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.