標籤:擷取檔案 nbsp 檔案夾 csv檔案 lte ref int div 開啟
原文地址:https://www.jianshu.com/p/b8110d578155
1、檔案直接選取
mac不存在地址欄,有時候你去擷取檔案路徑粘貼過來開啟會報錯
File b‘***.csv‘ does not exist
而你不想每次要去找資料檔案路徑,最簡單的辦法是先擷取你在編輯的Ipython notebook的路徑,然後把資料檔案放在該路徑下,到時候直接輸入檔案名稱就能開啟檔案了。
#擷取預設路徑import osprint (os.path.abspath(‘.‘))
比如我的路徑是
/Volumes/LXQ/inotebooks/data
接下來把資料檔案比如rawdata.csv拖到data檔案夾下,再開啟
data_file = pd.read_csv(‘rawdata.csv‘)
就行了,不用輸入路徑。
2、編碼問題
當提示
‘utf-8‘ codec can‘t decode byte 0xd0 in position 0: invalid continuation byte
的時候,意味著編碼錯誤。
這個問題耙梳頁的時候也會遇到。原因是python的編碼與爬下來的網頁編碼不一樣,python讀不懂,只能返回亂碼。
解決辦法是:
首先搞清楚python的預設編碼
#擷取系統預設編碼:import sysprint(sys.getdefaultencoding())
返回
utf-8
OK如果你爬取的網頁的編碼是utf-8,爬下來的結果就能正常顯示。但把爬下來的資料存到csv文檔,讓python再次讀取又是另一回事,因為csv文檔用的未必是utf-8編碼,這時候需要解碼
import numpy as npdata_file=pd.read_csv(‘rawdata.csv‘,encoding=‘gb2312‘)print (data_file[0:3])
encoding後面的內容,取決於csv檔案的編碼。
Mac版Python開啟檔案的路徑問題