標籤:Python
這是一個適用於小白的Python爬蟲免費教學課程,只有7節,讓零基礎的你初步瞭解爬蟲,跟著課程內容能自己爬取資源。看著文章,開啟電腦動手實踐,平均45分鐘就能學完一節,如果你願意,今天內你就可以邁入爬蟲的大門啦~
話不多說,正式開始我們的第一節課《Python環境的安裝》吧~
啦啦啦開課啦,看黑板,都看黑板~
- 安裝Anaconda
在我們的教學中,我們使用的版本是Python3,至於為什麼要選Python3,哼哼!
工欲善其事,必先利其器,在學習爬蟲之前,你得先搭建自己的編程環境。廢話不多說,按照下面的方法搭建吧:
1.1 下載Anaconda
開啟Anaconda網頁後,看到這樣的頁面:
根據你的電腦系統,選擇相應版本的 Anaconda(記住選擇 Python 3.6 的版本),Mac OS 使用者選擇 Mac 版本即可,如果不想麻煩,請選擇 Graphical Installer。
1.2 安裝 Anaconda
選擇預設位置安裝即可:
兩個選擇框都勾上,安裝:
1.3 在開始菜單中查看 Anaconda
Anaconda 裝好之後,可以在開始菜單查看。可以看到包含了如所示的組件:
之後我們會用到的主要是:
Anaconda Prompt:Anaconda 內建的命令列
Jupyter Notebook:一個簡單易用、適合入門的 IDE
- 安裝常用包
2.1 安裝 Python 包 requests
開啟 cmd 終端,輸入 pip install requests,若安裝不成功,可以嘗試:conda install requests
requests,未出現報錯,表示安裝成功,可以正常使用。註:操作完記得退出:quit()。
如果安裝時顯示 conda 不是內部或外部命令,用下面的方式安裝(如未報錯則不必用下面的方法)
在開始菜單開啟 Anaconda Prompt:
在 Anaconda Prompt 輸入 conda install requests:
2.2 安裝 Python 包 lxml
同樣在終端輸入: conda install lxml,出現 Successfully installed,即表示成功安裝,若不能成功安裝,請嘗試如下方法。
前往 http://www.lfd.uci.edu/~gohlke/pythonlibs/,手動下載需要安裝的第三方包(注意對應你的python版本是32位還是64位)。
在下載下來的檔案所在目錄按住shift並點擊滑鼠右鍵,選擇在此處開啟Powershell視窗,在此命令列中使用 pip install + 下載下來檔案全名 ,即可完成安裝。
所以你該知道如何安裝 Python 包了吧,通用方法是,在終端輸入:conda install + 包名稱 或者 pip install + 包名稱。出現特殊的不能安裝的情況,可以去下載之後進行安裝。
- Jupyter Notebook
3.1 開啟Jupyter Notebook
在開始菜單開啟 Jupyter Notebook:
Jupyter 將會在網頁中自動開啟:
3.2 Jupyter Notebook 介面
Files:你當前工作環境下的所有項目(代碼)、預設儲存的檔案都在這裡:
Runing:你目前正在啟動並執行項目都在這裡:
3.3 建立一個文檔,開始寫代碼
依次點擊右上方 :New > Python 3,即建立了一個 Ipython 檔案,
點擊上方 Utitled 可以更改文檔的名稱,下面的空間就可以寫代碼啦:
3.4 Jupyter Notebook 功能簡介
- 建立第一個執行個體:爬取百度首頁
僅用四行代碼,我們就可以把百度首頁的內容下載下來:
1.匯入 requests 庫;2.下載百度首頁內容;3.更改編碼;4.列印內容
具體爬蟲原理及代碼的內涵,在下一節的案例中詳細講解~
好了,這節課就到這裡
Python爬蟲入門 | 1 Python環境的安裝