Python爬蟲入門 | 3 爬蟲必備Python知識

來源:互聯網
上載者:User

標籤:Python Python入門 Pyth

這是一個適用於小白的Python爬蟲免費教學課程,只有7節,讓零基礎的你初步瞭解爬蟲,跟著課程內容能自己爬取資源。看著文章,開啟電腦動手實踐,平均45分鐘就能學完一節,如果你願意,今天內你就可以邁入爬蟲的大門啦~

好啦,正式開始我們的第三節課《爬蟲必備Python知識》吧!啦啦哩啦啦,都看黑板~

  1. 字串(string)

1.1 輸入字串

編寫字串時,既可以用單引號( ‘ )也可以用雙引號( " ):

對於帶有分行符號的多行字串,可以使用三重引號(即 ‘‘‘ 或 """ ):

1.2 訪問字串中的值

Python訪問子字串,可以使用方括弧來截取字串,如下執行個體:

以上執行個體執行結果:

1.3 字串的修改

Python中已存在的字串本身不可以改變:

報錯:

但可以對已存在的字串進行修改,然後賦值給另一個變數:

以上執行個體執行結果:

1.4 Python對象轉為字串

許多Python對象都可以用str函數轉換為字串:

以上執行個體執行結果:

1.5 字串當做序列類型處理

由於字串其實是一串字元序列,因此可以被當做某種序列類型(如列表、元組等)進行處理:

以上執行個體執行結果:

1.6 Python逸出字元

當需要在字元中使用特殊字元時,Python用反斜線()逸出字元,如下表:

1.7 字串運算子

下表執行個體變數 a 值為字串 "Hello",b 變數值為 "Python":

1.8 字串常用方法

  1. 元組(tuple)

2.1 元組的建立

元組(tuple)是一種一維的、定長的、不可變的Python對象序列。元組建立很簡單,只需要在括弧中添加元素,並使用逗號隔開即可:

建立空元組:

元組中只包含一個元素時,需要在元素後面添加逗號:

通過調用tuple,任何序列或迭代器都可以被轉化為元組:

結果為:

2.2 訪問元組

元組可以使用下標索引來訪問元組中的值,如下執行個體:

以上執行個體輸出結果:

2.3 修改元組

元組中的元素值是不允許修改的,但我們可以對元組進行串連組合,如下執行個體:

結果為:

2.4 元組運算子

與字串一樣,元組之間可以使用 + 號和 * 號進行運算。這就意味著他們可以組合和複製,運算後會產生一個新的元組。

2.5 元組索引與截取

因為元組也是一個序列,所以我們可以訪問元組中的指定位置的元素,也可以截取索引中的一段元素,如下所示:

元組:


2.6 元組內建函數

  1. 列表(list)

3.1 列表的建立

跟元組相比,列表(list)是變長的,而且其內容也是可以修改的。它可以通過方括弧([ ])或者list函數進行定義:

結果為:

對已經定義的列表中的內容進行修改:

結果為:

3.2 訪問列表中的值

使用下標索引來訪問列表中的值,同樣也可以使用方括弧的形式截取字元,如下所示:

結果為:

3.3 更新列表

可以對列表的資料項目進行修改或更新,也可以使用append()方法來添加清單項目,如下所示:

結果為:

3.4 刪除列表元素

可以使用 del 語句來刪除列表的的元素,如下執行個體:

結果為:

3.5 判斷列表中是否存在某個值

通過 in 關鍵字,可以判斷列表中是否含有某個值:

結果為:

3.6 列表指令碼操作符

列表對 + 和 的操作符與字串相似。+ 號用於組合列表, 號用於重複列表。

3.7 列表截取

Python的列表截取與字串操作類型,如下所示:

3.8 列表內建函數&方法

  1. 字典(dict)

4.1 字典的建立

字典是另一種可變容器模型,且可儲存任意類型對象。
字典的每個索引值(key=>value)對用冒號( : )分割,每個對之間用逗號( , )分割,整個字典包括在花括弧( {} )中 ,格式如下所示:

鍵必須是唯一的,但值則不必。值可以取任何資料類型,但鍵必須是不可變的,如字串、數字或元組。
一個簡單的字典執行個體:

也可如此建立字典:

4.2 訪問字典裡的值

把相應的鍵放入方括弧,如下執行個體:

以上執行個體輸出結果:

如果用字典裡沒有的鍵訪問資料,會輸出錯誤如下:

以上執行個體輸出結果:

4.3 修改字典

向字典添加新內容的方法是增加新的鍵/值對,修改或刪除已有鍵/值對如下執行個體:

以上執行個體輸出結果:


4.4 刪除字典元素

del 能刪單一的元素也能刪除字典,clear 可以清空字典。del刪除字典和clear清空字典的區別在於,前者是將字典整個刪除了,字典不複存在,而後者是清空字典中的內容,留下了一個“空殼子”。


4.5 字典內建函數&方法

  1. 條件控制

5.1 條件控制流程程

Python條件陳述式是通過一條或多條語句的執行結果(True或者False)來決定執行的代碼塊。可以通過來簡單瞭解條件陳述式的執行過程:

5.2 if 語句

Python中if語句的一般形式如下所示:

如果"condition_1"為True,將執行 "statement_block_1"塊語句
如果"condition_1"為False,將判斷 "condition_2"
如果"condition_2"為True,將執行 "statement_block_2"塊語句
如果"condition_2"為False,將執行"statement_block_3"塊語句
注意:
1.每個條件後面要使用冒號(:),表示接下來是滿足條件後要執行的語句塊。
2.使用縮排來劃分語句塊,相同縮排數的語句在一起組成一個語句塊。
3.在Python中沒有switch – case語句。
舉一個 if 執行個體:

執行程式,輸入狗狗的年齡:

程式運行結果:

輸入enter後退出程式。

5.3 常用操作運算子

5.4 if 嵌套

在嵌套 if 語句中,可以把 if...elif...else結構放在另外一個 if...elif...else 結構中。

舉一個 if 嵌套執行個體:

輸入語句及結果如下:

  1. 迴圈語句

6.1 迴圈語句流程

Python中的迴圈語句有 for 和 while。Python迴圈語句的控制結構圖如下所示:

6.2 while 迴圈

Python中while語句的一般形式:

同樣需要注意冒號和縮排。以下執行個體使用了 while 來計算 1 到 100 的總和:

執行結果如下:

執行以上指令碼,輸出結果如下:

6.3 for 語句

for 迴圈的一般格式如下:

for 執行個體中使用 break 語句,break 語句用於跳出當前迴圈體:

結果如下:

除了在 for 和 while 的迴圈體中使用 break 語句來跳出迴圈,我們還可以使用 continue 語句,continue語句被用來告訴Python跳過當前迴圈塊中的剩餘語句,然後繼續進行下一輪迴圈。
代碼塊如下:

結果如下:

好了,這節課就到這裡!

Python爬蟲入門 | 3 爬蟲必備Python知識

相關文章

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.