標籤:doctype 返回 round ie8 logs har 科技 odi UI
第三百二十二節,web爬蟲,requests請求
requests請求,就是用yhthon的requests模組類比瀏覽器請求,返回html源碼
類比瀏覽器請求有兩種,一種是不需要使用者登入或者驗證的請求,一種是需要使用者登入或者驗證的請求
一、不需要使用者登入或者驗證的請求
這種比較簡單,直接利用requests模組發一個請求即可拿到html源碼
#!/usr/bin/env python# -*- coding:utf8 -*-import requests #匯入類比瀏覽器請求模組http =requests.get(url="http://www.iqiyi.com/") #發送http請求http.encoding = "utf-8" #http請求編碼neir = http.text #擷取http字串代碼print(neir)
得到html源碼
<!DOCTYPE html><html><head><title>抽屜新熱榜-彙總每日熱門、搞笑、有趣資訊</title> <meta charset="utf-8" /> <meta name="keywords" content="抽屜新熱榜,資訊,段子,圖片,公眾場合不宜,科技,新聞,節操,搞笑" /> <meta name="description" content=" 抽屜新熱榜,匯聚每日搞笑段子、熱門圖片、有趣新聞。它將微博、門戶、社區、bbs、社交網站等海量內容彙總在一起,通過使用者推薦產生最熱榜單。看抽屜新熱榜,每日熱門、有趣資訊盡收眼底。 " /> <meta name="robots" content="index,follow" /> <meta name="GOOGLEBOT" content="index,follow" /> <meta name="Author" content="搞笑" /> <meta http-equiv="X-UA-Compatible" content="IE=EmulateIE8"> <link type="image/x-icon" href="/images/chouti.ico" rel="icon"/> <link type="image/x-icon" href="/images/chouti.ico" rel="Shortcut Icon"/> <link type="image/x-icon" href="/images/chouti.ico" rel="bookmark"/> <link type="application/opensearchdescription+xml" href="opensearch.xml" title="抽屜新熱榜" rel="search" />
第三百二十二節,web爬蟲,requests請求