摘錄-瀏覽器如何擷取網頁

來源:互聯網
上載者:User

標籤:

  我們把互連網想象成一個郵局:

  當你想給你的朋友寫信時,首先要把內容寫在信紙上,然後在信封上寫上地址,再把信紙裝進信封。

  當你把信送到郵局,郵件分揀機會根據郵編和地址來判斷你的朋友住在哪裡。如果他住在一棟有很多房間的公寓大樓裡面,郵局會把信件投遞到大樓的前台,然後大樓的工作人員會根據房間號再次進行分揀。

  互連網的工作原理和上面的過程很類似。不同的是,現實世界中是由街道串連起來的樓房和公寓,在互連網世界中被路由器和網線串連起來的電腦所取代。每一台電腦都有一個唯一的地址,讓網路可以定位到它。

  多個公寓房間共用一個街道地址,與此類似,多台電腦也可以共用一個網路或路由器。比如,正在使用星巴克提供的免費wifi時,多台電腦會共用一個公用IP地址。儘管如此,你的電腦依然可以通過路由器分配的內網IP地址被單獨訪問到,路由器好比公寓大樓的工作人員,而內網IP好比房間號。

    IP是互連網協議(Internet Protocol)的縮寫。IP地址是為每個接入到網路中的裝置分配的數位識別碼符。電腦、印表機甚至手機都有自己的IP地址。

    目前有IPv4和IPv6兩種主要的IP地址類型,普遍使用的是IPv4地址,例如:192.168.1.1這種形式,而IPv6地址是2001:0db8:0000:0000:ff00:0042:8329這種形式的。

  當你開啟一個瀏覽器,並在地址欄輸入http//google.com後,瀏覽器會“詢問”網路(更準確的說,是“詢問”DNS伺服器)goole.com對應的IP地址是什嗎?如果DNS伺服器知道你要找的IP地址,就會將其結果返回;如果不知道,它會將請求轉寄給其他DNS伺服器,直到某一台DNS伺服器上找到對應的IP地址記錄。在終端輸入下列指令,可觀察DNS伺服器的響應內容:

  $dig goole.com

    如果你是使用Mac作業系統,可以使用Terminal終端程式,它通常儲存在/Applications/Utilities目錄中。如果使用的是Windows作業系統,開啟開始菜單,在運行中輸入cmd就可以開啟終端了。

  DNS伺服器返回了你想要的電腦的IP地址(例如找到了goole.com對應的IP地址)後,它就會向這個IP地址對應的電腦請求你要訪問的頁面。

    每一個路徑對應的網頁都由不同的HTML文檔組成(也有一些例外)。例如,當瀏覽器請求http//google.com或http//google.com/images時得到的HTML文檔是不一樣的。

  現在電腦已經知道哪個IP地址可以訪問到http//google.com它會向Google的伺服器請求顯示這個頁面所需的HTML。

  當遠程伺服器吧HTML文檔發送回來後,瀏覽器會對文檔進行渲染。渲染時就是通過一系列操作,使HTML頁面按照設計之初的既定方式顯示。

摘錄-瀏覽器如何擷取網頁

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.