1. 程式人生 > 實用技巧 >41.從瀏覽器位址列輸入url到顯示頁面的步驟

41.從瀏覽器位址列輸入url到顯示頁面的步驟

基礎版本(面試筆試)

  • 瀏覽器根據請求的URL交給DNS進行域名解析,找到真實IP地址,向伺服器發起請求;
  • 伺服器交給後臺處理完成後返回資料,瀏覽器接收檔案(HTMLCSSJSimages等);
  • 瀏覽器對載入到的資源(HTMLCSSJSimages等)進行語法解析,建立相應的內部資料結構(如HTMLDOM);
  • 載入解析到的資原始檔,渲染頁面,完成。

詳細版本

  1. 在瀏覽器位址列輸入URL

  2. 瀏覽器檢視*快取**,如果請求資源在快取中並且新鮮,跳轉到轉碼步驟

    1. 如果資源未快取,發起新請求;

    2. 如果已快取,檢驗是否足夠新鮮,足夠新鮮直接提供給客戶端,否則與伺服器進行驗證;

    3. 檢驗新鮮通常有兩個HTTP頭進行控制ExpiresCache-Control

      • HTTP1.0 提供Expires,值為一個絕對時間表示快取新鮮日期
      • HTTP1.1 增加了Cache-Control:max-age=,值為以秒為單位的最大新鮮時間
  3. 瀏覽器解析URL獲取協議,主機、埠、path

  4. 瀏覽器組裝一個HTTP(GET)請求報文

  5. 瀏覽器獲取主機IP地址,過程如下:

    1. 瀏覽器快取
    2. 本機快取
    3. hosts檔案
    4. 路由器快取
    5. ISP DNS 快取
    6. DNS 遞迴查詢(可能存在負載均衡導致每次IP不一樣)
  6. 開啟一個socket與目標IP地址,埠建立TCP連結,三次握手如下:

    1. 客戶端傳送一個TCP的SYN=1,Seq=X
      的包到伺服器埠
    2. 伺服器發回SYN=1,ACK=X+1,Seq=Y的響應包
    3. 客戶端傳送ACK=Y+1,Seq=Z
  7. TCP連結建立後傳送HTTP請求

  8. 伺服器接受請求並解析,將請求轉發到服務程式,如虛擬主機使用HTTP Host頭部判斷請求的伺服器程式

  9. 伺服器檢查HTTP請求頭是否包含快取驗證資訊,如果驗證快取新鮮,返回304等對應狀態碼

  10. 處理程式讀取完整請求並準備HTTP響應,可能需要查詢資料庫等操作

  11. 伺服器將響應報文通過TCP連線傳送回瀏覽器

  12. 瀏覽器接收HTTP響應,然後根據情況選擇關閉TCP連線或者保留重用,關閉TCP連線的四次握手如下:

    1. 主動方傳送Fin=1,Ack=Z,Seq=X
      報文
    2. 被動方傳送Ack=X+1,Seq=Z報文
    3. 被動方傳送Fin=1,Ack=X,Seq=Y報文
    4. 主動方傳送Ack=Y,Seq=X報文
  13. 瀏覽器檢查響應狀態碼:是否為 1xx,3xx,4xx,5xx,這些情況處理與2xx不同

  14. 如果資源可快取,進行快取

  15. 對響應進行解碼(比如gzip壓縮)

  16. 根據資源型別決定如何處理(假設資源為HTML文件)

  17. 解析HTML文件,構建DOM樹,下載資源,構造CSSOM樹,執行js指令碼,這些操作沒有嚴格的先後順序,以下分別解釋:

  18. 構建DOM樹:

    1. Tokenizing:根據HTML規範將字元流解析為標記
    2. Lexing:詞法分析將標記轉換為物件並定義屬性和規則
    3. DOM construction:根據HTML標記關係將物件組成DOM樹
  19. 解析過程中遇到圖片、樣式表、js檔案,啟動下載

  20. 構建CSSOM樹

    1. Tokenizing:字元流轉換為標記流
    2. Node:根據標記建立節點
    3. CSSOM:節點建立CSSOM樹
  21. 根據DOM樹和CSSOM樹構建渲染樹

    1. 從DOM樹的根節點遍歷所有可見節點,不可見節點包括:
      1)script,meta這樣本身不可見的標籤。2)被css隱藏的節點,如display: none
    2. 對每一個可見節點,找到恰當的CSSOM規則並應用
    3. 釋出可視節點的內容和計算樣式
  22. js解析

    1. 瀏覽器建立Document物件並解析HTML,將解析到的元素和文字節點新增到文件中,此時document.readystateloading
    2. HTML解析器遇到沒有asyncdeferscript時,將他們新增到文件中,然後執行行內或外部指令碼。這些指令碼會同步執行,並且在指令碼下載和執行時解析器會暫停。這樣就可以用document.write()把文字插入到輸入流中。同步指令碼經常簡單定義函式和註冊事件處理程式,他們可以遍歷和操作script和他們之前的文件內容
    3. 當解析器遇到設定了async屬性的script時,開始下載指令碼並繼續解析文件。指令碼會在它下載完成後儘快執行,但是解析器不會停下來等它下載。非同步指令碼禁止使用document.write(),它們可以訪問自己script和之前的文件元素
    4. 當文件完成解析,document.readState變成interactive
    5. 所有defer指令碼會按照在文件出現的順序執行,延遲指令碼能訪問完整文件樹,禁止使用document.write()
    6. 瀏覽器在Document物件上觸發DOMContentLoaded事件
    7. 此時文件完全解析完成,瀏覽器可能還在等待如圖片等內容載入,等這些內容完成載入並且所有非同步指令碼完成載入和執行,document.readState變為completewindow觸發load事件
  23. 顯示頁面(HTML解析過程中會逐步顯示頁面)


詳細簡版

    1. 從瀏覽器接收url到開啟網路請求執行緒(這一部分可以展開瀏覽器的機制以及程序與執行緒之間的關係)
    2. 開啟網路執行緒到發出一個完整的HTTP請求(這一部分涉及到dns查詢,TCP/IP請求,五層因特網協議棧等知識)
    3. 從伺服器接收到請求到對應後臺接收到請求(這一部分可能涉及到負載均衡,安全攔截以及後臺內部的處理等等)
    4. 後臺和前臺的HTTP互動(這一部分包括HTTP頭部、響應碼、報文結構、cookie等知識,可以提下靜態資源的cookie優化,以及編碼解碼,如gzip壓縮等)
    5. 單獨拎出來的快取問題,HTTP的快取(這部分包括http快取頭部,ETagcatch-control等)
    6. 瀏覽器接收到HTTP資料包後的解析流程(解析html-詞法分析然後解析成dom樹、解析css生成css規則樹、合併成render樹,然後layoutpainting渲染、複合圖層的合成、GPU繪製、外鏈資源的處理、loadedDOMContentLoaded等)
    7. CSS的視覺化格式模型(元素的渲染規則,如包含塊,控制框,BFCIFC等概念)
    8. JS引擎解析過程(JS的解釋階段,預處理階段,執行階段生成執行上下文,VO,作用域鏈、回收機制等等)
    9. 其它(可以拓展不同的知識模組,如跨域,web安全,hybrid模式等等內容)