摘要:不是使用前面提到的網絡棧,而是直接利用系統的域名解析機制,不會阻礙當前網絡棧的工作,針對多個域名采取并行處理的方式,每個域名的解析由一個新線程處理,結束后退出。更多技術內幕知識提煉架構和模塊
WebKit 資源加載機制
HTML 支持的資源主要包括:HTML、JavaScript、CSS、圖片、SVG、CSS Shader、視頻、音頻、字幕、字體、XSL樣式表等
這些資源在 WebKit 中都有不同的類表示,公共基類是 CachedResource。其中 HTML文本的類型為 MainResource,對應的資源類型叫 CachedRawResource類。
基本思想是建立一個緩存池,優先從緩存池中讀取數據。這里的所說的緩存池是內存緩存。WebKit 從資源池中查找資源的關鍵詞是URL,只要URL不同,就被認為是兩個不同的資源
分為三種:
針對每種資源類型的特定加載器,僅加載某一種資源,并且沒有公共基類,加載器屬于它的調用者。如 ImageLoader 屬于 HTMLImageElement
緩存機制加載器 CachedResourceLoader 所有特定加載器都共享它來查找并插入緩存資源,屬于 HTML 文檔的對象
通用資源加載器 ResourceLoader類,WebKit 需要從網絡或者文件中獲取資源的時候使用,只負責獲取資源數據
例子:有一個 “img” 元素,“src”是一個有效 URL 地址,當 HTML 解釋器解析到該元素的該屬性,WebKit 會創建一個 ImageLoader 對象來加載該資源,ImageLoader創建一個緩存資源請求CachedResourceRequest,并調用CachedResourceLoader 查找緩存資源,如果命中緩存則返回給調用者,如果沒有命中則創建一個資源請求ResourceRequest ,并且調用通用資源加載器加載資源,具體到下面的 ResourceHandleInternal ,依賴于每個 WebKit 移植的實現策略。
存在默寫資源會阻塞主線程渲染過程,當前的主線程渲染被阻塞時,WebKit 會啟動另外一個線程去遍歷后面的 HTML 網頁,收集需要的資源 URL,并可以并發下載這些資源。
資源池使用 LRU(Least Recently Used 最近最少使用)算法,并且在這個基礎上添加了協商緩存。如果命中緩存,那么發送一個 HTTP 請求給服務器,說明資源在本地的一些信息,如資源更新時間,服務器根據信息判斷,如果沒有更新,則返回狀態碼 304,那么直接使用原資源;否則下載最新資源。
Chromium 多進程資源加載Renderer 進程在網頁的加載過程中需要獲取資源,但由于安全性(沙箱模型打開的時候,Renderer進程是沒有權限獲取資源的)和效率上(資源可以共享),Renderer 進程的資源獲取實際上是通過進程間通信將任務交給 Browser 進程來完成。
WebKit 的資源加載的優化其實是交由各個移植來實現的,WebCore 沒有什么也別的基礎設施,每個移植的網絡實現是非常不一樣的。
除了 HTTP 協議、DNS 解析等,還包含了 Chromium 為了減少網絡時間而引入的新技術,例如 SPDY,QUIC
URLRequest 類被調用時,會根據 URL 的 “scheme”(協議類型,如:“http://”,“file://”等) 來決定要創建什么類型的請求,Chromium 使用工廠模式處理不同類型的請求,例如 “http://” 類型則會使用 URLRequestJobManager 創建一個 URLRequestJob 類,具體使用哪個工廠則是一個責任鏈模式,優先判斷是否是用戶自定義的 “scheme” 。
當 URLRequestJob 被創建后,先從 Cookie 管理器中獲取與該 URL 相關的信息,之后使用 HttpTransactionFactory 對象創建 HttpTransaction 對象開啟一個 Http 連接的事務。如果請求對應的回復已經在磁盤緩存中,那么 Chromium 無需再建立 HttpTransaction
HttpNetworkTransaction 使用 HttpNetworkSession 類來管理會話。通過 HttpStreamFactory 對象來建立 TCP Socket 連接。之后 HttpStreamFactory 創建 HttpStream 對象,來處理對象和網絡之間數據的讀寫。
Chromium 中與服務器建立連接的套接字是 SteamSocket 類,它是一個抽象類,再 POSIX 系統和 Windows 系統上有不同實現。
Chromium 使用 HostResolverImpl 類來解析域名,具體調用的是 “getaddrinfo()”,是一個阻塞式函數,所以使用多帶帶的線程處理。為了考慮效率,使用 HostCache 類來保存解析后的域名,還有 DNS 預解析機制。
要求:
要有相應的機制來移除合適的緩存資源
瀏覽器崩潰時不破壞磁盤文件
可以通過同步或異步的方式高效快速的訪問
避免同時存儲相同的資源
操作一個項的時候不受其他請求影響
磁盤不支持多線程訪問,磁盤的緩存操作要放到多帶帶的線程
支持老版結構
實現上主要有兩個類,Backend(整個磁盤緩存) 和 Entry(表中的表項)。至少需要一個索引文件和四個數據文件。索引文件用來索引,數據文件又稱塊文件。
索引文件: 包括一個索引頭部和索引地址;頭部用來表示該索引文件的信息(索引文件版本號、索引項數量、文件大小等信息);索引地址表保存各個表項對應的索引地址,直接將文件映射到內存地址。從內存地址可以找到數據文件,數據文件也是一個文件頭加上后面的塊文件,每個塊的大小是固定的,當超過 512 字節的時候會為其分配多個塊。但最多不超過四個,超過通常會用多帶帶的文件存儲。如果一個表項要分配四個塊,那么是和塊索引位置是對齊的(起始塊的位置是4的倍數)
表項結構 分為兩個部分,第一部分標記自己,包括元數據信息和自身內容。另一部分經常發生變動,主要為表項的回收算法服務,保存了回收算法所需的信息(LRU回收算法)。
一次 DNS 查詢約 60~120ms,而 TCP 的三次握手也大約幾十毫秒
DNS 預取:利用現有的 DNS 機制,提前解析網頁中可能的連接。不是使用前面提到的 Chromium 網絡棧,而是直接利用系統的域名解析機制,不會阻礙當前網絡棧的工作,針對多個域名采取并行處理的方式,每個域名的解析由一個新線程處理,結束后退出。網頁開發者可以顯示指定哪些域名來讓 Chromium 解析,使用方法:。 用戶地址欄也同理。
TCP 預鏈接:使用追蹤技術獲取用戶從什么網頁跳轉到另一個網頁,利用這些數據、和一些啟發規則來 DNS 預取和 TCP 預鏈接,這對用戶隱私是一個巨大挑戰。
HTTP1.1 開始增加了管線化技術,可以將多個 HTTP 請求一次性提交給服務器,無需等待服務器回復,因為它可能將多個HTTP 請求填充在一個 TCP 數據包內。能在高延遲的鏈接環境下有明顯的性能提升。
局限性:需要通過永久連接完成,并且只有 GET 和 HEAD 等請求可以進行管線化。
為了解決網絡延遲和安全問題,根據 Google 官方數據,可以將網絡加載時間減少 64%,HTTP2.0 將引入 SPDY 協議,將其作為基礎來編寫。
SPDY 協議是一種新的會話層協議,是一種棧式結構,被定義在 HTTP 協議和 TCP 協議之間,核心是多路復用,僅使用一個連接來傳輸一個網頁中的眾多資源。本質上并沒有改變 HTTP 協議,只是將 HTTP 協議頭通過 SPDY 來封裝傳輸,數據傳輸方式也沒有發生變化。所以比較容易部署,服務器只需要插入 SPDY 協議的解釋層,從 SPDY 的消息頭中獲取各個資源的 HTTP 頭即可。但 SPDY 必須建立在 SSL 層之上。
特征:
利用一個 TCP 連接來傳輸不限個數的資源請求的讀寫數據流,提高 TCP 連接的利用率,減少 TCP 連接的維護成本
可以調整這些資源請求的優先級
對請求使用壓縮技術
可以嘗試發送一些信息給瀏覽器,告訴瀏覽器后面可能需要哪些資源,更極端可以主動發送資源給瀏覽器。
QUIC 是一種新的網絡傳輸協議,目標是改進 UDP 數據協議的能力,解決傳輸層的傳輸效率,并提供數據的加密,SPDY 可以在 QUIC 上工作。
更多《WebKit技術內幕》知識提煉 —— WebKit 架構和模塊
文章版權歸作者所有,未經允許請勿轉載,若此文章存在違規行為,您可以聯系管理員刪除。
轉載請注明本文地址:http://specialneedsforspecialkids.com/yun/7295.html
摘要:但對于很多資源,則可以利用協議減少網絡負載。采用的是多進程的資源加載機制。目前大多數瀏覽器都有磁盤緩存機制,因為緩存機制確實能夠提高網頁的加載速度。 showImg(https://segmentfault.com/img/remote/1460000016215814); 微信公眾號:愛寫bugger的阿拉斯加如有問題或建議,請后臺留言,我會盡力解決你的問題。 前言 此文章是我最近在...
摘要:文章同步到技術內幕之頁面渲染過程最近拜讀了傳說中的技術內幕一書,有很大收獲,尤其是對頁面渲染有了較深的認識。解析語法分析,基于詞法解釋器生成的新標記,構建成抽象語法樹,解析器嘗試將其與某條語法規則進行匹配。 文章同步到github《Webkit技術內幕》之頁面渲染過程 最近拜讀了傳說中的《Webkit技術內幕》一書,有很大收獲,尤其是對頁面渲染有了較深的認識。由于功力有限,而且書中設...
摘要:文章同步到技術內幕之頁面渲染過程最近拜讀了傳說中的技術內幕一書,有很大收獲,尤其是對頁面渲染有了較深的認識。解析語法分析,基于詞法解釋器生成的新標記,構建成抽象語法樹,解析器嘗試將其與某條語法規則進行匹配。 文章同步到github《Webkit技術內幕》之頁面渲染過程 最近拜讀了傳說中的《Webkit技術內幕》一書,有很大收獲,尤其是對頁面渲染有了較深的認識。由于功力有限,而且書中設...
摘要:文章同步到技術內幕之頁面渲染過程最近拜讀了傳說中的技術內幕一書,有很大收獲,尤其是對頁面渲染有了較深的認識。解析語法分析,基于詞法解釋器生成的新標記,構建成抽象語法樹,解析器嘗試將其與某條語法規則進行匹配。 文章同步到github《Webkit技術內幕》之頁面渲染過程 最近拜讀了傳說中的《Webkit技術內幕》一書,有很大收獲,尤其是對頁面渲染有了較深的認識。由于功力有限,而且書中設...
閱讀 1154·2021-09-22 15:43
閱讀 2349·2021-09-22 15:32
閱讀 4506·2021-09-22 15:11
閱讀 2209·2019-08-30 15:55
閱讀 2580·2019-08-30 15:54
閱讀 987·2019-08-30 15:44
閱讀 1103·2019-08-29 13:26
閱讀 798·2019-08-29 12:54