一文看透浏览器架构
作者:廖彩明
在從事前端開發(fā)過程中,瀏覽器作為最重要的開發(fā)環(huán)境,瀏覽器基礎(chǔ)是是前端開發(fā)人員必須掌握的基礎(chǔ)知識點(diǎn),它貫穿著前端的整個網(wǎng)絡(luò)體系。對瀏覽器原理的了解,決定著編寫前端代碼性能的上限。瀏覽器作為JS的運(yùn)行環(huán)境,學(xué)習(xí)總結(jié)下現(xiàn)代瀏覽器的相關(guān)知識
前言
經(jīng)常聽說瀏覽器內(nèi)核,瀏覽器內(nèi)核究竟是什么,以及它做了什么。我們將來了解下瀏覽器的主要組成部分、現(xiàn)代瀏覽器的主要架構(gòu)、瀏覽器內(nèi)核、瀏覽器內(nèi)部是如何工作的
1 瀏覽器
現(xiàn)代瀏覽器結(jié)構(gòu)如下:
The browser's main component
The User Interface
主要提供用戶與Browser Engine交互的方法。其中包括:地址欄(address bar)、向前/退后按鈕、書簽菜單等等。瀏覽器除了渲染請求頁面的窗口外的所有地方都屬于The User InterfaceThe Browser Engine
協(xié)調(diào)(主控)UI和the Rendering Engine,在他們之間傳輸指令。 提供對The Rendering Engine的高級接口,一方面它提供初始化加載Url和其他高級的瀏覽器動作(如刷新、向前、退后等)方法。另一方面Browser Engine也為User Interface提供各種與錯誤、加載進(jìn)度相關(guān)的消息。The Rendering Engine
為給定的URL提供可視化的展示。它解析JavaScript、Html、Xml,并且User Interface中展示的layout。其中關(guān)鍵的組件是Html解析器,它可以讓Rendering Engine展示差亂的Html頁面。 值得注意:不同的瀏覽器使用不同的Rendering Engine。例如IE使用Trident,Firefox使用Gecko,Safai使用Webkit。Chrome和Opera使用Webkit(以前是Blink)The Networking
基于互聯(lián)網(wǎng)HTTP和FTP協(xié)議,處理網(wǎng)絡(luò)請求。網(wǎng)絡(luò)模塊負(fù)責(zé)Internet communication and security,character set translations and MIME type resolution。另外網(wǎng)絡(luò)模塊還提供獲得到文檔的緩存,以減少網(wǎng)絡(luò)傳輸。為所有平臺提供底層網(wǎng)絡(luò)實(shí)現(xiàn),其提供的接口與平臺無關(guān)The JavaScript Interpreter
解釋和運(yùn)行網(wǎng)站上的js代碼,得到的結(jié)果傳輸?shù)絉endering Engine來展示。The UI Backend
用于繪制基本的窗口小部件,比如組合框和窗口。而在底層使用操作系統(tǒng)的用戶界面方法,并公開與平臺無關(guān)的接口。The Data Storage
管理用戶數(shù)據(jù),例如書簽、cookie和偏好設(shè)置等。2 主流瀏覽器的架構(gòu)
2.1 FireFox
FireFox的架構(gòu)
可以看到火狐瀏覽器的渲染引擎(Rendering Engine)使用的是Gecko;XML Parser解析器是Expat;Java Script解釋器是Spider-Monkey(c語言實(shí)現(xiàn))
2.2 Chrome
Chrome的架構(gòu)
渲染引擎Rendering Engine使用的是WebKit
XML Parser: libXML解析XML,libXSLT處理XSLT
JS解釋器使用C++實(shí)現(xiàn)的V8引擎,
2.3 IE
IE的架構(gòu)
渲染引擎主要是Trident
Scripting Engine有JScript和VBScript
3 瀏覽器內(nèi)核
瀏覽器最重要或者說核心的部分是“Rendering Engine”,可大概譯為“渲染引擎”,不過我們一般習(xí)慣將之稱為“瀏覽器內(nèi)核”。主要包括以下線程:
3.1 瀏覽器 GUI 渲染線程,主要包括:
? HTML Parser 解析HTML文檔,將元素轉(zhuǎn)換為樹結(jié)構(gòu)DOM節(jié)點(diǎn),稱之為Content Tree? CSS Parser 解析Style數(shù)據(jù),包括外部的CSS文件以及在HTML元素中的樣式,用于創(chuàng)建另一棵樹,調(diào)用“Render Tree”
? Layout過程 為每個節(jié)點(diǎn)計(jì)算出在屏幕中展示的準(zhǔn)確坐標(biāo)
? Painting 遍歷Render Tree,調(diào)用UI Backend提供的接口繪制每個節(jié)點(diǎn)
3.2 JavaScript 引擎線程
JS引擎線程負(fù)責(zé)解析Javascript腳本,運(yùn)行代碼 JS引擎一直等待著任務(wù)隊(duì)列中任務(wù)的到來,然后加以處理,一個Tab頁(renderer進(jìn)程)中無論什么時候都只有一個JS線程在運(yùn)行JS程序GUI渲染線程與JS引擎線程是互斥的,所以如果JS執(zhí)行的時間過長,這樣就會造成頁面的渲染不連貫,導(dǎo)致頁面渲染加載阻塞
a) 減少 JavaScript 加載對 DOM 渲染的影響(將 JavaScript 代碼的加載邏輯放在 HTML 文件的尾部,減少對渲染引擎呈現(xiàn)工作的影響; b) 避免重排,減少重繪(避免白屏,或者交互過程中的卡頓; c) 減少 DOM 的層級(可以減少渲染引擎工作過程中的計(jì)算量; d) 使用 requestAnimationFrame 來實(shí)現(xiàn)視覺變化(一般來說我們會使用 setTimeout 或 setInterval 來執(zhí)行動畫之類的視覺變化,但這種做法的問題是,回調(diào)將在幀中的某個時點(diǎn)運(yùn)行,可能剛好在末尾,而這可能經(jīng)常會使我們丟失幀,導(dǎo)致卡頓)3.3 瀏覽器定時觸發(fā)器線程
瀏覽器定時計(jì)數(shù)器并不是由 JavaScript 引擎計(jì)數(shù)的, 因?yàn)?JavaScript 引擎是單線程的, 如果處于阻塞線程狀態(tài)就會影響記計(jì)時的準(zhǔn)確, 因此通過單獨(dú)線程來計(jì)時并觸發(fā)定時是更為合理的方案3.4 瀏覽器事件觸發(fā)線程
當(dāng)一個事件被觸發(fā)時該線程會把事件添加到待處理隊(duì)列的隊(duì)尾,等待 JavaScript 引擎的處理。這些事件可以是當(dāng)前執(zhí)行的代碼塊如定時任務(wù)、也可來自瀏覽器內(nèi)核的其他線程如鼠標(biāo)點(diǎn)擊、AJAX 異步請求等,但由于 JavaScript 的單線程關(guān)系所有這些事件都得排隊(duì)等待 JavaScript 引擎處理。3.5 瀏覽器 http 異步請求線程
在 XMLHttpRequest 在連接后是通過瀏覽器新開一個線程請求, 將檢測到狀態(tài)變更時,如果設(shè)置有回調(diào)函數(shù),異步線程就產(chǎn)生狀態(tài)變更事件放到 JavaScript 引擎的處理隊(duì)列中等待處理。4 以Chrome瀏覽器為例,演示瀏覽器內(nèi)部如何工作
上面鋪墊了這么多理論,下面結(jié)合Chrome講解當(dāng)用戶在地址欄上輸入U(xiǎn)RL后,瀏覽器內(nèi)部都做了寫什么
4.1 Chrome瀏覽器中的多進(jìn)程
打開Chrome 任務(wù)管理器,可以看到
Chrome運(yùn)行的進(jìn)程
各個進(jìn)程的功能
? Browser進(jìn)程
功能:Controls "chrome" part of the application including address bar, bookmarks, back and forward buttons. Also handles the invisible, privileged parts of a web browser such as network requests and file access.? GPU進(jìn)程
功能:Handles GPU tasks in isolation from other processes. It is separated into different process because GPUs handles requests from multiple apps and draw them in the same surface.? 第三方插件進(jìn)程
功能:Controls any plugins used by the website, for example, flash. 每個插件對應(yīng)一個進(jìn)程,當(dāng)插件運(yùn)行時創(chuàng)建? 瀏覽器渲染進(jìn)程
功能:Controls anything inside of the tab where a website is displayed. 默認(rèn)每個標(biāo)簽頁創(chuàng)建一個渲染引擎實(shí)例。? V8 Proxy resolver
關(guān)于V8 Proxy resolver可查看code.google.com
group.google.com https://groups.google.com/a/c...!topic/net-dev/73f9B5vFphI
doc.google.com
Chrome支持使用代理腳本為給定的網(wǎng)址選擇代理服務(wù)器,包含使用操作系統(tǒng)提供的代理解析程序的多個平臺的回退實(shí)現(xiàn)。但默認(rèn)情況下(iOS除外),它使用內(nèi)置的解析V8執(zhí)行代理腳本(V8 pac)。今天(截至2015年1月),V8 pac在瀏覽器進(jìn)程中運(yùn)行。這意味著瀏覽器進(jìn)程包含一個V8實(shí)例,這是一個潛在的安全漏洞。在瀏覽器進(jìn)程中允許V8還需要瀏覽器進(jìn)程允許寫入 - 執(zhí)行頁面。
我們關(guān)于將V8 pac遷移到單獨(dú)進(jìn)程的建議包括為解析器創(chuàng)建Mojo服務(wù),從實(shí)用程序進(jìn)程導(dǎo)出該服務(wù),以及從瀏覽器進(jìn)程創(chuàng)建/連接到該進(jìn)程。
瀏覽器進(jìn)程之間主要通過IPC (Inter Process Communication)通信
4.2 Per-frame renderer processes - Site Isolation
Site Isolation is a recently introduced feature in Chrome that runs a separate renderer process for each cross-site iframe. We’ve been talking about one renderer process per tab model which allowed cross-site iframes to run in a single renderer process with sharing memory space between different sites. Running a.com and b.com in the same renderer process might seem okay. The Same Origin Policy is the core security model of the web; it makes sure one site cannot access data from other sites without consent. Bypassing this policy is a primary goal of security attacks. Process isolation is the most effective way to separate sites. With Meltdown and Spectre, it became even more apparent that we need to separate sites using processes. With Site Isolation enabled on desktop by default since Chrome 67, each cross-site iframe in a tab gets a separate renderer process.
每個iframe是單獨(dú)的渲染進(jìn)程
此文已由騰訊云+社區(qū)在各渠道發(fā)布
獲取更多新鮮技術(shù)干貨,可以關(guān)注我們騰訊云技術(shù)社區(qū)-云加社區(qū)官方號及知乎機(jī)構(gòu)號
總結(jié)
- 上一篇: 吉利手机两关联公司更名为星纪魅族 李书福
- 下一篇: 2017年html5行业报告,云适配发布