浏览器的工作原理整理

苗疆三刀的随手记

2019-06-29

关注关注

浏览器的结构

浏览器的主要组件包括：

用户界面——包括地址栏、前进/后退按钮、书签菜单等。除了浏览器主窗口显示用户请求的页面外，其他显示的各个部分都属于用户界面。
用户界面后端——用于绘制基本的窗口小部件，比如组合框和窗口。其公开了与web应用无关的通用接口，而在底层使用操作系统的用户界面方法。
浏览器引擎——在用户界面和渲染引擎之间传递指令。
渲染引擎——负责显示请求的内容。如果请求的内容是HTML,它就解析HTML和css内容，并将解析后的内容显示在窗口上。
网络——用于网络调用。比如http请求。其接口与web应用无关，并为所有web应用提供底层实现。
JavaScript解释器。用于解析和执行 JavaScript 代码，比如chrome的javascript解释器是V8。
数据存储。这是持久层。浏览器需要在硬盘上保存各种数据，例如cookie。新的HTML5规范定义了“网络数据库”，这是一个完整的且轻便的浏览器内数据库。

浏览器的工作原理整理

值得注意的是，不同于大多数浏览器，chrome浏览器为每个标签页都分配了各自的渲染引擎实例，每个标签页都是一个独立的进程（即每个标签页都在独立的“沙箱”内运行，在提高安全性的同时，一个标签页面崩溃也不会导致其他的标签页被关闭）

浏览器进程与线程

进程是cpu资源分配的最小单位（是能拥有资源和独立运行的最小单位）
线程是cpu调度的最小单位（线程是建立在进程的基础上的一次程序运行单位，一个进程可以有多个线程）

浏览器是多进程的，有一个主控进程，以及每一个tab页面都会新开一个进程（某些情况下多个tab会合并进程）

浏览器的进程为以下几种：

Browser进程：浏览器的主进程（负责协调、主控），只有一个
第三方插件进程：每种类型的插件对应一个进程，仅当使用该插件的时候才创建
GPU进程：最多一个，用于3D绘制
浏览器渲染进程（内核）：默认每个tab页面一个进程，互不影响，控制页面渲染，脚本执行，事件处理等（有时会优化，如多个空白tab会合成一个进程）

浏览器的工作原理整理
每一个tab页面可以看作是浏览器内核进程，然后这个进程是多线程的，他又几大类子线程：

GUI线程
注意：GUI渲染线程与js引擎线程是互斥的，当js引擎执行时GUI线程会被挂起（相当于被冻结），GUI更新会被保存在一个队列中等到Js引擎空闲时立即被执行
JS引擎线程
js引擎一直等待着任务队列中任务的到来，然后加以处理，一个tab页中无论什么时候都只有一个js线程在运行js程序
事件触发线程
定时器线程
setInterval与setTimeout所在的线程
浏览器定时器计数器并不是由js引擎计数的，（因为js引擎时单线程的，如果处于阻塞线程状态就会影响计时的准确）
因此通过单线程来计时并触发定时（计时完毕后，添加到事件队列中，等待js引擎空闲后执行）
注意，W3C在HTML标准中规定，规定要求setTimeout中低于4ms的时间间隔算为4ms。
网络请求线程
在XMLHttpRequest在连接后是通过浏览器新开一个线程请求
将检测到状态变更时，如果设置有回调函数，异步线程就产生状态变更事件，将这个回调再放入事件队列中。再由JavaScript引擎执行。

每次网络请求时都需要开辟单独的线程进行，譬如如果URL解析到http协议，就会新建一个网络线程去处理资源下载。因此浏览器会根据解析出得协议，开辟一个网络线程，前往请求资源

进程之间的通信

五种通讯方式总结：

管道：速度慢，容量有限，只有父子进程能通讯
FIFO：任何进程间都能通讯，但速度慢
消息队列：容量受到系统限制，且要注意第一次读的时候，要考虑上一次没有读完的数据的问题
信号量：不能传递复杂消息，只能用来同步
共享内存区：能够很容易控制容量，速度快，但要保持同步，比如一个进程在写的时候，另一个进程要注意读写的问题，相当于线程种的线程安全，当然，共享内存区同样可以用作线程间通讯，不过没有这个必要，线程间本来就已经共享了统一进程内的一块内存。

由于浏览器每一个tab页面即为一个进程，页面间的通信即为进程的通信

window.open(url,name,featrues,replace)
url:(可选)为空则打开空白新窗口
name：（可选）子窗口的句柄。声明新窗口的名称。若名字已存在则在指定窗口打开。仅当同源或该脚本打开了这个窗口才可以通过名字进项指定窗口
Features (可选) 声明新窗口要显示的标准浏览器的特征(必须是打开空白窗口)。
Replace(可选) 为true的话则替换浏览历史中的当前条目(返回回不去)，默认为false,创建新条目。

渲染引擎

渲染引擎也称为浏览器内核，主要时在浏览器窗口中显示所请求的内容，这是每个浏览器的核心部分。

常见的浏览器渲染引擎有两种：一是firefox使用的Gecko，这是Mozilla公司“自制”的渲染引擎。另一个是safari和chrome使用的都是webkit。

渲染流程：
渲染引擎一开始会从网络层获取请求的文档的内容，通常以8k分块的方式完成，获取了文档内容之后，渲染引擎开始正式工作
渲染引擎解析HTML文档，并将文档中的标签转化为dom节点树，同时，它会解析外部css文件以及style标签中的样式数据。这些样式信息连同HTML中的可见内容一起，被用于构建另一颗树——渲染树（RenderTree）。
渲染树由一些带有视觉属性（如颜色、大小等）的矩形组成，这些矩形将按照正确的顺序显示在屏幕上。
渲染树构建完毕之后，将会进入“布局”处理阶段，即为每一个节点分配一个屏幕坐标。再下一步就是绘制，即遍历renderTree，并使用UI后端层绘制每个节点。
注意：这个过程时逐步完成的，为了更好的用户体验，渲染引擎将会尽可能的早的将内容呈现在屏幕上，并不会等到所有的Html都解析完成之后再去构建和布局renderTree。它时解析完一部分内容就显示一部分内容，同时，可能还在通过网络下载其余内容。

js js代码线程阻塞浏览器引擎线程 javascript

安科网

浏览器的工作原理整理

苗疆三刀的随手记

浏览器的结构

浏览器进程与线程

渲染引擎

苗疆三刀的随手记

相关推荐

WebAssembly及其 API 的完整介绍

通过构建自己的JavaScript测试框架来了解JS测试

想要在JS中把正则玩得飘逸，学会这几个函数的使用必不可少

js实现表格单列按字母排序

js实现表格数据搜索

浅谈AjaxPro.dll,asp.net 前台js调用后台方法

前端 HTMLTestRunner中JS的用法

gulp 构建 demo

SpringBoot入门二十五,默认的404错误页面引入css和js文件

selenium键盘操作，执行JS，上传文件

JS事件、Bom对象和Dom对象（1）（乐字节架构）

python 爬虫遇到 Cloudflare 邮箱加密

ES6-Babel-Browserify模块化教程

【AJAX】Asynchronous JavaScript And XML （非同步的JS & XML）

原生JavaScript(JS)修改添加CSS样式表（更好的性能）

JS原型对象操作实例分析

js实现mp3录音通过websocket实时传送+简易波形图效果

详解用js代码触发dom事件的实现方案

uglifyjs 合并压缩 js, clean-css 合并压缩css

gulp js文件压缩 es6 代码转换

webpack 之压缩js代码和html文件

苗疆三刀的随手记