Angular 1 深度解析:脏数据检查与 angular 性能优化

TL;DR

  1. 脏检查是一种模型到视图的数据映射机制,由 $apply$digest 触发。
  2. 脏检查的范围是整个页面,不受区域或组件划分影响
  3. 使用尽量简单的绑定表达式提升脏检查执行速度
  4. 尽量减少页面上绑定表达式的个数(单次绑定和ng-if
  5. ng-repeat 添加 track by 让 angular 复用已有元素

什么是脏数据检查(Dirty checking)

Angular 是一个 MVVM 前端框架,提供了双向数据绑定。所谓双向数据绑定(Two-way data binding)就是页面元素变化会触发 View-model 中对应数据改变,反过来 View-model 中数据变化也会引发所绑定的 UI 元素数据更新。操作数据就等同于操作 UI。

看似简单,其实水很深。UI 元素变化引发 Model 中数据变化这个通过绑定对应 DOM 事件(例如 inputchange)可以简单的实现;然而反过来就不是那么容易。

比如有如下代码:

<p ng-bind="content1"></p>
<p ng-bind="content2"></p>
<button ng-click="onClick()">Click Me</button>

用户点击了 button,angular 执行了一个叫 onClick 的方法。这个 onClick 的方法体对于 angular 来说是黑盒,它到底做了什么不知道。可能改了 $scope.content1 的值,可能改了 $scope.content2 的值,也可能两个值都改了,也可能都没改。

那么 angular 到底应该怎样得知 onClick() 这段代码后是否应该刷新 UI,应该更新哪个 DOM 元素?

angular 必须去挨个检查这些元素对应绑定表达式的值是否有被改变。这就是脏数据检查的由来(脏数据检查以下简称脏检查)。

脏检查如何被触发

angular 会在可能触发 UI 变更的时候进行脏检查:这句话并不准确。实际上,脏检查是 $digest](https://docs.angularjs.org/api/ng/type/$rootScope.Scope#$digest) 执行的,另一个更常用的用于触发脏检查的函数 [$apply 其实就是 $digest 的一个简单封装(还做了一些抓异常的工作)。

通常写代码时我们无需主动调用 $apply$digest 是因为 angular 在外部对我们的回调函数做了包装。例如常用的 ng-click,这是一个指令(Directive),内部实现则 类似

DOM.addEventListener('click', function ($scope) {
  $scope.$apply(() => userCode());
});

可以看到:ng-click 帮我们做了 $apply 这个操作。类似的不只是这些事件回调函数,还有 $http$timeout 等。我听很多人抱怨说 angular 这个库太大了什么都管,其实你可以不用它自带的这些服务(Service),只要你记得手工调用 $scope.$apply

脏检查的范围

前面说到:angular 会对所有绑定到 UI 上的表达式做脏检查。其实,在 angular 实现内部,所有绑定表达式都被转换为 $scope.$watch()。每个 $watch 记录了上一次表达式的值。有 ng-bind="a" 即有 $scope.$watch('a', callback),而 $scope.$watch 可不会管被 watch 的表达式是否跟触发脏检查的事件有关。

例如:

<div ng-show="false">
  <span id="span1" ng-bind="content"></span>
</div>
<span id="span2" ng-bind="content"></span>
<button ng-click="">TEST</button>

问:点击 TEST 这个按钮时会触发脏检查吗?触发几次?

首先:ng-click="" 什么都没有做。angular 会因为这个事件回调函数什么都没做就不进行脏检查吗?不会。

然后:#span1 被隐藏掉了,会检查绑定在它上面的表达式吗?尽管用户看不到,但是 $scope.$watch('content', callback) 还在。就算你直接把这个 span 元素干掉,只要 watch 表达式还在,要检查的还会检查。

再次:重复的表达式会重复检查吗?会。

最后:别忘了 ng-show="false"。可能是因为 angular 的开发人员认为这种绑定常量的情况并不多见,所以 $watch 并没有识别所监视的表达式是否是常量。常量依旧会重复检查。

所以:

答:触发三次。一次 false,一次 content,一次 content

所以说一个绑定表达式只要放在当前 DOM 树里就会被监视,不管它是否可见,不管它是否被放在另一个 Tab 里,更不管它是否与用户操作相关。

另外,就算在不同 Controller 里构造的 $scope 也会互相影响,别忘了 angular 还有全局的 $rootScope,你还可以 $scope.$emit。angular 无法保证你绝对不会在一个 Controller 里更改另一个 Controller 生成的 scope,包括 自定义指令(Directive)生成的 scopeAngular 1.5 里新引入的组件(Component)。

所以说不要怀疑用户在输入表单时 angular 会不会监听页面左边导航栏的变化。

脏检查与运行效率

脏检查慢吗?

说实话脏检查效率是不高,但是也谈不上有多慢。简单的数字或字符串比较能有多慢呢?十几个表达式的脏检查可以直接忽略不计;上百个也可以接受;成百上千个就有很大问题了。绑定大量表达式时请注意所绑定的表达式效率。建议注意一下几点:

  1. 表达式(以及表达式所调用的函数)中少写太过复杂的逻辑
  2. 不要连接太长的 filter(往往 filter 里都会遍历并且生成新数组)
  3. 不要访问 DOM 元素。

使用单次绑定减少绑定表达式数量

单次绑定(One-time binding 是 Angular 1.3 就引入的一种特殊的表达式,它以 :: 开头,当脏检查发现这种表达式的值不为 undefined 时就认为此表达式已经稳定,并取消对此表达式的监视。这是一种行之有效的减少绑定表达式数量的方法,与 ng-repeat 连用效果更佳(下文会提到),但过度使用也容易引发 bug。

善用 ng-if 减少绑定表达式的数量

如果你认为 ng-if 就是另一种用于隐藏、显示 DOM 元素的方法你就大错特错了。

ng-if 不仅可以减少 DOM 树中元素的数量(而非像 ng-hide 那样仅仅只是加个 display: none),每一个 ng-if 拥有自己的 scopeng-if 下面的 $watch 表达式都是注册在 ng-if 自己 scope 中。当 ng-if 变为 falseng-if 下的 scope 被销毁,注册在这个 scope 里的绑定表达式也就随之销毁了。

考虑这种 Tab 选项卡实现:

<ul>
  <li ng-class="{ selected: selectedTab === 1 }">Tab 1 title</li>
  <li ng-class="{ selected: selectedTab === 1 }">Tab 2 title</li>
  <li ng-class="{ selected: selectedTab === 1 }">Tab 3 title</li>
  <li ng-class="{ selected: selectedTab === 1 }">Tab 4 title</li>
</ul>
<div ng-show="selectedTab === 1">[[Tab 1 body...]]</div>
<div ng-show="selectedTab === 2">[[Tab 2 body...]]</div>
<div ng-show="selectedTab === 3">[[Tab 3 body...]]</div>
<div ng-show="selectedTab === 4">[[Tab 4 body...]]</div>

对于这种会反复隐藏、显示的元素,通常人们第一反应都是使用 ng-showng-hide 简单的用 display: none 把元素设置为不可见。

然而入上文所说,肉眼不可见不代表不会跑脏检查。如果将 ng-show 替换为 ng-ifng-switch-when

<div ng-if="selectedTab === 1">[[Tab 1 body...]]</div>
<div ng-if="selectedTab === 2">[[Tab 2 body...]]</div>
<div ng-if="selectedTab === 3">[[Tab 3 body...]]</div>
<div ng-if="selectedTab === 4">[[Tab 4 body...]]</div>

有如下优点:

  1. 首先 DOM 树中的元素个数显著减少至四分之一,降低内存占用
  2. 其次 $watch 表达式也减少至四分之一,提升脏检查循环的速度
  3. 如果这个 tab 下面有 Controller(例如每个 tab 都被封装为一个组件),那么仅当这个 tab 被选中时该 Controller 才会执行,可以减少各页面的互相干扰
  4. 如果 Controller 中调用接口获取数据,那么仅当对应 tab 被选中时才会加载,避免网络拥挤

当然也有缺点:

  1. DOM 重建本身费时间
  2. 如果 tab 下有 Controller,那么每次该 tab 被选中时 Controller 都会被执行
  3. 如果在 Controller 里面调接口获取数据,那么每次该 tab 被选中时都会重新加载

各位读者自己取舍。

当脏检查遇上数组

ng-repeat!这就更有(e)趣(xin)了。通常的绑定只是去监听一个值的变化(绑定对象也是绑定到对象里的某个成员),而 ng-repeat 却要监视一整个数组对象的变化。例如有:

<ul ng-init="array = [
  { value: 1 },
  { value: 2 },
  { value: 3 },
  { value: 4 },
]">
  <li ng-repeat="item in array" ng-bind="item.value"></li>
</ul>

会生成 4 个 li 元素

  • 1
  • 2
  • 3
  • 4

没有问题。如果我添加一个按钮如下:

<button ng-click="array.shift()">删除第一个元素</button>

请考虑:当用户点击这个按钮会发生什么?

我们一步一步分析。开始的时候,angular 记录了 array 的初始状态为:

[
  { "value": 1 },
  { "value": 2 },
  { "value": 3 },
  { "value": 4 }
]

当用户点击按钮后,数组的第一个元素被删除了,array 变为:

[
  { "value": 2 },
  { "value": 3 },
  { "value": 4 }
]

两者比较:

  1. array.length = 4 => array.length = 3
  2. array[0].value = 1 => array[0].value = 2
  3. array[1].value = 2 => array[1].value = 3
  4. array[2].value = 3 => array[2].value = 4
  5. array[3].value = 4 => array[3].value = undefinedarray[4]undefined,则 undefined.value 为 undefined,见 Angular 表达式的说明

如同你所见:angular 经过比较,看到的是:

  1. 数组长度减少了 1
  2. 数组第 1 个元素的 value 被改为 2
  3. 数组第 2 个元素的 value 被改为 3
  4. 数组第 3 个元素的 value 被改为 4

反应到 DOM 元素上就是:

  1. 第 1 个 li 内容改为 2
  2. 第 2 个 li 内容改为 3
  3. 第 3 个 li 内容改为 4
  4. 第 4 个 li 删掉

可以看到,删除一个元素导致了整个 ul 序列的刷新。要知道 DOM 操作要比 JS 变量操作要慢得多,类似这样的无用操作最好能想办法避免。

那么问题出在哪里呢?用户删除了数组的第一个元素,导致了整个数组元素前移;然而 angular 没法得知用户做了这样一个删除操作,只能傻傻的按下标一个一个比。

那么只要引入一种机制来标记数组的每一项就好了吧。于是 angular 引入了 track by

详解 track by

用来标记数组元素的一定是数组里类似 ID 的某个值。这个值一定要符合以下这两个特点。

  1. 不能重复。ID 重复了什么鬼
  2. 值一定要简单。ID 是用于比较相等的,有时候由于算法不同可能还要比较大小,处于速度考虑不能太复杂。

基于这两个特点。如果用户没有给 ng-repeat 指定 track by 的表达式,则默认为内置函数 $id$id 会检查 item 中有没有一个名为 $$hashKey` 的成员。如有,返回其值;如没有,则生成一个新的唯一值写入。这就是数组中那个奇怪的 `$$hashKey 成员来历,默认值是 "object:X"(你问我为什么是个字符串而不是数字?我怎么知道。。。)

还是前面的问题,引入 track by 后再来看。因为没有指定 track by,则默认为 $id(item),实际为 $$hashKey

<ul ng-init="array = [
  { value: 1 },
  { value: 2 },
  { value: 3 },
  { value: 4 },
]">
  <li ng-repeat="item in array track by $id(item)" ng-bind="item.value"></li>
</ul>

开始的时候,$id(item) 给数组中所有项创建了 $$hashKey

这时 angular 记录了 array 的初始状态为:

[
  { "value": 1, "$$hashKey": "object:1" },
  { "value": 2, "$$hashKey": "object:2" },
  { "value": 3, "$$hashKey": "object:3" },
  { "value": 4, "$$hashKey": "object:4" }
]

当用户点击按钮后,数组的第一个元素被删除了,array 变为:

[
  { "value": 2, "$$hashKey": "object:2" },
  { "value": 3, "$$hashKey": "object:3" },
  { "value": 4, "$$hashKey": "object:4" }
]

先比较 track by 的元素,这里为 $id(item),即 $$hashKey

  1. "object:1" => "object:2"
  2. "object:2" => "object:3"
  3. "object:3" => "object:4"
  4. "object:4" => undefined

两者对不上,说明数组被做了增删元素或者移动元素的操作。将其规整

  1. "object:1" => undefined
  2. "object:2" => "object:2"
  3. "object:3" => "object:3"
  4. "object:4" => "object:4"

那么显然,第一个元素被删除了。再比较剩余的元素

  1. array[0].value = 2 => array[0].value = 2
  2. array[1].value = 3 => array[1].value = 3
  3. array[2].value = 4 => array[2].value = 4

结论是:

  1. 原数组第一个元素被删除
  2. 其他没变

angular 通过将新旧数组的 track by 元素做 diff 猜测用户的行为,最大可能的减少 DOM 树的操作,这就是 track by 的用处。

默认 track by 的坑

So far so good! 然而需求某天有变,程序员小哥决定用 filter 给数组做 map 后再渲染。

<ul ng-init="array = [
  { value: 1 },
  { value: 2 },
  { value: 3 },
  { value: 4 },
]">
  <li ng-repeat="item in array | myMap" ng-bind="item.value"></li>
</ul>

map 定义如下:

xxModule.filter('map', function () {
  return arr => arr.map(item => ({ value: item.value + 1 }));
});

ng-repeat 执行时先计算表达式 array | myMap 的值:

arrayForNgRepeat = [
  { value: 2 },
  { value: 3 },
  { value: 4 },
  { value: 5 },
]

注意数组 arrayForNgRepeat 和原来的数组 array 不是同一个引用,因为 filter 里的 map 操作生成了一个新数组,每一项都是新对象,跟原数组无关。

ng-repeat 时,angular 发现用户没有指定 track by,按照默认逻辑,使用 $id(item) 作为 track by,添加 $$hashKey

arrayForNgRepeat = [
  { value: 2, "$$hashKey": "object:1" },
  { value: 3, "$$hashKey": "object:2" },
  { value: 4, "$$hashKey": "object:3" },
  { value: 5, "$$hashKey": "object:4" },
]

生成 DOM:

  • 2
  • 3
  • 4
  • 5

这里请再次注意:数组 arrayForNgRepeat 与原始数组 array 没有任何关系,数组本身是不同的引用,数组里的每一项也是不同引用。修改新数组的成员不会影响到原来的数组。

这时 array 的值:

array = [
  { value: 1 },
  { value: 2 },
  { value: 3 },
  { value: 4 },
]

这时用户的某个无关操作触发了脏检查。针对 ng-repeat 表达式,首先计算 array | myMap 的值:

newArrayForNgRepeat = [
  { value: 2 },
  { value: 3 },
  { value: 4 },
  { value: 5 },
]

先比较 track by 的元素。用户没有指定,默认为 $id(item)

$id 发现数组中有一些元素没有 $$hashKey`,则给它们填充新 `$$hashKey,结果为

newArrayForNgRepeat = [
  { value: 2, "$$hashKey": "object:5" },
  { value: 3, "$$hashKey": "object:6" },
  { value: 4, "$$hashKey": "object:7" },
  { value: 5, "$$hashKey": "object:8" },
]

这时两边的 track by 的实际结果为

  1. "object:1" => "object:5"
  2. "object:2" => "object:6"
  3. "object:3" => "object:7"
  4. "object:4" => "object:8"

两者对不上,说明数组被做了增删元素或者移动元素的操作。将其规整

  1. "object:1" => undefined
  2. "object:2" => undefined
  3. "object:3" => undefined
  4. "object:4" => undefined
  5. undefined => "object:5"
  6. undefined => "object:6"
  7. undefined => "object:7"
  8. undefined => "object:8"

结论是:

  1. 原数组全部 4 个元素被删除
  2. 新添加了 4 个元素

于是 angular 把原来所有 li 删除,再创建 4 个新的 li 元素,填充它们的 textContent,放到 ul

如果怀疑我说的话,请自己在浏览器里测试。你可以清楚的看到调试工具里 DOM 树的闪烁

track by 与性能

不恰当的 ng-repeat 会造成 DOM 树反复重新构造,拖慢浏览器响应速度,造成页面闪烁。除了上面这种比较极端的情况,如果一个列表频繁拉取 Server 端数据自刷新的话也一定要手工添加 track by,因为接口给前端的数据是不可能包含 $$hashKey 这种东西的,于是结果就造成列表频繁的重建。

其实不必考虑那么多,总之加上没坏处,至少可以避免 angular 生成 $$hashKey 这种奇奇怪怪的东西。所以

请给 ng-repeat 手工添加 track by

重要的事情再说一遍

请给 ng-repeat 手工添加 track by

通常列表都是请求接口从数据库中读取返回的。通常数据库中的记录都有一个 id 字段做主键,那么这时使用 id 作为 track by 的字段是最佳选择。如果没有,可以选择一些业务字段但是确保不会重复的。例如一个连表头都是动态生成的表格,表头就可以使用其字段名作为 track by 的字段(对象的 key 是不会重复的)。

如果真的找不到用于 track by 的字段,让 angular 自动生成 $$hashKey 也不是不可以,但是切记检查有没有出现 DOM 元素不断重刷的现象,除了仔细看调试工具的 DOM 树是否闪烁之外,给列表中的元素添加一个特别的标记(比如 style="background: red"),也是一个行之有效的方法(如果这个标记被意外清除,说明原来的 DOM 元素被删除了)。

除非真的没办法,不推荐使用 $index 作为 track by 的字段。

track by单次绑定 连用

track by 只是让 angular 复用已有 DOM 元素。数组每个子元素内部绑定表达式的脏检查还是免不了的。然而对于实际应用场景,往往是数组整体改变(例如分页),数组每一项通常却不会单独变化。这时就可以通过使用单次绑定大量减少 $watch 表达式的数量。例如

<li ng-repeat="item in array track by item.id">
  <div>a: <span ng-bind="::item.a"></span></div>
  <div>b: <span ng-bind="::item.b"></span></div>
  <div>c: <span ng-bind="::item.c"></span></div>
  <div>d: <span ng-bind="::item.d"></span></div>
  <div>e: <span ng-bind="::item.e"></span></div>
</li>

除非 track by 字段改变造成的 DOM 树重建,item.a 等一旦显示在页面上后就不会再被监视。

如果每行有 5 个绑定表达式,每页显示 20 条记录,通过这种方法每页就可以减少 5 * 20 = 100 个绑定表达式的监视。

注意:如果在 ng-repeat 内部使用的单次绑定,就一定不要用 track by $index。否则用户切换下一页页面也不会更新。

使用分页减少绑定个数

这个就不多说了。能后端分页的就后端分页;接口不支持分页的也要前端分页;前端分页时可以简单的写个 filterArray.prototype.slice 实现。

能直接减少数组中项的个数就不要在 ng-repeat 中每项上写 ng-showng-if

写在最后的话

脏检查这个东西,其实在三大主流前端框架中或多或少都有涉及。React 每次生成新的 Virtual DOM,与旧 Virtual DOM 的 diff 操作本来就可以看做一次脏检查。Vue 从相对彻底的抛弃了脏检查机制,使用 Property 主动触发 UI 更新,但是 Vue 仍然不能抛弃 track by 这个东西。

既然脏检查在三大主流框架里或多或少都有所保留,为什么唯独 Angular 的性能被广为诟病呢?其实还是说在 Angular 1 的机制下,脏检查的执行范围过大以及频率太过频繁了。Angular 1.5 从 Angular 2+ 引入了组件(Component)的概念,然而形似而神非,其实只是一个特殊的 Directive 马甲而已,并不能将脏检查的执行范围限制在各个组件之内,所以并不能本质的改变 Angular 1 脏检查机制效率低下的现状。

也许 Angular 1 终将被淘汰。但 Angular 作为前端第一个 MVVM 框架,着实引发了前端框架更新换代的热潮。百足之虫死而不僵,不管怎么样我还得继续维护停留在电脑里的 Angular 1 项目。不过也许老板哪天大发慈悲给我们用 Vue 重构整个项目的时间,将来的事情谁知道呢?

相关推荐