六、运行时
虽然我们已经趟过了资源加载这个优化的大头,但仍然不能掉以轻心,在应用运行时你仍然可能踩到一些性能的“坑”。下面就让我们来具体看一看。
1. 注意强制同步布局
1.1. 什么是强制同步布局
作为前端,大家应该对“强制同步布局”并不陌生。如果你不太了解,这里简单介绍一下。首先你需要知道的是,显示器有一个自己的刷新频率,例如每秒 60 次(60 FPS)。这就意味着,每过 16.6ms,浏览器就会将截止上次刷新后的元素变动应用到屏幕上。这里就不得不提到渲染管线了。
在渲染管线中,有一步叫做 Layout,也就是布局。它会计算元素的大小、位置信息,而且一处的改动几乎会影响到整个文档页面。所以 Layout 的消耗是非常巨大的。而我们所说的 reflow(firefox)与 layout(Chrome/Opera/Safari/IE),都是指的这一过程。另一方面,渲染线程和 JavaScript 执行线程是互斥的,所以这 16.6ms 还会被 JavaScript 的执行所瓜分,可见时间并不那么“富裕”。
我们先来看一段代码:
var $ele = document.getElementById('main');
var height = $ele.offsetHeight;
// ……
2
3
上述代码获取了元素的 offsetHeight
值,浏览器此时会使用上一次渲染后的缓存值进行返回,所以浏览器消耗并不大。
而有一些 JavaScript 操作会导致浏览器需要提前执行布局操作,这种操作就被称为“强制同步布局”。我们把上面的代码改成如下所示:
var $ele = document.getElementById('main');
$ele.classList.remove('large');
var height = $ele.offsetHeight;
// ……
2
3
4
由于我们在修改元素的 className 后又立刻获取了它的高度,为了保证高度值正确,浏览器会立即进行布局,然而我们的本意可能并非如此 —— 也许 large
并不会影响高度,也许我们只是想获取上一帧的结果…… 针对这种目的,下面的写法会更合适,同时可以避免强制同步布局。
var height = $ele.offsetHeight;
var $ele = document.getElementById('main');
$ele.classList.remove('large');
// ……
2
3
4
从这个例子可以看到,我们很可能一不小心就触发了强制同步布局。除了上例中的 offsetHeight
,还有许多会触发强制同步布局[1]的属性。而 CSS Triggers[2] 这个网站在 Layout 之外,列出了各个浏览器中会触发 Paint 和 Composite 的 CSS 属性。
1.2. 尝试使用 RAF 避免强制同步布局
在强制同步布局的问题上,还有一些更严重的列子,例如在循环中不断触发强制同步布局。
如果你希望避免在浏览器进行页面重绘后执行一些操作,你可以使用 requestAnimationFrame
API。由于上一帧的旧布局值是可以直接获取的,所以我们可以将布局查询的操作放在 requestAnimationFrame
中。
window.requestAnimationFrame(() => {
var $ele = document.getElementById('main');
var height = $ele.offsetHeight;
// ……
});
2
3
4
5
但是请注意,如果像下面这样犯了和之前一样的错误,在查询布局之前设置了新的元素样式/布局属性,那使用了 requestAnimationFrame
也无法避免性能问题。
window.requestAnimationFrame(function () {
var $ele = document.getElementById('main');
$ele.classList.remove('large');
var height = $ele.offsetHeight;
// ……
});
2
3
4
5
6
1.3. 批量化你的操作
批量化是计算机程序优化中的重要手段之一。例如一些数据库在写操作上最终也是会将其批量化后再统一进行磁盘 I/O。所以对于元素布局的查询操作,我们也可以尝试使用这种手段。我们可以将这些操作批量化存储下来,等到下一次 requestAnimationFrame
触发时一起执行。FastDom 就是一个帮你封装了这类操作的开源库。
By batching DOM access we avoid unnecessary document reflows and dramatically speed up layout performance. Each measure/mutate job is added to a corresponding measure/mutate queue. The queues are emptied (reads, then writes) at the turn of the next frame using window.requestAnimationFrame.
上面是它的基本工作原理,和我们提到的思路是一样的。基本的使用方法如下:
fastdom.measure(() => {
const width = element.clientWidth;
});
2
3
fastdom.mutate(() => {
element.style.width = width + 'px';
});
2
3
2. 长列表优化
有些时候,你可能会需要在页面上展示一个包含上百个元素的列表(例如一个 Feed 流)。每个列表元素还有着复杂的内部结构,这显然提高了页面渲染的成本。甚至当你使用一些像 React 这样的库时,长列表的问题会被进一步放大。那么,有没有什么方法来优化长列表呢?
2.1. 实现 Virtual List
Virtual List 是一种用来优化长列表的技术。它可以保证在列表元素不断增加,或者列表元素很多的情况下,依然拥有很好的滚动、浏览性能。它的核心思想在于:只渲染可见区域附近的列表元素。下图左边就是 Virtual List 的效果,可以看到只有视口内和临近视口的上下区域内的元素会被渲染。
不过这样带来的一个问题就是,由于只渲染固定 N 个元素,所以在页面滚动后,它们仍然留在原位。对于这个问题可以使用 position: absolute
配合 transform: translate3d()
来解决,手动设置展示元素的偏移量。
其大致的实现思路如下:
- 监听页面滚动(或者其他导致视口变化的事件);
- 滚动时根据滚动的距离计算需要展示的列表项;
- 将列表项中展示的数据与组件替换成当前需要展示的内容;
- 修改偏移量到对应的位置。
这样还有一个好处,相当于是不断改变这 N 个元素的位置属性和内部的一些节点,不会有频繁的 DOM 创建与销毁,配合下面提到的 composite 可以获得不错的性能。
如果你想要使用这项技术,除了自己实现外,一些常见的框架也有不错的开源实现。例如:
- 基于 React 的 react-virtualized,它的开发者也在 dev.to 上分享了一些关于 virtual list 的内容[3];
- 基于 Vue 的 vue-virtual-scroll-list;
- 基于 Angular 的 ngx-virtual-scroller;
- ……
2.2. 原生的 Virtual Scroller
Virtual List 在 feed 流、图片库等很多场景下非常有用,开源组件的下载量也说明了业务对这个功能的需求量。那么自然会想到,如果由浏览器层面来提供类似的能力,显然适用性会更强,性能可能也会更好。Virtual Scroller 就是上述逻辑的浏览器原生实现。Chrome Dev Summit 2018[4] 上演示了它的效果。使用上也很简单:
<script type="module">
import "std:virtual-scroller";
</script>
<virtual-scroller>
<div>item 1</div>
<div>item 2</div>
<div>item 3</div>
<div>item 4</div>
……
<div>item 1000</div>
</virtual-scroller>
2
3
4
5
6
7
8
9
10
11
12
注意,<virtual-scroller>
是内置(built-in)模块提供的,所以需要从 std
中导入。目前(2019.08)还不建议在生产环境中使用该功能。如果想得到类似的效果还是建议使用基于 JavaScript 实现的库。当然,非常期待未来在生产环境中可以用上这个功能。
想了解更多关于 Virtual Scroller 的信息可以看这里[5]。
3. 避免 JavaScript 运行时间过长
上面我们提到了,屏幕的刷新频率决定了每帧之间留给 JavaScript 执行的时间“并不多”。也正是由于渲染线程和 JavaScript 线程之间互斥,所以 JavaScript 执行占用时间过长会导致无法及时渲染,即出现所谓的“掉帧”。下面我们来看下如何避免 JavaScript 长时间执行而导致的掉帧。
3.1. 任务分解
你可以在 Chrome 控制台执行如下命令:
document.body.innerHTML = '';
for(var i = 0; i < 100; i++) {1+1}
2
可以看到页面被立即清空了。然后我们修改一下迭代的次数,从 100 次增加到 10 亿次:
document.body.innerHTML = '';
for(var i = 0; i < 1e9; i++) {1+1}
2
这时候运行你会发现页面没有变化,控制台也卡住了。过了几秒后页面被清空了。这是因为 JavaScript 的长时间执行阻塞了渲染线程。
既然长时间的运行会导致渲染阻塞,那么最简单的方法就是把我们的任务拆成一个个持续时间更短的小任务,分散到各个帧中执行,例如改造成下面这样:
document.body.innerHTML = '';
let step = 0;
function subtask() {
if (step === 1e9) {
return;
}
window.requestAnimationFrame(function () {
for(var i = 0; i < 1e8; i++) {step++; 1+1}
subtask();
});
}
subtask();
2
3
4
5
6
7
8
9
10
11
12
13
我们把 10 亿次分散为十个 1 亿次的子任务,虽然同样执行了 10 亿次计算,但是页面迅速被清空了。
此外,浏览器还有一个更强大的 API 来帮助你更精细地进行计算调度,它就是 requestIdleCallback。它会在浏览器“空闲”的时候执行注册的回调函数,避免在主线程“拥挤”的时候执行某些代码。它支持你设定一个超时参数,保证在超时后,即使仍然没有空闲时间也必须执行回调。回调函数会接收一个 IdleDeadline
类型的参数,你可以通过 .didTimeout
来查看是否是超时执行,还可以通过执行 .timeRemaining()
方法来查看剩余的空闲时间。
window.requestIdleCallback(deadline => {
if (deadline.timeRemaining() > 100) {
// 一些可以等浏览器空闲了再去做的事
// ……
}
}, {timeout: 5000})
2
3
4
5
6
上面是基本的使用方式,具体的使用方式可以查看这里[6]
3.2. 延迟执行
一般来说,延迟执行分为两种策略:
- 一种是懒执行,例如当我需要某个值时,我才去计算;
- 第二种是延后执行,即利用
setTimeout
、requestIdleCallback
这样的方法把计算放到后续的事件循环或空闲时刻。
一些场景下,这两个都是可行的方法。除此以外,在 Idle Until Urgent[7] 中作者介绍了一种改进的方法:把计算放到 requestIdleCallback
中,如果你一直不需要用到计算结果也没有关系,它会等到空闲时再执行,不影响性能;而当你要使用时,如果还未计算好则会立刻进行计算并返回结果,同时取消未执行的 requestIdleCallback
。
我们在这两部分都提及了
requestIdleCallback
,它确实是个非常不错的 API,然而目前(2019.08)兼容性不是很乐观。如果你希望在生产环境中使用,建议使用 polyfill。
3.3. 并行计算
对于一些 CPU 密集型的计算场景,除了在主 JavaScript 线程中拆分调度任务、异步执行之外,我们还可以考虑将计算与主线程并行。在浏览器中启用并行线程可以使用 Web Worker[8] 中。在 Web Worker 标准出现之前,你能做的只是将任务异步化(asynchronously),而有了 Web Worker,你就可以并行(concurrency)地执行 JavaScript 了。
下面提供了 Web Worker 的基本使用方式:
// index.js
const worker = new Worker('worker.js');
worker.addEventListener('message', function (e) {
console.log(`result is ${e.data}`);
}, false);
worker.postMessage('start');
2
3
4
5
6
7
8
// worker.js
self.addEventListener('message', function (e) {
if (e.data === 'start') {
// 一些密集的计算……
self.postMessage(result);
}
}, false);
2
3
4
5
6
7
4. 善用 Composite
Composite 这个概念和我们的渲染管线关系密切,可以看到它处于最后一步。
由于之前我们说到,元素布局可能会影响到整个页面,那么自然我们就会想,是否能尽可能减少影响的范围呢?在某些情况下是可以的。例如下面这两个元素:
.main {
height: 200px;
width: 200px;
background: black;
}
.fixed {
position: fixed;
top: 20px;
left: 20px;
transform: translateZ(0);
width: 100px;
height: 100px;
background: red;
}
2
3
4
5
6
7
8
9
10
11
12
13
14
15
<div class="main"></div>
<div class="fixed"></div>
2
浏览器会将其处理为两个渲染层,其中 .fixed
元素由于设置了 3D transform,所以会从普通的渲染层提升至合成层,拥有独立的 GraphicsLayers。当合成层更新时,浏览器会将布局调整限制在该层中,做到尽可能小的布局变动。下图展示了当前的两个合成层:
总得来说,合成层在性能优化上的优点在于:
- 合成层的位图,会交由 GPU 合成,比 CPU 处理要快;
- 当需要 repaint 时,只需要 repaint 本身,不会影响到其他的层;
- 对于 transform 和 opacity 效果,不会触发 layout 和 paint。
但同时,也要注意避免层爆炸,防止在无法进行层压缩的情况下出现过多的层,反而导致性能的下降。这篇文章介绍了 composite 的原理及其相关应用[9]。
5. 滚动事件的性能优化
前端最容易碰到的性能问题的场景之一就是监听滚动事件并进行相应的操作。由于滚动事件发生非常频繁(相较于用户点击、hover 等事件),所以频繁地执行监听回调就容易造成 JavaScript 执行与页面渲染之间互相阻塞的情况。
滚动的性能优化其实也是一种综合性的优化。它主要是会将上述的各类性能问题放大了,所以在优化措施中,你仍然需要避免出现上面提到的长时间的 JavaScript 执行、强制同步布局等问题。
此外,基于滚动这个特殊场景,这里再介绍两个处理滚动性能时非常常见的技术:防抖和节流。
当一个事件频繁触发,而你希望间隔一定的时间再触发相应的函数时就会使用节流(throttle)。例如在页面滚动时,每 200ms 进行一次页面背景颜色的修改。
当一个事件频繁触发,而你希望在事件触发结束一段时间后(此段时间内不再有触发)才实际触发响应函数时会使用防抖(debounce)。例如用户一直点击按钮,但你不希望频繁发送请求,你就可以设置当点击后 200ms 内用户不再点击时才发送请求。
这两个技术也是前端非常常用的技术,例如 lodash 中就有 throttle 和 debounce 的对应实现。如果你对它们不太了解,可以看下面这两篇文章:
- 函数节流的实现 (throttle)[10]
- 函数去抖的实现 (debounce)[11]
6. Passive event listeners
在介绍 Passive event listeners 是如何让滚动更顺畅之前,我们先来看下为什么会有 Passive event listeners。
考虑下面这段代码:
document.addEventListener('touchstart', function (e) {
// 做了一些操作……
e.preventDefault();
}, true);
2
3
4
我们知道,在 touchstart
中调用了 e.preventDefault()
会阻止页面的滚动与缩放。那么浏览器是如何知道不要让页面滚动与缩放的呢?当然是因为我们调用了 e.preventDefault()
,你可能认为这是废话,不过问题就在这。如果浏览器不执行完监听回调里的代码,就不会知道开发者有没有禁止默认事件。所以不管你是否调用了 e.preventDefault()
,当你添加触摸、滚轮的事件监听后,每次触发该事件,浏览器都会先花费事件执行完你的回调,然后根据结果来判断是否需要滚动页面。如果的操作花费了 200ms,那页面只能在 200ms 后再滚动或缩放,这就导致了性能问题。
那你肯定会想,很多时候我不会阻止默认事件呀,我有没有办法告诉浏览器,让它不用等啦(默认行为没有被禁用),直接滚动页面就行呢?Passive event listeners 就是为此而生的[12]。使用方式很简单:
document.addEventListener('touchstart', function (e) {
// 做了一些操作……
}, {passive: true});
2
3
只需要在第三个参数中传入 {passive: true}
即可。
然而和其他新特性一样,对于 Passive event listeners 我们也需要考虑兼容性。由于在低版本浏览器中,第三个参数是用来设置是否进行事件捕获的。所以使用时建议进行特性检测:
// 这段特性检测的方法很巧妙
let supportsPassive = false;
try {
const opts = Object.defineProperty({}, 'passive', {
get: function() {
supportsPassive = true;
}
});
window.addEventListener('testPassive', null, opts);
window.removeEventListener('testPassive', null, opts);
} catch (e) {}
document.addEventListener('touchstart', function (e) {
// 做了一些操作……
}, supportsPassive ? {passive: true} : false);
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
这个视频展示了 Passive event listeners 带来的性能与体验提升,视频中右侧画面是使用了 Passive event listeners 的效果。
运行时性能是前端性能优化中非常重要的一块。这篇文章里列举了常见场景下的通用优化手段。才外,目前大多数应用都是构建在 React/Vue/Angular 之上(当然也有 jQuery),针对具体框架的性能优化又会是好几个新的话题,后续如果有机会也希望能将它们补充进来。
不过,不管什么框架在前端最终都会运行在浏览器上、使用 JavaScript 引擎(至少目前是),所以这些针对以这些通用性的性能优化思路作为基础,可以帮你更好理解与处理遇到的性能问题。
好了,我们的「前端性能优化之旅」也要接近尾声了,下面会渠道本次旅途的最后一站:
参考资料
- What forces layout / reflow
- CSS Triggers
- What I learned from building my own virtualized list library for React
- virtual-scroller: Let there be less (DOM) (Chrome Dev Summit 2018)
- WICG/virtual-scroller
- Using requestIdleCallback
- Idle Until Urgent
- The Basics of Web Workers
- 无线性能优化:Composite
- underscore 函数节流的实现
- underscore 函数去抖的实现
- Passive Event Listeners (explainer)
- reflow和repaint引发的性能问题
- How virtual / infinite scrolling works
- Are long JavaScript tasks delaying your Time to Interactive?
- 淘宝新势力周H5性能优化实战
- 如何不择手段提升scroll事件的性能
- Analyze Runtime Performance
- Web长列表的救星?谷歌推出Virtual Scroller