一顿操作,我把 Table 组件性能提升了十倍

Table 表格组件在 Web 开发中的应用随处可见,不过当表格数据量大后,伴随而来的是性能问题:渲染的 DOM 太多,渲染和交互都会有一定程度的卡顿。

[[423502]]

Table 表格组件在 Web 开发中的应用随处可见,不过当表格数据量大后,伴随而来的是性能问题:渲染的 DOM 太多,渲染和交互都会有一定程度的卡顿。

通常,我们有两种优化表格的方式:一种是分页,另一种是虚拟滚动。这两种方式的优化思路都是减少 DOM 渲染的数量。在我们公司的项目中,会选择分页的方式,因为虚拟滚动不能正确的读出行的数量,会有 Accessibility 的问题。

记得 19 年的时候,我在 Zoom 已经推行了基于 Vue.js 的前后端分离的优化方案,并且基于 ElementUI 组件库开发了 ZoomUI。其中我们在重构用户管理页面的时候使用了 ZoomUI 的 Table 组件替换了之前老的用 jQuery 开发的 Table 组件。

因为绝大部分场景 Table 组件都是分页的,所以并不会有性能问题。但是在某个特殊场景下:基于关键词的搜索,可能会出现 200 * 20 条结果且不分页的情况,且表格是有一列是带有 checkbox 的,也就是可以选中某些行进行操作。

当我们去点选其中一行时,发现过了好久才选中,有明显的卡顿感,而之前的 jQuery 版本却没有这类问题,这一比较令人大跌眼镜。难道好好的技术重构,却要牺牲用户体验吗?

Table 组件第一次优化尝试

既然有性能问题,那么我们的第一时间的思路应该是要找出产生性能问题的原因。

列展示优化

首先,ZoomUI 渲染的 DOM 数量是要多于 jQuery 渲染的 Table 的,因此第一个思考方向是让 Table 组件 尽可能地减少 DOM 的渲染数量

20 列数据通常在屏幕下是展示不全的,老的 jQuery Table 实现很简单,底部有滚动条,而 ZoomUI 在这种列可滚动的场景下,支持了左右列的固定,这样在左右滑动过程中,可以固定某些列一直展示,用户体验更好,但这样的实现是有一定代价的。

想要实现这种固定列的布局,ElementUI 用了 6 个 table 标签来实现,那么为什么需要 6 个 table 标签呢?

首先,为了让 Table 组件支持丰富的表头功能,表头和表体都是各自用一个 table 标签来实现。因此对于一个表格来说,就会有 2 个 table 标签,那么再加上左侧 fixed 的表格,和右侧 fixed 的表格,总共有 6 个 table 标签。

在 ElementUI 实现中,左侧 fixed 表格和右侧 fixed 表格从 DOM 上都渲染了完整的列,然后从样式上控制它们的显隐:

但这么实现是有性能浪费的,因为完全不需要渲染这么多列,实际上只需要渲染固定展示的列的 DOM,然后做好高度同步即可。 ZoomUI 就是这么实现的,效果如下:

当然,仅仅减少 fixed 表格渲染的列,性能的提升还不够明显,有没有办法在列的渲染这个维度继续优化呢?

这就是从业务层面的优化了,对于一个 20 列的表格,往往关键的列并没有多少,那么我们可不可以初次渲染仅仅渲染关键的列,其它列通过配置方式的渲染呢?

根据上述需求,我给 Table 组件添加了如下功能:

Table 组件新增一个 initDisplayedColumn 属性,通过它可以配置初次渲染的列,同时当用户修改了初次渲染的列,会在前端存储下来,便于下一次的渲染。

通过这种方式,我们就可以少渲染一些列。显然,列渲染少了,表格整体渲染的 DOM 数就会变少,对性能也会有一定的提升。

更新渲染的优化

当然,仅仅通过优化列的渲染还是不够的,我们遇到的问题是当点选某一行引起的渲染卡顿,为什么会引起卡顿呢?

为了定位该问题,我用 Table 组件创建了一个 1000 * 7 的表格,开启了 Chrome 的 Performance 面板记录 checkbox 点选前后的性能。

在经过几次 checkbox 选择框的点选后,可以看到如下火焰图:

其中黄色部分是 Scripting 脚本的执行时间,紫色部分是 Rendering 所占的时间。我们再截取一次更新的过程:

然后观察 JS 脚本执行的 Call Tree,发现时间主要花在了 Table 组件的更新渲染上

我们发现组件的 render to vnode 花费的时间约 600ms; vnode patch to DOM 花费的时间约 160ms。

为什么会需要这么长时间呢,因为点选了 checkbox ,在组件内部修改了其维护的选中状态数据,而整个组件的 render 过程中又访问了这个状态数据,因此当这个数据修改后,会引发整个组件的重新渲染。

而又由于有 1000 * 7 条数据,因此整个表格需要循环 1000 * 7 次去创建最内部的 td ,整个过程就会耗时较长。

那么循环的内部是不是有优化的空间呢?对于 ElementUI 的 Table 组件,这里有非常大的优化空间。

其实优化思路主要参考我之前写的 《揭秘 Vue.js 九个性能优化技巧》 其中的 Local variables 技巧。举个例子,在 ElementUI 的 Table 组件中,在渲染每个 td 的时候,有这么一段代码:

  1. const data = { 
  2.   store: this.store, 
  3.   _self: this.context || this.table.$vnode.context, 
  4.   column: columnData, 
  5.   row, 
  6.   $index 

这样的代码相信很多小伙伴随手就写了,但却忽视了其内部潜在的性能问题。

由于 Vue.js 响应式系统的设计,在每次访问 this.store 的时候,都会触发 响应式数据内部的 getter 函数,进而执行 它的依赖收集,当这段代码被循环了 1000 * 7 次,就会执行 this.store 7000 次的依赖收集,这就造成了性能的浪费,而真正的依赖收集只需要执行一次就足够了。

解决这个问题其实也并不难,由于 Table 组件中的 TableBody 组件是用 render 函数写的,我们可以在组件 render 函数的入口处定义一些局部变量:

  1. render(h) { 
  2.   const { store /*...*/} = this 
  3.   const context = this.context ||  this.table.$vnode.context 

然后在渲染整个 render 的过程中,把局部变量当作内部函数的参数传入,这样在内部渲染 td 的渲染中再次访问这些变量就不会触发依赖收集了:

  1. rowRender({store, context, /* ...其它变量 */}) { 
  2.   const data = { 
  3.     store: store, 
  4.     _self: context, 
  5.     column: columnData, 
  6.     row, 
  7.     $index, 
  8.     disableTransition, 
  9.     isSelectedRow 
  10.   } 

通过这种方式,我们把类似的代码都做了修改,就实现了 TableBody 组件渲染函数内部访问这些响应式变量,只触发一次依赖收集的效果,从而优化了 render 的性能。

来看一下优化后的火焰图:

从面积上看似乎 Scripting 的执行时间变少了,我们再来看它一次更新所需要的 JS 执行时间:

我们发现组件的 render to vnode 花费的时间约 240ms; vnode patch to DOM 花费的时间约 127ms。

可以看到,ZoomUI Table 组件的 render 的时间和 update 的时间都要明显少于 ElementUI 的 Table 组件。 render 时间减少是由于响应式变量依赖收集的时间大大减少, update 的时间的减少是因为 fixed 表格渲染的 DOM 数量减少。

从用户的角度来看,DOM 的更新除了 Scripting 的时间,还有 Rendering 的时间,它们是共享一个线程的,当然由于 ZoomUI Table 组件渲染的 DOM 数量更少,执行 Rendering 的时间也更短。

手写 benchmark

仅仅从 Performance 面板的测试并不是一个特别精确的 benchmark,我们可以针对 Table 组件手写一个 benchmark。

我们可以先创建一个按钮,去模拟 Table 组件的选中操作:

  1. <div> 
  2.   <zm-button @click="toggleSelection(computedData[1]) 
  3. ">切换第二行选中状态 
  4.   </zm-button> 
  5. </div> 
  6. <div> 
  7.   更新所需时间: {{ renderTime }} 
  8. </div> 

然后实现这个 toggleSelection 函数:

  1. methods: { 
  2.  toggleSelection(row) { 
  3.    const s = window.performance.now() 
  4.    if (row) { 
  5.      this.$refs.table.toggleRowSelection(row) 
  6.    } 
  7.    setTimeout(() => { 
  8.      this.renderTime = (window.performance.now() - s).toFixed(2) + 'ms' 
  9.    }) 
  10.  } 

我们在点击事件的回调函数中,通过 window.performance.now() 记录起始时间,然后在 setTimeout 的回调函数中,再去通过时间差去计算整个更新渲染需要的时间。

由于 JS 的执行和 UI 渲染占用同一线程,因此在一个宏任务执行过程中,会执行这俩任务,而 setTimeout 0 会把对应的回调函数添加到下一个宏任务中,当该回调函数执行,说明上一个宏任务执行完毕,此时做时间差去计算性能是相对精确的。

基于手写的 benchmark 得到如下测试结果:

ElementUI Table 组件一次更新的时间约为 900ms 。

ZoomUI Table 组件一次更新的时间约为 280ms,相比于 ElementUI 的 Table 组件, 性能提升了约三倍

v-memo 的启发

经过这一番优化,基本解决了文章开头提到的问题,在 200 * 20 的表格中去选中一列,已经并无明显的卡顿感了,但相比于 jQuery 实现的 Table,效果还是要差了一点。

虽然性能优化了三倍,但我还是有个心结:明明只更新了一行数据的选中状态,却还是重新渲染了整个表格,仍然需要在组件 render 的过程中执行多次的循环,在 patch 的过程中通过 diff 算法来对比更新。

最近我研究了 Vue.js 3.2 v-memo 的实现,看完源码后,我非常激动,因为发现这个优化技巧似乎可以应用到 ZoomUI 的 Table 组件中,尽管我们的组件库是基于 Vue 2 版本开发的。

我花了一个下午的时间,经过一番尝试,果然成功了,那么具体是怎么做的呢?先不着急,我们从 v-memo 的实现原理说起。

v-memo 的实现原理

v-memo 是 Vue.js 3.2 版本新增的指令,它可以用于普通标签,也可以用于列表,结合 v-for 使用,在官网文档中,有这么一段介绍:

v-memo 仅供性能敏感场景的针对性优化,会用到的场景应该很少。渲染 v-for 长列表 (长度大于 1000) 可能是它最有用的场景:

  1. <div v-for="item in list" :key="item.id" v-memo="[item.id === selected]"
  2.   <p>ID: {{ item.id }} - selected: {{ item.id === selected }}</p> 
  3.   <p>...more child nodes</p> 
  4. </div> 

当组件的 selected 状态发生变化时,即使绝大多数 item 都没有发生任何变化,大量的 VNode 仍将被创建。此处使用的 v-memo 本质上代表着“仅在 item 从未选中变为选中时更新它,反之亦然”。这允许每个未受影响的 item 重用之前的 VNode,并完全跳过差异比较。注意,我们不需要把 item.id 包含在记忆依赖数组里面,因为 Vue 可以自动从 item :key 中把它推断出来。

其实说白了 v-memo 的核心就是复用 vnode ,上述模板借助于在线模板编译工具,可以看到其对应的 render 函数:

  1. import { renderList as _renderList, Fragment as _Fragment, openBlock as _openBlock, createElementBlock as _createElementBlock, toDisplayString as _toDisplayString, createElementVNode as _createElementVNode, isMemoSame as _isMemoSame, withMemo as _withMemo } from "vue" 
  2.  
  3. const _hoisted_1 = /*#__PURE__*/_createElementVNode("p"null"...more child nodes", -1 /* HOISTED */
  4.  
  5. export function render(_ctx, _cache, $props, $setup, $data, $options) { 
  6.   return (_openBlock(true), _createElementBlock(_Fragment, null, _renderList(_ctx.list, (item, __, ___, _cached) => { 
  7.     const _memo = ([item.id === _ctx.selected]) 
  8.     if (_cached && _cached.key === item.id && _isMemoSame(_cached, _memo)) return _cached 
  9.     const _item = (_openBlock(), _createElementBlock("div", { 
  10.       key: item.id 
  11.     }, [ 
  12.       _createElementVNode("p"null"ID: " + _toDisplayString(item.id) + " - selected: " + _toDisplayString(item.id === _ctx.selected), 1 /* TEXT */), 
  13.       _hoisted_1 
  14.     ])) 
  15.     _item.memo = _memo 
  16.     return _item 
  17.   }, _cache, 0), 128 /* KEYED_FRAGMENT */)) 

基于 v-for 的列表内部是通过 renderList 函数来渲染的,来看它的实现:

  1. function renderList(source, renderItem, cache, index) { 
  2.   let ret 
  3.   const cached = (cache && cache[index]) 
  4.   if (isArray(source) || isString(source)) { 
  5.     ret = new Array(source.length) 
  6.     for (let i = 0, l = source.length; i < l; i++) { 
  7.       ret[i] = renderItem(source[i], i, undefined, cached && cached[i]) 
  8.     } 
  9.   } 
  10.   else if (typeof source === 'number') { 
  11.     // source 是数字 
  12.   } 
  13.   else if (isObject(source)) { 
  14.     // source 是对象 
  15.   } 
  16.   else { 
  17.     ret = [] 
  18.   } 
  19.   if (cache) { 
  20.     cache[index] = ret 
  21.   } 
  22.   return ret 

我们只分析 source ,也就是列表 list 是数组的情况,对于每一个 item ,会执行 renderItem 函数来渲染。

从生成的 render 函数中,可以看到 renderItem 的实现如下:

  1. (item, __, ___, _cached) => { 
  2.     const _memo = ([item.id === _ctx.selected]) 
  3.     if (_cached && _cached.key === item.id && _isMemoSame(_cached, _memo)) return _cached 
  4.     const _item = (_openBlock(), _createElementBlock("div", { 
  5.       key: item.id 
  6.     }, [ 
  7.       _createElementVNode("p"null"ID: " + _toDisplayString(item.id) + " - selected: " + _toDisplayString(item.id === _ctx.selected), 1 /* TEXT */), 
  8.       _hoisted_1 
  9.     ])) 
  10.     _item.memo = _memo 
  11.     return _item 
  12.   } 

renderItem 函数内部,维护了一个 _memo 变量,它就是用来判断是否从缓存里获取 vnode 的条件数组;而第四个参数 _cached 对应的就是 item 对应缓存的 vnode 。接下来通过 isMemoSame 函数来判断 memo 是否相同,来看它的实现:

  1. function isMemoSame(cached, memo) { 
  2.   const prev = cached.memo 
  3.   if (prev.length != memo.length) { 
  4.     return false 
  5.   } 
  6.   for (let i = 0; i < prev.length; i++) { 
  7.     if (prev[i] !== memo[i]) { 
  8.       return false 
  9.     } 
  10.   } 
  11.   // ... 
  12.   return true 

isMemoSame 函数内部会通过 cached.memo 拿到缓存的 memo ,然后通过遍历对比每一个条件来判断和当前的 memo 是否相同。

而在 renderItem 函数的结尾,就会把 _memo 缓存到当前 item vnode 中,便于下一次通过 isMemoSame 来判断这个 memo 是否相同,如果相同,说明该项没有变化,直接返回上一次缓存的 vnode

那么这个缓存的 vnode 具体存储到哪里呢,原来在初始化组件实例的时候,就设计了渲染缓存:

  1. const instance = { 
  2.   // ... 
  3.   renderCache: [] 

然后在执行 render 函数的时候,把这个缓存当做第二个参数传入:

  1. const { renderCache } = instance 
  2. result = normalizeVNode( 
  3.   render.call( 
  4.     proxyToUse, 
  5.     proxyToUse, 
  6.     renderCache, 
  7.     props, 
  8.     setupState, 
  9.     data, 
  10.     ctx 
  11.   ) 

然后在执行 renderList 函数的时候,把 _cahce 作为第三个参数传入:

  1. export function render(_ctx, _cache, $props, $setup, $data, $options) { 
  2.   return (_openBlock(true), _createElementBlock(_Fragment, null, _renderList(_ctx.list, (item, __, ___, _cached) => { 
  3.     // renderItem 实现 
  4.   }, _cache, 0), 128 /* KEYED_FRAGMENT */)) 

所以实际上列表缓存的 vnode 都保留在 _cache 中,也就是 instance.renderCache 中。

那么为啥使用缓存的 vnode 就能优化 patch 过程呢,因为在 patch 函数执行的时候,如果遇到新旧 vnode 相同,就直接返回,什么也不用做了。

  1. const patch = (n1, n2, container, anchor = null, parentComponent = null, parentSuspense = null, isSVG = false, slotScopeIds = null, optimized = false) => { 
  2.   if(n1 === n2) { 
  3.     return 
  4.   } 
  5.   // ... 

显然,由于使用缓存的 vnode ,它们 指向同一个对象引用 ,直接返回,节约了后续执行 patch 过程的时间。

在 Table 组件的应用

v-memo 的优化思路很简单,就是复用缓存的 vnode ,这是一种空间换时间的优化思路。

那么,前面我们提到在表格组件中选择状态没有变化的行,是不是也可以从缓存中获取呢?

顺着这思路,我给 Table 组件设计了 useMemo 这个 prop ,它其实是专门用于有选择列的场景。

然后在 TableBody 组件的 created 钩子函数中,创建了用于缓存的对象:

  1. created() { 
  2.   if (this.table.useMemo) { 
  3.     if (!this.table.rowKey) { 
  4.       throw new Error('for useMemo, row-key is required.'
  5.     } 
  6.     this.vnodeCache = [] 
  7.   } 

这里之所以把 vnodeCache 定义到 created 钩子函数中,是因为它并不需要变成响应式对象。

另外注意,我们会根据每一行的 key 作为缓存的 key ,因此 Table 组件的 rowKey 属性是必须的。

然后在渲染每一行的过程中,添加了 useMemo 相关的逻辑:

  1. function rowRender({ /* 各种变量参数 */}) { 
  2.   let memo 
  3.   const key = this.getKeyOfRow({ row, rowIndex: $index, rowKey }) 
  4.   let cached 
  5.   if (useMemo) { 
  6.     cached = this.vnodeCache[key] 
  7.     const currentSelection = store.states.selection 
  8.     if (cached && !this.isRowSelectionChanged(row, cached.memo, currentSelection)) { 
  9.       return cached 
  10.     } 
  11.     memo = currentSelection.slice() 
  12.   } 
  13.   // 渲染 row,返回对应的 vnode 
  14.   const ret = rowVnode 
  15.   if (useMemo && columns.length) { 
  16.     ret.memo = memo 
  17.     this.vnodeCache[key] = ret 
  18.    } 
  19.    return ret 

这里的 memo 变量用于记录已选中的行数据,并且它也会在函数最后存储到 vnode memo ,便于下一次的比对。

在每次渲染 row vnode 前,会根据 row 对应的 key 尝试从缓存中取;如果缓存中存在,再通过 isRowSelectionChanged 来判断行的选中状态是否改变;如果没有改变,则直接返回缓存的 vnode

如果没有命中缓存或者是行选择状态改变,则会去重新渲染拿到新的 rowVnode ,然后更新到 vnodeCache 中。

当然,这种实现相比于 v-memo 没有那么通用,只去对比行选中的状态而不去对比其它数据的变化。你可能会问,如果这一行某列的数据修改了,但选中状态没变,再走缓存不就不对了吗?

确实存在这个问题,但是在我们的使用场景中,遇到数据修改,是会发送一个异步请求到后端,然获取新的数据再来更新表格数据。因此我只需要观测表格数据的变化清空 vnodeCache 即可:

  1. watch: { 
  2.   'store.states.data'() { 
  3.     if (this.table.useMemo) { 
  4.       this.vnodeCache = [] 
  5.     } 
  6.   } 

此外,我们支持列的可选则渲染功能,以及在窗口发生变化时,隐藏列也可能发生变化,于是在这两种场景下,也需要清空 vnodeCache

  1. watch:{ 
  2.   'store.states.columns'() { 
  3.     if (this.table.useMemo) { 
  4.       this.vnodeCache = [] 
  5.     } 
  6.   }, 
  7.   columnsHidden(newVal, oldVal) { 
  8.     if (this.table.useMemo && !valueEquals(newVal, oldVal)) { 
  9.       this.vnodeCache = [] 
  10.     } 
  11.   } 

以上实现就是基于 v-memo 的思路实现表格组件的性能优化。我们从火焰图上看一下它的效果:

我们发现黄色的 Scripting 时间几乎没有了,再来看它一次更新所需要的 JS 执行时间:

我们发现组件的 render to vnode 花费的时间约 20ms ; vnode patch to DOM 花费的时间约 1ms ,整个更新渲染过程, JS 的执行时间大幅减少。

另外,我们通过 benchmark 测试,得到如下结果:

优化后,ZoomUI Table 组件一次更新的时间约为 80ms ,相比于 ElementUI 的 Table 组件, 性能提升了约十倍

这个优化效果还是相当惊人的,并且从性能上已经不输 jQuery Table 了,我两年的心结也随之解开了。

Table 表格性能提升主要是三个方面:减少 DOM 数量、优化 render 过程以及复用 vnode 。有些时候,我们还可以从业务角度思考,去做一些优化。

虽然 useMemo 的实现还比较粗糙,但它目前已满足我们的使用场景了,并且当数据量越大,渲染的行列数越多,这种优化效果就越明显。如果未来有更多的需求,更新迭代就好。

由于一些原因,我们公司仍然在使用 Vue 2,但这并不妨碍我去学习 Vue 3,了解它一些新特性的实现原理以及设计思想,能让我开拓不少思路。

从分析定位问题到最终解决问题,希望这篇文章能给你在组件的性能优化方面提供一些思路,并应用到日常工作中。