Webpack原理—编写Loader和Plugin

编写 Loader

Loader 就像是一个翻译员,能把源文件经过转化后输出新的结果,并且一个文件还可以链式的经过多个翻译员翻译。
以处理SCSS文件为例:

  • SCSS源代码会先交给 sass-loader 把SCSS转换成CSS;
  • sass-loader 输出的CSS交给 css-loader 处理,找出CSS中依赖的资源、压缩CSS等;
  • css-loader 输出的CSS交给 style-loader 处理,转换成通过脚本加载的JavaScript代码;
  • 可以看出以上的处理过程需要有顺序的链式执行,先 sass-loader css-loader style-loader 。 以上处理的Webpack相关配置如下:

    module.exports = {
      module: {
        rules: [
            // 增加对 SCSS 文件的支持
            test: /\.scss/,
            // SCSS 文件的处理顺序为先 sass-loader 再 css-loader 再 style-loader
            use: [
              'style-loader',
                loader:'css-loader',
                // 给 css-loader 传入配置项
                options:{
                  minimize:true, 
              'sass-loader'],
    

    Loader的职责

    由上面的例子可以看出:一个Loader的职责是单一的,只需要完成一种转换。 如果一个源文件需要经历多步转换才能正常使用,就通过多个Loader去转换。 在调用多个Loader去转换一个文件时,每个Loader会链式的顺序执行, 第一个Loader将会拿到需处理的原内容,上一个Loader处理后的结果会传给下一个接着处理,最后的Loader将处理后的最终结果返回给Webpack。
    所以,在你开发一个Loader时,请保持其职责的单一性,你只需关心输入和输出。

    Loader基础

    由于Webpack是运行在Node.js之上的,一个Loader其实就是一个Node.js模块,这个模块需要导出一个函数。 这个导出的函数的工作就是获得处理前的原内容,对原内容执行处理后,返回处理后的内容。
    一个最简单的Loader的源码如下:

    module.exports = function(source) {
      // source 为 compiler 传递给 Loader 的一个文件的原内容
      // 该函数需要返回处理后的内容,这里简单起见,直接把原内容返回了,相当于该`Loader`没有做任何转换
      return source;
    

    由于Loader运行在Node.js中,你可以调用任何Node.js自带的API,或者安装第三方模块进行调用:

    const sass = require('node-sass');
    module.exports = function(source) {
      return sass(source);
    

    Loader进阶

    Webpack还提供一些API供Loader调用。

    获得Loader的options

    在最上面处理SCSS文件的Webpack配置中,给css-loader传了options参数,以控制css-loader。要在自己编写的Loader中获取到用户传入的options,需要这样做:

    const loaderUtils = require('loader-utils');
    module.exports = function(source) {
      // 获取到用户给当前 Loader 传入的 options
      const options = loaderUtils.getOptions(this);
      return source;
    
    返回其它结果

    上面的Loader都只是返回了原内容转换后的内容,但有些场景下还需要返回除了内容之外的东西。
    例如以用babel-loader转换ES6代码为例,它还需要输出转换后的ES5代码对应的Source Map,以方便调试源码。 为了把Source Map也一起随着ES5代码返回给Webpack,可以这样写:

    module.exports = function(source) {
      // 通过 this.callback 告诉 Webpack 返回的结果
      this.callback(null, source, sourceMaps);
      // 当你使用 this.callback 返回内容时,该 Loader 必须返回 undefined,
      // 以让 Webpack 知道该 Loader 返回的结果在 this.callback 中,而不是 return 中 
      return;
    

    其中的this.callback是Webpack给Loader注入的API,以方便Loader和Webpack之间通信。this.callback的详细使用方法如下:

    this.callback(
        // 当无法转换原内容时,给 Webpack 返回一个 Error
        err: Error | null,
        // 原内容转换后的内容
        content: string | Buffer,
        // 用于把转换后的内容得出原内容的 Source Map,方便调试
        sourceMap?: SourceMap,
        // 如果本次转换为原内容生成了 AST 语法树,可以把这个 AST 返回,
        // 以方便之后需要 AST 的 Loader 复用该 AST,以避免重复生成 AST,提升性能
        abstractSyntaxTree?: AST
    

    Source Map的生成很耗时,通常在开发环境下才会生成Source Map,其它环境下不用生成,以加速构建。 为此Webpack为Loader提供了this.sourceMap API去告诉Loader当前构建环境下用户是否需要Source Map。

    同步与异步

    Loader有同步和异步之分,上面介绍的Loader都是同步的Loader,因为它们的转换流程都是同步的,转换完成后再返回结果。 但在有些场景下转换的步骤只能是异步完成的,例如你需要通过网络请求才能得出结果,如果采用同步的方式网络请求就会阻塞整个构建,导致构建非常缓慢。
    在转换步骤是异步时,你可以这样:

    module.exports = function(source) {
        // 告诉 Webpack 本次转换是异步的,Loader 会在 callback 中回调结果
        var callback = this.async();
        someAsyncOperation(source, function(err, result, sourceMaps, ast) {
            // 通过 callback 返回异步执行后的结果
            callback(err, result, sourceMaps, ast);
    
    处理二进制数据

    在默认的情况下,Webpack传给Loader的原内容都是UTF-8格式编码的字符串。 但有些场景下Loader不是处理文本文件,而是处理二进制文件,例如file-loader,就需要Webpack给Loader传入二进制格式的数据。 为此,你需要这样编写Loader

    module.exports = function(source) {
        // 在 exports.raw === true 时,Webpack 传给 Loader 的 source 是 Buffer 类型的
        source instanceof Buffer === true;
        // Loader 返回的类型也可以是 Buffer 类型的
        // 在 exports.raw !== true 时,Loader 也可以返回 Buffer 类型的结果
        return source;
    // 通过 exports.raw 属性告诉 Webpack 该 Loader 是否需要二进制数据 
    module.exports.raw = true;
    

    以上代码中最关键的代码是最后一行module.exports.raw = true;,没有该行Loader只能拿到字符串。

    在有些情况下,有些转换操作需要大量计算非常耗时,如果每次构建都重新执行重复的转换操作,构建将会变得非常缓慢。为此,Webpack会默认缓存所有Loader的处理结果,也就是说在需要被处理的文件或者其依赖的文件没有发生变化时, 是不会重新调用对应的Loader去执行转换操作的。
    如果想让Webpack不缓存该Loader的处理结果,可以这样:

    module.exports = function(source) {
      // 关闭该 Loader 的缓存功能
      this.cacheable(false);
      return source;
    

    其它Loader API

    除了以上提到的在Loader中能调用的Webpack API外,还存在以下常用API:

    this.context:当前处理文件的所在目录,假如当前Loader处理的文件是/src/main.js,则this.context就等于/srcthis.resource:当前处理文件的完整请求路径,包括querystring,例如/src/main.js?name=1this.resourcePath:当前处理文件的路径,例如/src/main.jsthis.resourceQuery:当前处理文件的querystringthis.target:等于Webpack配置中的Targetthis.loadModule:当Loader在处理一个文件时,如果依赖其它文件的处理结果才能得出当前文件的结果时, 就可以通过this.loadModule(request: string, callback: function(err, source, sourceMap, module))去获得request对应文件的处理结果。 this.resolve:像require语句一样获得指定文件的完整路径,使用方法为resolve(context: string, request: string, callback: function(err, result: string))this.addDependency:给当前处理文件添加其依赖的文件,以便再其依赖的文件发生变化时,会重新调用Loader处理该文件。使用方法为addDependency(file: string)this.addContextDependency:和addDependency类似,但addContextDependency是把整个目录加入到当前正在处理文件的依赖中。使用方法为addContextDependency(directory: string)this.clearDependencies:清除当前正在处理文件的所有依赖,使用方法为clearDependencies()this.emitFile:输出一个文件,使用方法为emitFile(name: string, content: Buffer|string, sourceMap: {...})

    加载本地Loader

    在开发Loader的过程中,为了测试编写的Loader是否能正常工作,需要把它配置到Webpack中后,才可能会调用该Loader。使用的Loader都是通过Npm安装的,要使用Loader时会直接使用Loader的名称,代码如下:

    module.exports = {
      module: {
        rules: [
            test: /\.css/,
            use: ['style-loader'],
    

    如果还采取以上的方法去使用本地开发的Loader将会很麻烦,因为你需要确保编写的Loader的源码是在node_modules目录下。 为此你需要先把编写的Loader发布到Npm仓库后再安装到本地项目使用。
    解决以上问题的便捷方法有两种,分别如下:

    Npm link

    Npm link专门用于开发和调试本地Npm模块,能做到在不发布模块的情况下,把本地的一个正在开发的模块的源码链接到项目的node_modules目录下,让项目可以直接使用本地的Npm模块。 由于是通过软链接的方式实现的,编辑了本地的Npm模块代码,在项目中也能使用到编辑后的代码。
    完成Npm link的步骤如下:

  • 确保正在开发的本地Npm模块(也就是正在开发的Loader)的package.json已经正确配置好;
  • 在本地Npm模块根目录下执行npm link,把本地模块注册到全局;
  • 在项目根目录下执行npm link loader-name,把第2步注册到全局的本地Npm模块链接到项目的node_moduels下,其中的loader-name是指在第1步中的package.json文件中配置的模块名称。
  • 链接好Loader到项目后你就可以像使用一个真正的 Npm 模块一样使用本地的Loader了。

    ResolveLoader

    ResolveLoader用于配置Webpack如何寻找Loader。 默认情况下只会去node_modules目录下寻找,为了让Webpack加载放在本地项目中的Loader需要修改resolveLoader.modules
    假如本地的Loader在项目目录中的./loaders/loader-name中,则需要如下配置:

    module.exports = {
      resolveLoader:{
        // 去哪些目录下寻找 Loader,有先后顺序之分
        modules: ['node_modules','./loaders/'],
    

    加上以上配置后,Webpack会先去node_modules项目下寻找Loader,如果找不到,会再去./loaders/目录下寻找。

    接下来从实际出发,来编写一个解决实际问题的Loader
    Loader名叫comment-require-loader,作用是把JavaScript代码中的注释语法

    // @require '../style/index.css'
    
    require('../style/index.css');
    

    Loader的使用方法如下:

    module.exports = {
      module: {
        rules: [
            test: /\.js$/,
            use: ['comment-require-loader'],
            // 针对采用了 fis3 CSS 导入语法的 JavaScript 文件通过 comment-require-loader 去转换 
            include: [path.resolve(__dirname, 'node_modules/imui')]
    

    Loader的实现非常简单,完整代码如下:

    function replace(source) {
        // 使用正则把 // @require '../style/index.css' 转换成 require('../style/index.css');  
        return source.replace(/(\/\/ *@require) +(('|").+('|")).*/, 'require($2);');
    module.exports = function (content) {
        return replace(content);
    

    编写Plugin

    Webpack通过Plugin机制让其更加灵活,以适应各种应用场景。 在Webpack运行的生命周期中会广播出许多事件,Plugin可以监听这些事件,在合适的时机通过Webpack提供的API改变输出结果。
    一个最基础的Plugin的代码是这样的:

    class BasicPlugin{
      // 在构造函数中获取用户给该插件传入的配置
      constructor(options){
      // Webpack 会调用 BasicPlugin 实例的 apply 方法给插件实例传入 compiler 对象
      apply(compiler){
        compiler.plugin('compilation',function(compilation) {
    // 导出 Plugin
    module.exports = BasicPlugin;
    

    在使用这个Plugin时,相关配置代码如下:

    const BasicPlugin = require('./BasicPlugin.js');
    module.export = {
      plugins:[
        new BasicPlugin(options),
    

    Webpack启动后,在读取配置的过程中会先执行new BasicPlugin(options)初始化一个BasicPlugin获得其实例。 在初始化compiler对象后,再调用basicPlugin.apply(compiler)给插件实例传入compiler对象。 插件实例在获取到compiler对象后,就可以通过compiler.plugin(事件名称, 回调函数)监听到Webpack广播出来的事件。 并且可以通过compiler对象去操作Webpack。

    Compiler和Compilation

    在开发Plugin时最常用的两个对象就是CompilerCompilation,它们是Plugin和Webpack之间的桥梁。CompilerCompilation的含义如下:

    Compiler对象包含了Webpack环境所有的的配置信息,包含optionsloadersplugins这些信息,这个对象在Webpack启动时候被实例化,它是全局唯一的,可以简单地把它理解为Webpack实例; Compilation对象包含了当前的模块资源、编译生成资源、变化的文件等。当Webpack以开发模式运行时,每当检测到一个文件变化,一次新的Compilation将被创建。Compilation对象也提供了很多事件回调供插件做扩展。通过Compilation也能读取到Compiler对象。

    CompilerCompilation的区别在于:Compiler代表了整个Webpack从启动到关闭的生命周期,而Compilation只是代表了一次新的编译。

    Webpack就像一条生产线,要经过一系列处理流程后才能将源文件转换成输出结果。 这条生产线上的每个处理流程的职责都是单一的,多个流程之间有存在依赖关系,只有完成当前处理后才能交给下一个流程去处理。 插件就像是一个插入到生产线中的一个功能,在特定的时机对生产线上的资源做处理。
    Webpack通过Tapable来组织这条复杂的生产线。 Webpack在运行过程中会广播事件,插件只需要监听它所关心的事件,就能加入到这条生产线中,去改变生产线的运作。 Webpack的事件流机制保证了插件的有序性,使得整个系统扩展性很好。
    Webpack的事件流机制应用了观察者模式,和Node.js中的EventEmitter非常相似。CompilerCompilation都继承自Tapable,可以直接在CompilerCompilation对象上广播和监听事件,方法如下:

    * 广播出事件 * event-name 为事件名称,注意不要和现有的事件重名 * params 为附带的参数 compiler.apply('event-name',params); * 监听名称为 event-name 的事件,当 event-name 事件发生时,函数就会被执行。 * 同时函数中的 params 参数为广播事件时附带的参数。 compiler.plugin('event-name',function(params) {

    同理,compilation.applycompilation.plugin使用方法和上面一致。
    在开发插件时,你可能会不知道该如何下手,因为你不知道该监听哪个事件才能完成任务。
    在开发插件时,还需要注意以下两点:

  • 只要能拿到CompilerCompilation对象,就能广播出新的事件,所以在新开发的插件中也能广播出事件,给其它插件监听使用。
  • 传给每个插件的CompilerCompilation对象都是同一个引用。也就是说在一个插件中修改了CompilerCompilation对象上的属性,会影响到后面的插件。
  • 有些事件是异步的,这些异步的事件会附带两个参数,第二个参数为回调函数,在插件处理完任务时需要调用回调函数通知Webpack,才会进入下一处理流程。例如:
  • compiler.plugin('emit',function(compilation, callback) {
      // 支持处理逻辑
      // 处理完毕后执行 callback 以通知 Webpack 
      // 如果不执行 callback,运行流程将会一直卡在这不往下执行 
      callback();
    

    常用API

    插件可以用来修改输出文件、增加输出文件、甚至可以提升Webpack性能、等等,总之插件通过调用 Webpack提供的API能完成很多事情。 由于Webpack提供的API非常多,有很多API很少用的上,又加上篇幅有限,下面来介绍一些常用的API。

    读取输出资源、代码块、模块及其依赖

    有些插件可能需要读取Webpack的处理结果,例如输出资源、代码块、模块及其依赖,以便做下一步处理。
    emit事件发生时,代表源文件的转换和组装已经完成,在这里可以读取到最终将输出的资源、代码块、模块及其依赖,并且可以修改输出资源的内容。 插件代码如下:

    class Plugin {
      apply(compiler) {
        compiler.plugin('emit', function (compilation, callback) {
          // compilation.chunks 存放所有代码块,是一个数组
          compilation.chunks.forEach(function (chunk) {
            // chunk 代表一个代码块
            // 代码块由多个模块组成,通过 chunk.forEachModule 能读取组成代码块的每个模块
            chunk.forEachModule(function (module) {
              // module 代表一个模块
              // module.fileDependencies 存放当前模块的所有依赖的文件路径,是一个数组
              module.fileDependencies.forEach(function (filepath) {
            // Webpack 会根据 Chunk 去生成输出的文件资源,每个 Chunk 都对应一个及其以上的输出文件
            // 例如在 Chunk 中包含了 CSS 模块并且使用了 ExtractTextPlugin 时,
            // 该 Chunk 就会生成 .js 和 .css 两个文件
            chunk.files.forEach(function (filename) {
              // compilation.assets 存放当前所有即将输出的资源
              // 调用一个输出资源的 source() 方法能获取到输出资源的内容
              let source = compilation.assets[filename].source();
          // 这是一个异步事件,要记得调用 callback 通知 Webpack 本次事件监听处理结束。
          // 如果忘记了调用 callback,Webpack 将一直卡在这里而不会往后执行。
          callback();
    

    监听文件变化

    Webpack会从配置的入口模块出发,依次找出所有的依赖模块,当入口模块或者其依赖的模块发生变化时, 就会触发一次新的Compilation
    在开发插件时经常需要知道是哪个文件发生变化导致了新的Compilation,为此可以使用如下代码:

    // 当依赖的文件发生变化时会触发 watch-run 事件
    compiler.plugin('watch-run', (watching, callback) => {
        // 获取发生变化的文件列表
        const changedFiles = watching.compiler.watchFileSystem.watcher.mtimes;
        // changedFiles 格式为键值对,键为发生变化的文件路径。
        if (changedFiles[filePath] !== undefined) {
          // filePath 对应的文件发生了变化
        callback();
    

    默认情况下Webpack只会监视入口和其依赖的模块是否发生变化,在有些情况下项目可能需要引入新的文件,例如引入一个HTML文件。 由于 JavaScript 文件不会去导入HTML文件,Webpack就不会监听HTML文件的变化,编辑HTML文件时就不会重新触发新的Compilation。 为了监听HTML文件的变化,我们需要把HTML文件加入到依赖列表中,为此可以使用如下代码:

    compiler.plugin('after-compile', (compilation, callback) => {
      // 把 HTML 文件添加到文件依赖列表,好让 Webpack 去监听 HTML 模块文件,在 HTML 模版文件发生变化时重新启动一次编译
        compilation.fileDependencies.push(filePath);
        callback();
    

    修改输出资源

    有些场景下插件需要修改、增加、删除输出的资源,要做到这点需要监听emit事件,因为发生emit事件时所有模块的转换和代码块对应的文件已经生成好, 需要输出的资源即将输出,因此emit事件是修改Webpack输出资源的最后时机。
    所有需要输出的资源会存放在compilation.assets中,compilation.assets是一个键值对,键为需要输出的文件名称,值为文件对应的内容。
    设置compilation.assets的代码如下:

    compiler.plugin('emit', (compilation, callback) => {
      // 设置名称为 fileName 的输出资源
      compilation.assets[fileName] = {
        // 返回文件内容
        source: () => {
          // fileContent 既可以是代表文本文件的字符串,也可以是代表二进制文件的 Buffer
          return fileContent;
        // 返回文件大小
          size: () => {
          return Buffer.byteLength(fileContent, 'utf8');
      callback();
    

    读取compilation.assets的代码如下:

    compiler.plugin('emit', (compilation, callback) => {
      // 读取名称为 fileName 的输出资源
      const asset = compilation.assets[fileName];
      // 获取输出资源的内容
      asset.source();
      // 获取输出资源的文件大小
      asset.size();
      callback();
    

    判断Webpack使用了哪些插件

    在开发一个插件时可能需要根据当前配置是否使用了其它某个插件而做下一步决定,因此需要读取Webpack当前的插件配置情况。 以判断当前是否使用了ExtractTextPlugin为例,可以使用如下代码:

    // 判断当前配置使用使用了 ExtractTextPlugin,
    // compiler 参数即为 Webpack 在 apply(compiler) 中传入的参数
    function hasExtractTextPlugin(compiler) {
      // 当前配置所有使用的插件列表
      const plugins = compiler.options.plugins;
      // 去 plugins 中寻找有没有 ExtractTextPlugin 的实例
      return plugins.find(plugin=>plugin.__proto__.constructor === ExtractTextPlugin) != null;
    

    下面我们去实现一个插件。
    该插件的名称取名叫EndWebpackPlugin,作用是在Webpack即将退出时再附加一些额外的操作,例如在Webpack成功编译和输出了文件后执行发布操作把输出的文件上传到服务器。 同时该插件还能区分Webpack构建是否执行成功。使用该插件时方法如下:

    module.exports = {
      plugins:[
        // 在初始化 EndWebpackPlugin 时传入了两个参数,分别是在成功时的回调函数和失败时的回调函数;
        new EndWebpackPlugin(() => {
          // Webpack 构建成功,并且文件输出了后会执行到这里,在这里可以做发布文件操作
        }, (err) => {
          // Webpack 构建失败,err 是导致错误的原因
          console.error(err);        
    

    要实现该插件,需要借助两个事件:

    done:在成功构建并且输出了文件后,Webpack即将退出时发生; failed:在构建出现异常导致构建失败,Webpack即将退出时发生;

    实现该插件非常简单,完整代码如下:

    class EndWebpackPlugin {
      constructor(doneCallback, failCallback) {
        // 存下在构造函数中传入的回调函数
        this.doneCallback = doneCallback;
        this.failCallback = failCallback;
      apply(compiler) {
        compiler.plugin('done', (stats) => {
            // 在 done 事件中回调 doneCallback
            this.doneCallback(stats);
        compiler.plugin('failed', (err) => {
            // 在 failed 事件中回调 failCallback
            this.failCallback(err);