如何使node也支持从url加载一个module详解

日期：2021-03-31 栏目：程序人生浏览：次

最近两天 ry 大神的 deno 火了一把。作为 node 项目的发起人，现在又基于 go 重新写了一个类似 node 的项目命名为 deno，引发了大家的强烈关注。

在 deno 项目 readme 的开始就列举出了这个项目的优势和需要解决的问题，里面最让我瞩目的就是模块原生支持 ts ，同时也能也必须从 url 加载模块，这也是与现有的 CommonJS 最大的不同。

仔细思考一下，deno 的模块化与 CommonJS 相比，更多的是一些 runtime 的能力。现有的 CommonJS 底层实现过程并不是静态化，考虑了很多的动态配置，所以基于现有到 CommonJS 改造起来还是比较容易的，支持 url 加载或者 ts 模块也并不复杂，主要难点在于与系统调用的耦合度上。所以周六在家准备撸个小项目，从上层入手，算是仿照 deno 的这几个特性使得一个仿原生 node 的 CommonJS 模块语法也能支持这些特性。

CommonJS 的执行过程

想要让 CommonJS 支持 url 访问或者原生加载 ts 模块，必须从 CommonJS 的执行过程中入手，在中间阶段将模块注入进去。而 CommonJS 的执行过程其实总结起来很简单，大概分为以下几点：

处理路径依赖

处理路径依赖应该也是所有模块化加载规范的第一步，换言之就是根据路径找到文件的位置。无论是 CommonJS 的 require 还是 ESModule 的 import，无论是相对路径还是绝对路径，都必须首先在内部对这个路径进行处理，找到合适的文件地址。

模块路径有可能是绝对路径，有可能是相对路径，有可能省略了后缀(js、node、json)，有可能省略了文件名(index)，甚至是动态路径(运行时基于变量的动态拼接)等等。

首先就是遵守约定，同时按照一定的策略找到这个文件的真实位置，中间的过程就是补齐上面模块化省略的东西。一般都是根据 CommonJS 的这张流程图

如何使node也支持从url加载一个module详解

加载文件

确认了路径并且确保了文件存在之后，加载文件这一步就简单粗暴的多。最简单的方式就是直接读取硬盘上的文件，将纯文本的模块源代码读取至内存。

拼接函数

在上一步中获取到的只是代码的文本形式源文件，并不具有执行能力。在接下来的步骤中需要将它变为一个可执行的代码段。

如果有同学看过 webpack 打包出来的结果，可以发现有这么一个现象，所有模块化的内容都处在一个函数的闭包中，内部所有的模块加载函数都替换成了 __webpack_require__ 这类的 webpack 内部变量。

还有一个问题，在 CommonJS 模块化规范中我们或多或少在每个文件中会写 module, module.exports require 等等这样的「字眼」，因为这里的 module 和 require 讲道理并不能称为关键字，JS 中关于模块加载方面的关键字只有 ESModule 中 import 和 export 等等相关的内容，他们是真真正正的关键字。而这里 CommonJS 里面带来的 module 和 require 则完全算是自己实现的一种 hack，在日常的 CommonJS 模块书写过程中，module 对象和 require 函数完全是 node 在包解析时注入进去的（类似上面的 __webpack_require__）

这也就给了我们极大的想象空间，我们也完全可以将上面拿到的 module 进行包裹然后注入我们传递的每一个变量。简单的例子：

// 纯文本代码无法执行 var str = 1; console.log(str);

将函数进行拼接，结果依旧是一个纯文本代码。但是已经可以给这个文件内部注入 require module 等变量，只需后续将它变为可执行文件并执行，就能把模块取出来。

function(require, module, exports, __dirname, __filename) { // 纯文本代码 var str = 1; console.log(str); }

转化为可执行代码

拼接完成之后我们拿到的是还是纯字符串的代码，接下来就需要将这个字符串变成真正的代码，也就是将字符串变为可执行代码片段，这种操作在 JS 的历史上一直是危险的代名词…一直以来也有多种方法可以使用，eval、new Function(str) 等等。而在 node 环境中可以直接使用原生提供的 vm 模块，内部的沙盒环境支持我们手动注入一些变量，相对来说安全性还有所保证。

var txt = "function(require, module, exports, __dirname, __filename) { module.exports = 1; }" var vm = require('vm'); var script = new vm.Script(txt); var func = script.runInThisContext();

上面这个示例中，func 就已经是经过 vm 从字符串变为可执行代码段的结果，我们的 txt 给定的是一个函数，所以此时我们需要调用这个函数来最后完成模块的导出。

var m = { exports: {} }; func(null, m, m.exports);

这样的话，内部导出的内容就会被外面全局对象 m 所截获，将每一个模块导出的结果缓存到全局的 m 对象上面来。

转载注明出处：http://www.heiqu.com/6cbec9cabe714546527365c940334317.html

如何使node也支持从url加载一个module详解

相关推荐