>  기사  >  웹 프론트엔드  >  Vite Learning의 심층 분석 '의존성 스캔'

Vite Learning의 심층 분석 '의존성 스캔'

青灯夜游
青灯夜游앞으로
2022-09-05 18:13:551666검색

이 글에서는 Vite의 종속성 검색 구현 세부 사항에 대해 자세히 설명합니다. 최종 검색 결과는 여러 모듈의 이름을 포함하는 개체입니다. 사전 구축 프로세스나 사전 구축 방법은 포함되지 않습니다. 제품이 사용됩니다.

Vite Learning의 심층 분석 '의존성 스캔'

Vite를 처음 실행하면 Vite는 CommonJS 및 UMD와 호환되고 성능을 향상하기 위해 종속성 사전 구축을 수행합니다. [관련 권장 사항: vuejs 비디오 튜토리얼]

종속성을 사전 빌드하려면 먼저 다음 두 가지 질문을 이해해야 합니다.

  • 사전 빌드된 콘텐츠가 무엇인가요? / 어떤 모듈을 사전 구축해야 합니까?

  • 미리 구축해야 하는 모듈을 어떻게 찾을 수 있나요?

이 두 가지 문제는 실제로 스캔 내용과 구현 방법에 따라 다릅니다.

이 문서에서는 종속성 검색의 구현 세부 사항을 자세히 설명합니다. 최종 검색 결과는 여러 모듈의 이름을 포함하는 개체이며 사전 구축 프로세스나 사전 구축된 제품의 사용 방법은 포함되지 않습니다. 이 부분의 내용에 관심이 있으시면 저를 팔로우하시고 후속 기사를 기다리시면 됩니다.

사전 구축된 콘텐츠에 따라 다름

프로젝트에는 많은 모듈이 있지만 모든 모듈이 사전 구축되지는 않습니다. 베어 가져오기(베어 종속성)만 종속성 사전 구축을 수행합니다.

베어 가져오기란 무엇인가요?

아래 예를 직접 보세요

// vue 是 bare import
import xxx from "vue"
import xxx from "vue/xxx"

// 以下不是裸依赖
import xxx from "./foo.ts" 
import xxx from "/foo.ts"

간단히 나눌 수 있습니다:

  • 이름으로 접근하는 모듈은 베어 모듈입니다
  • bare import가 아닌 경로로 접근하는 모듈

사실 Vite도 판단합니다 이 방법으로.

다음은 일반적인 Vue 프로젝트

Vite Learning의 심층 분석 의존성 스캔

의 모듈 종속성 트리입니다. 종속성 스캔 결과는 다음과 같습니다.

[ "vue", "axios" ]

왜 bare import만 미리 빌드되어 있나요?

Node.js는 베어 가져오기의 주소 지정 메커니즘을 정의합니다 - 현재 디렉터리의 node_modules에서 검색합니다. 찾을 수 없으면 디렉터리가 루트 경로가 될 때까지 상위 디렉터리의 node_modules로 이동합니다.

bare import는 일반적으로 npm에 의해 설치되는 모듈이며, 일반적인 상황에서는 수정되지 않습니다. 따라서 이 부분을 빌드하는 것이 좋습니다. 모듈을 미리 성능을 향상시키세요.

반대로 개발자가 작성한 코드가 미리 빌드되어 있고 프로젝트가 청크 파일로 패키징되어 있는 경우,

개발자가 코드를 수정하면 빌드를 다시 실행한 다음 청크 파일로 패키징해야 합니다. . 이 프로세스는 성능에 영향을 미칩니다.

monorepo 아래의 모듈도 사전 빌드되나요?

아니요. 모노레포의 경우, 일부 모듈은 베어 임포트되기는 하지만 이러한 모듈 역시 개발자가 직접 작성하고 제3자 모듈이 아니기 때문에 Vite는 이러한 모듈에 대해 사전 구축을 수행하지 않습니다.

실제로 Vite는 모듈의 실제 경로가 node_modules에 있는지

결정합니다.

실제 경로가 node_modules에 있는 모듈은 사전 빌드됩니다. 이것은 타사 모듈입니다.
  • 실제 경로가 node_modules에 없음은 모듈이 파일 링크(monorepo의 구현 방법)를 통해 node_modules에 연결되어 있음을 증명합니다. 개발자가 직접 작성한 코드이며 사전 빌드를 수행하지 않습니다
종속성 검사

구현 아이디어살펴보기 이 모듈 종속성 트리를 살펴보세요.

Vite Learning의 심층 분석 의존성 스캔모든 베어 임포트를 스캔하려면 전체 종속성 트리를 순회해야 하며, 여기에는

트리 깊이 순회

가 포함됩니다. 우리는 트리 순회에 대해 논의할 때 일반적으로 다음 두 가지 사항에 주의를 기울입니다.

언제 깊이 들어가는 것을 멈추나요?
  • 리프 노드를 처리하는 방법은 무엇입니까?

Vite Learning의 심층 분석 의존성 스캔현재 리프 노드가 심층 순회를 계속할 필요가 없는 상황:

Bare 가져오기 노드를 발견하면 종속성을 기록하고 심층 순회를 계속할 필요가 없습니다
  • When CSS, SVG 등과 같은 다른 JS 독립적 모듈을 만나면 JS 코드가 아니기 때문에 계속 깊이 탐색할 필요가 없습니다
모든 리프 노드가 탐색되면 기록된 bare import 객체는 다음과 같습니다. 종속성 스캔

의 결과입니다. 스캐닝에 의존하는 구현 아이디어는 실제로 이해하기 매우 쉽지만 실제 처리는 간단하지 않습니다.

리프 노드 처리를 살펴보겠습니다.

  • bare import

는 모듈 ID로 판단할 수 있습니다. 모듈 ID가 경로가 아닌 모듈은 bare import입니다. 이러한 모듈을 발견하면 종속성을 기록하고 더 이상 깊이 탐색하지 마세요.

  • 다른 JS 독립적 모듈

은 모듈의 접미사 이름으로 판단 할 수 있습니다. 예를 들어, *.css 모듈을 발견하면 *.css 的模块,无需任何处理,不再深入遍历

  • JS 模块

        要获取 JS 代码中依赖的子模块,就需要将代码转成 AST,获取其中 import 语句引入的模块,或者正则匹配出所有 import 的模块,然后继续深入遍历这些模块

  • HTML 类型模块

        这类模块比较复杂,例如 HTML 或 Vue,里面有一部分是 JS,需要把这部分 JS 代码提取出来,然后按 JS 模块进行分析处理,继续深入遍历这些模块。这里只需要关心 JS 部分,其他部分不会引入模块。

Vite Learning의 심층 분석 의존성 스캔

具体实现

我们已经知道了依赖扫描的实现思路,思路其实不复杂,复杂的是处理过程,尤其是 HTML、Vue 等模块的处理。

Vite 这里用了一种比较巧妙的办法 —— 用 esbuild 工具打包

为什么可以用 esbuild 打包代替深度遍历的过程?

本质上打包过程也是个深度遍历模块的过程,其替代的方式如下:

深度遍历 esbuild 打包
叶子节点的处理 esbuild 可以对每个模块(叶子节点)进行解析和加载
可以通过插件对这两个过程进行扩展,加入一些特殊的逻辑
例如将 html 在加载过程中转换为 js
不深入处理模块 esbuild 可以在解析过程,指定当前解析的模块为 external
则 esbuild 不再深入解析和加载该模块
深入遍历模块 正常解析模块(什么都不做,esbuild 默认行为),返回模块的文件真实路径

这块暂时看不懂没有关系,后面会有例子

Vite Learning의 심층 분석 의존성 스캔

各类模块的处理

가 필요하지 않습니다. JS 코드에서 종속 하위 모듈을 가져오려면

例子 处理
bare import vue 在解析过程中,将裸依赖保存到 deps 对象中,设置为 external
其他 JS 无关的模块 less文件 在解析过程中,设置为 external
JS 模块 ./mian.ts 正常解析和加载即可,esbuild 本身能处理 JS
html 类型模块 index.htmlapp.vue 처리가 필요하지 않습니다. 심층 순회 JS 모듈
코드를 AST로 변환하거나, import 문에 의해 도입된 모듈을 가져오거나, 가져온 모든 모듈을 일치시키거나 🎜 정규식을 통해 일치시켜야 합니다. 그런 다음 🎜계속해서 자세히 살펴보세요. 🎜이러한 모듈🎜🎜🎜HTML 유형 모듈🎜🎜🎜 이 유형의 모듈은 HTML 또는 Vue와 같이 더 복잡하며 그 중 일부는 JS이므로 🎜JS 코드에서 이 부분을 추출해야 합니다🎜 , JS 모듈에 따라 분석하고 처리합니다. 🎜계속 이 모듈을 살펴보세요. 여기서는 JS 부분만 신경쓰면 되며, 다른 부분에서는 모듈을 소개하지 않습니다. 🎜🎜Vite Learning의 심층 분석 의존성 스캔🎜🎜🎜특정 구현🎜🎜🎜우리는 이미 종속성 검색의 구현 아이디어를 알고 있습니다. 🎜아이디어는 실제로 복잡하지 않습니다🎜. 특히 HTML 및 Vue 모듈 처리. 🎜🎜Vite는 여기서 더 영리한 방법을 사용합니다. - 🎜패키징에 esbuild 도구 사용🎜🎜
🎜깊은 순회 프로세스를 대체하기 위해 esbuild 패키징을 사용할 수 있는 이유는 무엇입니까? 🎜
🎜본질적으로🎜패키징 프로세스는 모듈의 심층 탐색 프로세스이기도 합니다🎜. 대체 방법은 다음과 같습니다.🎜🎜🎜리프 노드 처리🎜🎜esbuild는 🎜각 모듈(리프 노드)을 구문 분석하고 로드🎜
사용할 수 있습니다. 플러그인을 통해 🎜확장🎜 이 두 프로세스를 확장하고 몇 가지 특수 로직을 추가하세요
예를 들어 로딩 프로세스 중에 html을 js로 변환🎜🎜🎜모듈을 깊이 있게 처리하지 마세요🎜🎜esbuild는 현재 구문 분석 프로세스 중 구문 분석 모듈이 🎜external🎜
인 경우 esbuild 🎜는 더 이상 모듈을 심층적으로 구문 분석하고 로드하지 않습니다🎜. 🎜🎜🎜모듈을 심층적으로 탐색합니다🎜🎜모듈을 정상적으로 구문 분석하고(아무 작업도 수행하지 않음, esbuild 기본 동작) 모듈 파일의 실제 경로를 반환합니다.🎜🎜🎜🎜🎜이해하지 못해도 상관없습니다. 이 부분은 현재로서는 나중에 예시가 나올 예정입니다🎜 🎜Vite Learning의 심층 분석 의존성 스캔🎜🎜모든 종류의 모듈 처리🎜
깊이 탐색 esbuild 패키징
🎜🎜bare import🎜🎜vue🎜🎜파싱 프로세스 중에 🎜bare 종속성을 deps 객체에 저장하고 다음으로 설정합니다. external🎜🎜🎜🎜다른 JS 관련 없는 모듈 🎜🎜파일 없음🎜🎜파싱 프로세스 중에 🎜는 external🎜🎜🎜🎜JS 모듈 🎜🎜으로 설정됩니다. /mian.ts🎜🎜일반적으로 구문 분석 그냥 로드하세요. esbuild 자체가 JS🎜🎜🎜html 유형 모듈🎜🎜index.html, app.vue🎜🎜로딩 프로세스 중에 이러한 모듈 🎜이 JS 🎜🎜🎜🎜🎜에 로드됩니다.<p>最后 <strong>dep 对象中收集到的依赖就是依赖扫描的结果</strong>,而这次 esbuild 的打包产物,其实是没有任何作用的,在依赖扫描过程中,我们<strong>只关心每个模块的处理过程,不关心构建产物</strong></p> <blockquote><p>用 Rollup 处理可以吗?</p></blockquote> <p>其实也可以,打包工具基本上都会有解析和加载的流程,也能对模块进行 external</p> <p>但是 esbuild 性能更好</p> <h3 data-id="heading-4"><strong>html 类型的模块处理</strong></h3> <p>这类文件有 <code>htmlvue 等。之前我们提到了要将它们转换成 JS,那么到底要如何转换呢?

Vite Learning의 심층 분석 의존성 스캔

由于依赖扫描过程,只关注引入的 JS 模块,因此可以直接丢弃掉其他不需要的内容,直接取其中 JS

html 类型文件(包括 vue)的转换,有两种情况:

  • 每个外部 script,会直接转换为 import 语句,引入外部 script
  • 每个内联 script,其内容将会作为虚拟模块被引入。

什么是虚拟模块?

是模块的内容并非直接从磁盘中读取,而是编译时生成

举个例子,src/main.ts 是磁盘中实际存在的文件,而 virtual-module:D:/project/index.html?id=0 在磁盘中是不存在的,需要借助打包工具(如 esbuild),在编译过程生成。

为什么需要虚拟模块?

因为一个 html 类型文件中,允许有多个 script 标签,多个内联的 script 标签,其内容无法处理成一个 JS 文件 (因为可能会有命名冲突等原因)

既然无法将多个内联 script,就只能将它们分散成多个虚拟模块,然后分别引入了。

源码解析

依赖扫描的入口

下面是扫描依赖的入口函数(为了便于理解,有删减和修改):

import { build } from 'esbuild'
export async function scanImports(config: ResolvedConfig): Promise
  missing: Record<string>
}> {
    
  // 将项目中所有的 html 文件作为入口,会排除 node_modules
  let entries: string[] = await globEntries('**/*.html', config)

  // 扫描到的依赖,会放到该对象
  const deps: Record<string> = {}
  // 缺少的依赖,用于错误提示
  const missing: Record<string> = {}
  
  // esbuild 扫描插件,这个是重点!!!
  const plugin = esbuildScanPlugin(config, container, deps, missing, entries)

  // 获取用户配置的 esbuild 自定义配置,没有配置就是空的
  const { plugins = [], ...esbuildOptions } =
    config.optimizeDeps?.esbuildOptions ?? {}

  await Promise.all(
    // 入口可能不止一个,分别用 esbuid 打包
    entries.map((entry) =>
      // esbuild 打包
      build({
        absWorkingDir: process.cwd(),
        write: false,
        entryPoints: [entry],
        bundle: true,
        format: 'esm',
        // 使用插件
        plugins: [...plugins, plugin],
        ...esbuildOptions
      })
    )
  )

  return {
    deps,
    missing
  }
}</string></string></string>

主要流程如下:

  • 将项目内所有的 html 作为入口文件(排除 node_modules)。

  • 将每个入口文件,用 esbuild 进行打包

这里的核心其实是 esbuildScanPlugin 插件的实现,它定义了各类模块(叶子节点)的处理方式。

function esbuildScanPlugin(config, container, deps, missing, entries){}
  • depmissing对象被当做入参传入,在函数中,这两个对象的内容会在打包(插件运行)过程中被修改

esbuild 插件

很多同学可能不知道 esbuild 插件是如何编写的,这里简单介绍一下:

每个模块都会经过解析(resolve)和加载(load)的过程:

  • 解析:将模块路径,解析成文件真实的路径。例如 vue,会解析到实际 node_modules 中的 vue 的入口 js 文件
  • 加载:根据解析的路径,读取文件的内容

Vite Learning의 심층 분석 의존성 스캔

插件可以定制化解析和加载的过程,下面是一些插件示例代码:

const plugin = {
    name: 'xxx',
    setup(build) {
        
        // 定制解析过程,所有的 http/https 的模块,都会被 external
        build.onResolve({ filter: /^(https?:)?\/\// }, ({ path }) => ({
            path,
            external: true
        }))
        
        // 定制解析过程,给所有 less 文件 namespace: less 标记
        build.onResolve({ filter: /.*\.less/ }, args => ({
            path: args.path,
            namespace: 'less',
        }))

        // 定义加载过程:只处理 namespace 为 less 的模块
        build.onLoad({ filter: /.*/, namespace: 'less' }, () => {
            const raw = fs.readFileSync(path, 'utf-8')
            const content = // 省略 less 处理,将 less 处理成 css
            return {
                contents,
                loader: 'css'
        	}
        })
    }
}
  • 通过 onResolveonLoad 定义解析和加载过程
  • onResolve 的第一个参数为过滤条件,第二个参数为回调函数,解析时调用,返回值可以给模块做标记,如 externalnamespace(用于过滤),还需要返回模块的路径
  • 每个模块, onResolve 会被依次调用,直到回调函数返回有效的值,后面的不再调用。如果都没有有效返回,则使用默认的解析方式
  • onLoad  的第一个参数为过滤条件,第二个参数为回调函数,加载时调用,可以读取文件的内容,然后进行处理,最后返回加载的内容
  • 每个模块,onLoad 会被依次调用,直到回调函数返回有效的值,后面的不再调用。如果都没有有效返回,则使用默认的加载方式。

扫描插件的实现

function esbuildScanPlugin(
  config: ResolvedConfig,
  container: PluginContainer,
  depImports: Record<string>,
  missing: Record<string>,
  entries: string[]
): Plugin</string></string>

部分参数解析:

  • config:Vite 的解析好的用户配置

  • container:这里只会用到 container.resolveId 的方法,这个方法能将模块路径转成真实路径

    例如 vue 转成 xxx/node_modules/dist/vue.esm-bundler.js

  • depImports:用于存储扫描到的依赖对象,插件执行过程中会被修改

  • missing:用于存储缺少的依赖的对象,插件执行过程中会被修改

  • entries:存储所有入口文件的数组

esbuild 默认能将模块路径转成真实路径,为什么还要用 container.resolveId

因为 Vite/Rollup 的插件,也能扩展解析的流程,例如 alias 的能力,我们常常会在项目中用 @ 的别名代表项目的 src 路径。

因此不能用 esbuild 原生的解析流程进行解析。

container(插件容器)用于兼容 Rollup 插件生态,用于保证 dev 和 production 模式下,Vite 能有一致的表现。感兴趣的可查看《Vite 是如何兼容 Rollup 插件生态的》

这里  container.resolveId  会被再次包装一成 resolve 函数(多了缓存能力)

const seen = new Map<string>()
const resolve = async (
    id: string,
    importer?: string,
    options?: ResolveIdOptions
) => {
    const key = id + (importer && path.dirname(importer))
    
    // 如果有缓存,就直接使用缓存
    if (seen.has(key)) {
        return seen.get(key)
    }
    // 将模块路径转成真实路径
    const resolved = await container.resolveId(
        id,
        importer && normalizePath(importer),
        {
            ...options,
            scan: true
        }
    )
    // 缓存解析过的路径,之后可以直接获取
    const res = resolved?.id
    seen.set(key, res)
    return res
  }</string>

那么接下来就是插件的实现了,先回顾一下之前写的各类模块的处理:


처리 중

例子 处理
bare import vue 在解析过程中,将裸依赖保存到 deps 对象中,设置为 external
其他 JS 无关的模块 less文件 在解析过程中,设置为 external
JS 模块 ./mian.ts 正常解析和加载即可,esbuild 本身能处理 JS
html 类型模块 index.htmlapp.vue 在加载过程中,将这些模块加载成 JS

JS 模块

esbuild 本身就能处理 JS 语法,因此 JS 是不需要任何处理的,esbuild 能够分析出 JS 文件中的依赖,并进一步深入处理这些依赖。

其他 JS 无关的模块

// external urls
build.onResolve({ filter: /^(https?:)?\/\// }, ({ path }) => ({
    path,
    external: true
}))

// external css 等文件
build.onResolve(
    {
        filter: /\.(css|less|sass|scss|styl|stylus|pcss|postcss|json|wasm)$/
    },
    ({ path }) => ({
        path,
        external: true
    }
)
    
// 省略其他 JS 无关的模块

这部分处理非常简单,直接匹配,然后 external 就行了

bare import

build.onResolve(
  {
    // 第一个字符串为字母或 @,且第二个字符串不是 : 冒号。如 vite、@vite/plugin-vue
    // 目的是:避免匹配 window 路径,如 D:/xxx 
    filter: /^[\w@][^:]/
  },
  async ({ path: id, importer, pluginData }) => {
    // depImports 为
    if (depImports[id]) {
      return externalUnlessEntry({ path: id })
    }
    // 将模块路径转换成真实路径,实际上调用 container.resolveId
    const resolved = await resolve(id, importer, {
      custom: {
        depScan: { loader: pluginData?.htmlType?.loader }
      }
    })
    
    // 如果解析到路径,证明找得到依赖
    // 如果解析不到路径,则证明找不到依赖,要记录下来后面报错
    if (resolved) {
      if (shouldExternalizeDep(resolved, id)) {
        return externalUnlessEntry({ path: id })
      }
      // 如果模块在 node_modules 中,则记录 bare import
      if (resolved.includes('node_modules')) {
        // 记录 bare import
        depImports[id] = resolved

        return {
        	path,
        	external: true
   		}
      } 
      // isScannable 判断该文件是否可以扫描,可扫描的文件有 JS、html、vue 等
      // 因为有可能裸依赖的入口是 css 等非 JS 模块的文件
      else if (isScannable(resolved)) {
        // 真实路径不在 node_modules 中,则证明是 monorepo,实际上代码还是在用户的目录中
        // 是用户自己写的代码,不应该 external
        return {
          path: path.resolve(resolved)
        }
      } else {
        // 其他模块不可扫描,直接忽略,external
        return {
            path,
            external: true
        }
      }
    } else {
      // 解析不到依赖,则记录缺少的依赖
      missing[id] = normalizePath(importer)
    }
  }
)
  • 如果文件在 node_modules 中,才认为是 bare import,记录当前模块
  • 文件不在 node_modules 中,则是 monorepo,是用户自己写的代码
    • 如果这些代码 isScanable 可扫描(即含有 JS 代码),则继续深入处理
    • 其他非 JS 模块,external

html 类型模块

如: index.htmlapp.vue

const htmlTypesRE = /\.(html|vue|svelte|astro)$/

// html types: 提取 script 标签
build.onResolve({ filter: htmlTypesRE }, async ({ path, importer }) => {
    // 将模块路径,转成文件的真实路径
    const resolved = await resolve(path, importer)
    if (!resolved) return
    
    // 不处理 node_modules 内的
    if (resolved.includes('node_modules'){
        return
   }

    return {
        path: resolved,
        // 标记 namespace 为 html 
        namespace: 'html'
    }
})

解析过程很简单,只是用于过滤掉一些不需要的模块,并且标记 namespace 为 html

真正的处理在加载阶段:

Vite Learning의 심층 분석 의존성 스캔

// 正则,匹配例子: <script></script>
const scriptModuleRE = /(<script>]*type\s*=\s*(?:"module"|&#39;module&#39;)[^>]*>)(.*?)<\/script>/gims
// 正则,匹配例子: <script></script>
export const scriptRE = /(<script>]*>|>))(.*?)<\/script>/gims

build.onLoad(
    { filter: htmlTypesRE, namespace: &#39;html&#39; },
    async ({ path }) => {
        // 读取源码
        let raw = fs.readFileSync(path, &#39;utf-8&#39;)
        // 去掉注释,避免后面匹配到注释
        raw = raw.replace(commentRE, &#39;<!---->&#39;)

        const isHtml = path.endsWith(&#39;.html&#39;)
        // scriptModuleRE: <script type=module></script>
        // scriptRE: <script></script>
        // html 模块,需要匹配 module 类型的 script,因为只有 module 类型的 script 才能使用 import
        const regex = isHtml ? scriptModuleRE : scriptRE

        // 重置正则表达式的索引位置,因为同一个正则表达式对象,每次匹配后,lastIndex 都会改变
        // regex 会被重复使用,每次都需要重置为 0,代表从第 0 个字符开始正则匹配
        regex.lastIndex = 0
        // load 钩子返回值,表示加载后的 js 代码
        let js = ''
        let scriptId = 0
        let match: RegExpExecArray | null

        // 匹配源码的 script 标签,用 while 循环,因为 html 可能有多个 script 标签
        while ((match = regex.exec(raw))) {
            // openTag: 它的值的例子: <script>
            // content: script 标签的内容
            const [, openTag, content] = match
            
            // 正则匹配出 openTag 中的 type 和 lang 属性
            const typeMatch = openTag.match(typeRE)
            const type =
                  typeMatch && (typeMatch[1] || typeMatch[2] || typeMatch[3])
            const langMatch = openTag.match(langRE)
            const lang =
                  langMatch && (langMatch[1] || langMatch[2] || langMatch[3])
            
            // 跳过 type="application/ld+json" 和其他非 non-JS 类型
            if (
                type &&
                !(
                    type.includes(&#39;javascript&#39;) ||
                    type.includes(&#39;ecmascript&#39;) ||
                    type === &#39;module&#39;
                )
            ) {
                continue
            }
            
            // esbuild load 钩子可以设置 应的 loader
            let loader: Loader = &#39;js&#39;
            if (lang === &#39;ts&#39; || lang === &#39;tsx&#39; || lang === &#39;jsx&#39;) {
                loader = lang
            } else if (path.endsWith(&#39;.astro&#39;)) {
                loader = &#39;ts&#39;
            }
            
            // 正则匹配出 script src 属性
            const srcMatch = openTag.match(srcRE)
            // 有 src 属性,证明是外部 script
            if (srcMatch) {
                
                const src = srcMatch[1] || srcMatch[2] || srcMatch[3]
                // 外部 script,改为用 import 用引入外部 script
                js += `import ${JSON.stringify(src)}\n`
            } else if (content.trim()) {
                // 内联的 script,它的内容要做成虚拟模块

                // 缓存虚拟模块的内容
                // 一个 html 可能有多个 script,用 scriptId 区分
                const key = `${path}?id=${scriptId++}`
                scripts[key] = {
                    loader,
                    content,
                    pluginData: {
                        htmlType: { loader }
                    }
                }

                // 虚拟模块的路径,如 virtual-module:D:/project/index.html?id=0
                const virtualModulePath = virtualModulePrefix + key
                js += `export * from ${virtualModulePath}\n`
            }
        }

        return {
            loader: &#39;js&#39;,
            contents: js
        }
    }
)</script>

加载阶段的主要做有以下流程:

  • 读取文件源码
  • 正则匹配出所有的 script 标签,并对每个 script 标签的内容进行处理
    • 外部 script,改为用 import 引入
    • 内联 script,改为引入虚拟模块,并将对应的虚拟模块的内容缓存到 script 对象。
  • 最后返回转换后的 js

srcMatch[1] || srcMatch[2] || srcMatch[3] 是干嘛?

我们来看看匹配的表达式:

const srcRE = /\bsrc\s*=\s*(?:"([^"]+)"|'([^']+)'|([^\s'">]+))/im

因为 src 可以有以下三种写法:

  • src="xxx"
  • src='xxx'
  • src=xxx

三种情况会出现其中一种,因此是三个捕获组

虚拟模块是如何加载成对应的 script 代码的?

export const virtualModuleRE = /^virtual-module:.*/

// 匹配所有的虚拟模块,namespace 标记为 script
build.onResolve({ filter: virtualModuleRE }, ({ path }) => {
  return {
    // 去掉 prefix
    // virtual-module:D:/project/index.html?id=0 => D:/project/index.html?id=0
    path: path.replace(virtualModulePrefix, ''),
    namespace: 'script'
  }
})

// 之前的内联 script 内容,保存到 script 对象,加载虚拟模块的时候取出来
build.onLoad({ filter: /.*/, namespace: 'script' }, ({ path }) => {
  return scripts[path]
})

虚拟模块的加载很简单,直接从 script 对象中,读取之前缓存起来的内容即可。

这样之后,我们就可以把 html 类型的模块,转换成 JS 了

扫描结果

下面是一个  depImport 对象的例子:

{
  "vue": "D:/app/vite/node_modules/.pnpm/vue@3.2.37/node_modules/vue/dist/vue.runtime.esm-bundler.js",
  "vue/dist/vue.d.ts": "D:/app/vite/node_modules/.pnpm/vue@3.2.37/node_modules/vue/dist/vue.d.ts",
  "lodash-es": "D:/app/vite/node_modules/.pnpm/lodash-es@4.17.21/node_modules/lodash-es/lodash.js"
}
  • key:模块名称
  • value:模块的真实路径

总结

依赖扫描是预构建前的一个非常重要的步骤,这决定了 Vite 需要对哪些依赖进行预构建。

本文介绍了 Vite 会对哪些内容进行依赖预构建,然后分析了实现依赖扫描的基本思路 —— 深度遍历依赖树,并对各种类型的模块进行处理。然后介绍了 Vite 如何巧妙的使用 esbuild 实现这一过程。最后对这部分的源码进行了解析:

  • 最复杂的就是 html 类型模块的处理,需要使用虚拟模块
  • 当遇到 bare import 时,需要判断是否在 node_modules 中,在的才记录依赖,然后  external。
  • 其他 JS 无关的模块就直接 external
  • JS 模块由于 esbuild 本身能处理,不需要做任何的特殊操作

最后获取到的 depImport 是一个记录依赖以及其真实路径的对象

(学习视频分享:web前端开发编程基础视频

위 내용은 Vite Learning의 심층 분석 '의존성 스캔'의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
이 기사는 juejin.cn에서 복제됩니다. 침해가 있는 경우 admin@php.cn으로 문의하시기 바랍니다. 삭제