WebGPU 튜토리얼: 웹의 컴퓨팅, 정점 및 조각 셰이더-JS 튜토리얼-php.cn

집

웹 프론트엔드

JS 튜토리얼

WebGPU 튜토리얼: 웹의 컴퓨팅, 정점 및 조각 셰이더

DDD

Jan 17, 2025 am 08:30 AM

WebGPU tutorial: compute, vertex, and fragment shaders on the web

WebGPU는 최첨단 GPU 컴퓨팅 기능을 웹에 도입하여 공유 코드 기반을 사용하는 모든 소비자 플랫폼에 혜택을 제공하는 글로벌 기술입니다.

이전 버전인 WebGL은 강력하지만 컴퓨팅 셰이더 기능이 심각하게 부족하여 적용 범위가 제한됩니다.

WGSL(WebGPU 셰이더/컴퓨팅 언어)은 Rust 및 GLSL과 같은 분야의 모범 사례를 활용합니다.

WebGPU 사용법을 배우면서 문서에서 몇 가지 공백을 발견했습니다. 컴퓨팅 셰이더를 사용하여 버텍스 및 프래그먼트 셰이더의 데이터를 계산하는 간단한 시작점을 찾고 싶었습니다.

이 튜토리얼의 모든 코드에 대한 단일 파일 HTML은 https://www.php.cn/link/2e5281ee978b78d6f5728aad8f28fedb에서 찾을 수 있습니다. 자세한 내용은 계속 읽어보세요.

다음은 내 도메인에서 실행되는 이 HTML에 대한 한 번의 클릭 데모입니다. https://www.php.cn/link/bed827b4857bf056d05980661990ccdc Chrome 또는 Edge와 같은 WebGPU 기반 브라우저 https://www.php.cn/link/bae00fb8b4115786ba5dbbb67b9b177a).

고급 설정

이것은 입자 시뮬레이션입니다. 시간이 지남에 따라 시간 단계에 따라 발생합니다.

시간은 JS/CPU에서 추적되어 (부동) 유니폼으로 GPU에 전달됩니다.

입자 데이터는 전적으로 GPU에서 관리됩니다. CPU와 계속 상호작용하면서도 메모리를 할당하고 초기 값을 설정할 수 있습니다. 데이터를 다시 CPU로 읽는 것도 가능하지만 이 튜토리얼에서는 생략합니다.

이 설정의 마법은 각 입자가 다른 모든 입자와 병렬로 업데이트되어 브라우저에서 놀라운 계산 및 렌더링 속도를 가능하게 한다는 것입니다(병렬화는 GPU의 코어 수를 최대화합니다. 입자 수를 다음과 같이 나눌 수 있습니다). 코어당 업데이트 단계당 실제 주기 수를 얻기 위한 코어 수).

바인딩

CPU와 GPU 간의 데이터 교환을 위해 WebGPU가 사용하는 메커니즘은 바인딩입니다. JS 배열(예: Float32Array)은 WebGPU 버퍼를 사용하여 WGSL의 메모리 위치에 "바인딩"될 수 있습니다. WGSL 메모리 위치는 두 개의 정수, 즉 그룹 번호와 바인딩 번호로 식별됩니다.

우리의 경우 컴퓨팅 셰이더와 버텍스 셰이더는 모두 시간과 입자 위치라는 두 가지 데이터 바인딩에 의존합니다.

시간 - 교복

컴퓨팅 셰이더(https://www.php.cn/link/2e5281ee978b78d6f5728aad8f28fedb#L43) 및 버텍스 셰이더에 균일한 정의가 존재합니다. (https://www.php.cn/link/2e5281ee978b78d6f5728aad8f28fedb#L69) 중간 - 셰이더 업데이트 위치를 계산하고, 버텍스 셰이더는 시간에 따라 색상을 업데이트합니다.

컴퓨팅 셰이더부터 시작하여 JS 및 WGSL의 바인딩 설정을 살펴보겠습니다.

<code>const computeBindGroup = device.createBindGroup({
  /*
    参见 computePipeline 定义，网址为
    https://www.php.cn/link/2e5281ee978b78d6f5728aad8f28fedb#L102

    它允许将 JS 字符串与 WGSL 代码链接到 WebGPU
  */
  layout: computePipeline.getBindGroupLayout(0), // 组号 0
  entries: [{
    // 时间绑定在绑定号 0
    binding: 0,
    resource: {
      /*
      作为参考，缓冲区声明为：

      const timeBuffer = device.createBuffer({
        size: Float32Array.BYTES_PER_ELEMENT,
        usage: GPUBufferUsage.UNIFORM | GPUBufferUsage.COPY_DST})
      })

      https://www.php.cn/link/2e5281ee978b78d6f5728aad8f28fedb#L129
      */
      buffer: timeBuffer
    }
  },
  {
    // 粒子位置数据在绑定号 1（仍在组 0）
    binding: 1,
    resource: {
      buffer: particleBuffer
    }
  }]
});</code>

및 컴퓨팅 셰이더의 해당 선언

<code>// 来自计算着色器 - 顶点着色器中也有类似的声明
@group(0) @binding(0) var<uniform> t: f32;
@group(0) @binding(1) var<storage read_write=""> particles : array<particle>;
</particle></storage></uniform></code>

중요하게, JS와 WGSL의 그룹 번호와 바인딩 번호를 일치시켜 JS 측의 timeBuffer를 WGSL에 바인딩합니다.

이를 통해 JS에서 변수 값을 제어할 수 있습니다.

<code>/* 数组中只需要 1 个元素，因为时间是单个浮点值 */
const timeJs = new Float32Array(1)
let t = 5.3
/* 纯 JS，只需设置值 */
timeJs.set([t], 0)
/* 将数据从 CPU/JS 传递到 GPU/WGSL */
device.queue.writeBuffer(timeBuffer, 0, timeJs);</code>

입자 위치 - WGSL 저장

우리는 GPU 액세스 가능 메모리에 입자 위치를 직접 저장하고 업데이트하므로 GPU의 대규모 멀티 코어 아키텍처를 활용하여 병렬로 업데이트할 수 있습니다.

병렬화는 컴퓨팅 셰이더에 선언된 작업 그룹 크기의 도움으로 조정됩니다.

<code>@compute @workgroup_size(64)
fn main(@builtin(global_invocation_id) global_id : vec3<u32>) {
  // ...
}
</u32></code>

@builtin(global_invocation_id) global_id : vec3 이 값은 스레드 식별자를 제공합니다.

정의에 따르면 global_invocation_id = workgroup_id * workgroup_size local_invocation_id - 이는 입자 인덱스로 사용할 수 있음을 의미합니다.

예를 들어 10,000개의 파티클이 있고 workgroup_size가 64인 경우 Math.ceil(10000/64) 작업 그룹을 예약해야 합니다. JS에서 컴퓨팅 패스가 트리거될 때마다 GPU에 이 작업량을 수행하도록 명시적으로 지시합니다.

<code>computePass.dispatchWorkgroups(Math.ceil(PARTICLE_COUNT / WORKGROUP_SIZE));</code>

PARTICLE_COUNT == 10000이고 WORKGROUP_SIZE == 64인 경우 157개의 작업 그룹(10000/64 = 156.25)을 시작하고 각 작업 그룹의 계산된 local_invocation_id 범위는 0~63입니다(workgroup_id의 범위는 0~157입니다). ). 157 * 64 = 1048이므로 작업 그룹에서 약간 더 많은 계산을 수행하게 됩니다. 중복된 호출을 폐기하여 오버플로를 처리합니다.

다음 요소를 고려한 후 셰이더를 계산한 최종 결과는 다음과 같습니다.

<code>@compute @workgroup_size(${WORKGROUP_SIZE})
fn main(@builtin(global_invocation_id) global_id : vec3<u32>) {
  let index = global_id.x;
  // 由于工作组网格未对齐，因此丢弃额外的计算
  if (index >= arrayLength(&particles)) {
    return;
  }
  /* 将整数索引转换为浮点数，以便我们可以根据索引（和时间）计算位置更新 */
  let fi = f32(index);
  particles[index].position = vec2<f32>(
    /* 公式背后没有宏伟的意图 - 只不过是用时间+索引的例子 */
    cos(fi * 0.11) * 0.8 + sin((t + fi)/100)/10,
    sin(fi * 0.11) * 0.8 + cos((t + fi)/100)/10
  );
}
</f32></u32></code>

입자가 저장 변수로 정의되기 때문에 이러한 값은 계산 단계 전반에 걸쳐 유지됩니다.

버텍스 셰이더의 컴퓨팅 셰이더에서 입자 위치 읽기

컴퓨팅 셰이더에서 정점 셰이더의 입자 위치를 읽으려면 읽기 전용 뷰가 필요합니다. 컴퓨팅 셰이더만 스토리지에 쓸 수 있기 때문입니다.

다음은 WGSL의 입장문 전문입니다.

<code>@group(0) @binding(0) var<uniform> t: f32;
@group(0) @binding(1) var<storage> particles : array<vec2>>;
/*
或等效：

@group(0) @binding(1) var<storage read=""> particles : array<vec2>>;
*/
</vec2></storage></vec2></storage></uniform></code>

컴퓨팅 셰이더에서 동일한 읽기_쓰기 스타일을 재사용하려고 하면 오류가 발생합니다.

<code>var with 'storage' address space and 'read_write' access mode cannot be used by vertex pipeline stage</code>

정점 셰이더의 바인딩 번호는 컴퓨팅 셰이더 바인딩 번호와 일치할 필요는 없으며 꼭지점 셰이더의 바인딩 그룹 선언과만 일치하면 됩니다.

<code>const renderBindGroup = device.createBindGroup({
  layout: pipeline.getBindGroupLayout(0),
  entries: [{
    binding: 0,
    resource: {
      buffer: timeBuffer
    }
  },
  {
    binding: 1,
    resource: {
      buffer: particleBuffer
    }
  }]
});</code>

GitHub 샘플 코드에서 바인딩:2를 선택했습니다. https://www.php.cn/link/2e5281ee978b78d6f5728aad8f28fedb#L70 - WebGPU에 의해 부과된 제약의 경계를 탐색하기 위해

단계별 시뮬레이션 실행

모든 설정이 완료되면 업데이트 및 렌더링 루프가 JS에서 조정됩니다.

<code>/* 从 t = 0 开始模拟 */
let t = 0
function frame() {
  /*
    为简单起见，使用恒定整数时间步 - 无论帧速率如何，都会一致渲染。
  */
  t += 1
  timeJs.set([t], 0)
  device.queue.writeBuffer(timeBuffer, 0, timeJs);

  // 计算传递以更新粒子位置
  const computePassEncoder = device.createCommandEncoder();
  const computePass = computePassEncoder.beginComputePass();
  computePass.setPipeline(computePipeline);
  computePass.setBindGroup(0, computeBindGroup);
  // 重要的是要调度正确数量的工作组以处理所有粒子
  computePass.dispatchWorkgroups(Math.ceil(PARTICLE_COUNT / WORKGROUP_SIZE));
  computePass.end();
  device.queue.submit([computePassEncoder.finish()]);

  // 渲染传递
  const commandEncoder = device.createCommandEncoder();
  const passEncoder = commandEncoder.beginRenderPass({
    colorAttachments: [{
      view: context.getCurrentTexture().createView(),
      clearValue: { r: 0.0, g: 0.0, b: 0.0, a: 1.0 },
      loadOp: 'clear',
      storeOp: 'store',
    }]
  });
  passEncoder.setPipeline(pipeline);
  passEncoder.setBindGroup(0, renderBindGroup);
  passEncoder.draw(PARTICLE_COUNT);
  passEncoder.end();
  device.queue.submit([commandEncoder.finish()]);

  requestAnimationFrame(frame);
}
frame();</code>

결론

WebGPU는 브라우저에서 대규모 병렬 GPU 컴퓨팅의 성능을 발휘합니다.

패스로 실행됩니다. 각 패스에는 메모리 바인딩(CPU 메모리와 GPU 메모리 브리징)이 있는 파이프라인을 통해 활성화된 로컬 변수가 있습니다.

컴퓨팅 딜리버리를 사용하면 작업 그룹을 통해 병렬 워크로드를 조정할 수 있습니다.

일부 무거운 설정이 필요하기는 하지만 로컬 바인딩/상태 스타일은 WebGL의 전역 상태 모델에 비해 크게 개선되었다고 생각합니다. 사용이 더 쉬워지는 동시에 GPU 컴퓨팅의 성능을 웹에 도입하는 것이기도 합니다.

위 내용은 WebGPU 튜토리얼: 웹의 컴퓨팅, 정점 및 조각 셰이더의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명

본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

관련 기사

Python vs. JavaScript : 개발 환경 및 도구Apr 26, 2025 am 12:09 AM

개발 환경에서 Python과 JavaScript의 선택이 모두 중요합니다. 1) Python의 개발 환경에는 Pycharm, Jupyternotebook 및 Anaconda가 포함되어 있으며 데이터 과학 및 빠른 프로토 타이핑에 적합합니다. 2) JavaScript의 개발 환경에는 Node.js, VScode 및 Webpack이 포함되어 있으며 프론트 엔드 및 백엔드 개발에 적합합니다. 프로젝트 요구에 따라 올바른 도구를 선택하면 개발 효율성과 프로젝트 성공률이 향상 될 수 있습니다.

JavaScript가 C로 작성 되었습니까? 증거를 검토합니다Apr 25, 2025 am 12:15 AM

예, JavaScript의 엔진 코어는 C로 작성되었습니다. 1) C 언어는 효율적인 성능과 기본 제어를 제공하며, 이는 JavaScript 엔진 개발에 적합합니다. 2) V8 엔진을 예를 들어, 핵심은 C로 작성되며 C의 효율성 및 객체 지향적 특성을 결합하여 C로 작성됩니다.

JavaScript의 역할 : 웹 대화식 및 역동적 인 웹Apr 24, 2025 am 12:12 AM

JavaScript는 웹 페이지의 상호 작용과 역학을 향상시키기 때문에 현대 웹 사이트의 핵심입니다. 1) 페이지를 새로 고치지 않고 콘텐츠를 변경할 수 있습니다. 2) Domapi를 통해 웹 페이지 조작, 3) 애니메이션 및 드래그 앤 드롭과 같은 복잡한 대화식 효과를 지원합니다. 4) 성능 및 모범 사례를 최적화하여 사용자 경험을 향상시킵니다.

C 및 JavaScript : 연결이 설명되었습니다Apr 23, 2025 am 12:07 AM

C 및 JavaScript는 WebAssembly를 통한 상호 운용성을 달성합니다. 1) C 코드는 WebAssembly 모듈로 컴파일되어 컴퓨팅 전력을 향상시키기 위해 JavaScript 환경에 도입됩니다. 2) 게임 개발에서 C는 물리 엔진 및 그래픽 렌더링을 처리하며 JavaScript는 게임 로직 및 사용자 인터페이스를 담당합니다.

웹 사이트에서 앱으로 : 다양한 JavaScript 애플리케이션Apr 22, 2025 am 12:02 AM

JavaScript는 웹 사이트, 모바일 응용 프로그램, 데스크탑 응용 프로그램 및 서버 측 프로그래밍에서 널리 사용됩니다. 1) 웹 사이트 개발에서 JavaScript는 HTML 및 CSS와 함께 DOM을 운영하여 동적 효과를 달성하고 jQuery 및 React와 같은 프레임 워크를 지원합니다. 2) 반응 및 이온 성을 통해 JavaScript는 크로스 플랫폼 모바일 애플리케이션을 개발하는 데 사용됩니다. 3) 전자 프레임 워크를 사용하면 JavaScript가 데스크탑 애플리케이션을 구축 할 수 있습니다. 4) node.js는 JavaScript가 서버 측에서 실행되도록하고 동시 요청이 높은 높은 요청을 지원합니다.

Python vs. JavaScript : 사용 사례 및 응용 프로그램 비교Apr 21, 2025 am 12:01 AM

Python은 데이터 과학 및 자동화에 더 적합한 반면 JavaScript는 프론트 엔드 및 풀 스택 개발에 더 적합합니다. 1. Python은 데이터 처리 및 모델링을 위해 Numpy 및 Pandas와 같은 라이브러리를 사용하여 데이터 과학 및 기계 학습에서 잘 수행됩니다. 2. 파이썬은 간결하고 자동화 및 스크립팅이 효율적입니다. 3. JavaScript는 프론트 엔드 개발에 없어서는 안될 것이며 동적 웹 페이지 및 단일 페이지 응용 프로그램을 구축하는 데 사용됩니다. 4. JavaScript는 Node.js를 통해 백엔드 개발에 역할을하며 전체 스택 개발을 지원합니다.

JavaScript 통역사 및 컴파일러에서 C/C의 역할Apr 20, 2025 am 12:01 AM

C와 C는 주로 통역사와 JIT 컴파일러를 구현하는 데 사용되는 JavaScript 엔진에서 중요한 역할을합니다. 1) C는 JavaScript 소스 코드를 구문 분석하고 추상 구문 트리를 생성하는 데 사용됩니다. 2) C는 바이트 코드 생성 및 실행을 담당합니다. 3) C는 JIT 컴파일러를 구현하고 런타임에 핫스팟 코드를 최적화하고 컴파일하며 JavaScript의 실행 효율을 크게 향상시킵니다.

자바 스크립트 행동 : 실제 예제 및 프로젝트Apr 19, 2025 am 12:13 AM

실제 세계에서 JavaScript의 응용 프로그램에는 프론트 엔드 및 백엔드 개발이 포함됩니다. 1) DOM 운영 및 이벤트 처리와 관련된 TODO 목록 응용 프로그램을 구축하여 프론트 엔드 애플리케이션을 표시합니다. 2) Node.js를 통해 RESTFULAPI를 구축하고 Express를 통해 백엔드 응용 프로그램을 시연하십시오.

See all articles