x86_64 아키텍처에서 원자 부동 소수점 및 벡터 연산은 어떻게 처리됩니까?-C++-php.cn

집

백엔드 개발

C++

x86_64 아키텍처에서 원자 부동 소수점 및 벡터 연산은 어떻게 처리됩니까?

Mary-Kate Olsen

Dec 07, 2024 am 06:08 AM

How are Atomic Floating-Point and Vector Operations Handled on x86_64 Architectures?

x86_64의 원자 부동 소수점 연산

C는 기본적으로 원자 이중 연산을 지원하지 않지만 잠금 없는 원자 대부분의 플랫폼에서 구현됩니다. 이러한 구현에서는 일반적으로 잠금 cmpxchg 명령과 함께 CAS(비교 및 교체) 작업을 사용합니다.

x86_64의 원자 벡터 작업의 경우 직접적인 하드웨어 지원이 없습니다. 그러나 정렬된 128비트 및 256비트 로드 및 저장은 일반적으로 원자성이 보장됩니다. 정렬되지 않은 벡터 연산의 경우 원자성 보장이 덜 명확합니다.

이중 및 벡터 연산에 대한 어셈블리 수준 지원

x86_64는 원자성 연산에 대한 어셈블리 수준 지원을 제공합니다. 복식과 벡터:

더블: 원자 로드, 저장 및 더하기/빼기/곱하기 연산은 메모리 대상 명령어 movsd, movq, addd, subsd 및 mulsd를 통해 지원됩니다.
벡터: 정렬된 128비트 256비트 로드 및 저장은 AVX를 지원하는 x86_64에서 원자적입니다. 정렬되지 않은 벡터 연산의 경우 원자성에 대한 직접적인 하드웨어 보장은 없습니다.

MSVC 2017 Lock-Free 원자

MSVC 2017 구현 잠금 없는 원자을 구현합니다. 이중 폭 정수 레지스터를 사용하는 연산. 예를 들어 로드 작업에는 다음이 포함됩니다.

CAS: movq QWORD PTR [dst_addr], rax  // 64-bit CAS

추가 작업에는 다음이 사용됩니다.

CAS: lock cmpxchg16b QWORD PTR [dst_addr], rax  // 128-bit CAS

Atomic RMW(Read-Modify-Write) 작업

fetch_add와 같은 원자적 읽기-수정-쓰기(RMW) 작업에는 CAS 루프가 필요합니다. 구현. x86_64에서 CAS 명령어는 16바이트 작업(cmpxchg16b)을 지원합니다.

CAS: lock cmpxchg16b QWORD PTR [dst_addr], rax

CAS 루프는 원자 RMW 기능을 제공하지만 원자 로드 및 저장보다 비용이 더 많이 듭니다.

추가 참고사항

일부 x86이 아닌 하드웨어는 float/double 유형에 대한 원자 추가 작업을 지원합니다.
인텔의 TSX(Transactional Memory Extensions)는 원자 FP 및 SIMD 작업에 대한 향상된 지원을 제공합니다.
컴파일러는 종종 원자<에 대한 비효율적인 코드를 생성합니다. ;더블> 그러나 개선이 이루어지고 있습니다.
정렬된 double의 공유 배열에 대한 원자 연산은 안전해야 하지만 정렬되지 않은 벡터에 대한 연산에는 찢어짐이 포함될 수 있습니다.
16에서 원자 연산을 구현하는 것이 가능합니다. -cmpxchg16b를 사용하는 바이트 개체이지만 성능이 저하됩니다.

위 내용은 x86_64 아키텍처에서 원자 부동 소수점 및 벡터 연산은 어떻게 처리됩니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명

본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

관련 기사

C에서 XML 사용 : 라이브러리 및 도구에 대한 안내서May 09, 2025 am 12:16 AM

XML은 데이터, 특히 구성 파일, 데이터 저장 및 네트워크 통신에서 데이터를 구조화하는 편리한 방법을 제공하기 때문에 C에서 사용됩니다. 1) TinyXML, PugixML, RapidXML과 같은 적절한 라이브러리를 선택하고 프로젝트 요구에 따라 결정하십시오. 2) XML 파싱 및 생성의 두 가지 방법을 이해하십시오. DOM은 자주 액세스 및 수정에 적합하며 SAX는 큰 파일 또는 스트리밍 데이터에 적합합니다. 3) 성능을 최적화 할 때 TinyXML은 작은 파일에 적합하며 PugixML은 메모리와 속도에서 잘 작동하며 RapidXML은 큰 파일을 처리하는 데 탁월합니다.

C# 및 C : 다른 패러다임 탐색May 08, 2025 am 12:06 AM

C#과 C의 주요 차이점은 메모리 관리, 다형성 구현 및 성능 최적화입니다. 1) C#은 쓰레기 수집기를 사용하여 메모리를 자동으로 관리하는 반면 C는 수동으로 관리해야합니다. 2) C#은 인터페이스 및 가상 방법을 통해 다형성을 실현하고 C는 가상 함수와 순수한 가상 함수를 사용합니다. 3) C#의 성능 최적화는 구조 및 병렬 프로그래밍에 따라 다르며 C는 인라인 함수 및 멀티 스레딩을 통해 구현됩니다.

C XML 파싱 : 기술 및 모범 사례May 07, 2025 am 12:06 AM

DOM 및 SAX 방법은 XML 데이터를 C에서 구문 분석하는 데 사용될 수 있습니다. 1) DOM 파싱은 XML로드를 메모리로, 작은 파일에 적합하지만 많은 메모리를 차지할 수 있습니다. 2) Sax Parsing은 이벤트 중심이며 큰 파일에 적합하지만 무작위로 액세스 할 수는 없습니다. 올바른 방법을 선택하고 코드를 최적화하면 효율성이 향상 될 수 있습니다.

특정 도메인의 C : 거점 탐색May 06, 2025 am 12:08 AM

C는 고성능과 유연성으로 인해 게임 개발, 임베디드 시스템, 금융 거래 및 과학 컴퓨팅 분야에서 널리 사용됩니다. 1) 게임 개발에서 C는 효율적인 그래픽 렌더링 및 실시간 컴퓨팅에 사용됩니다. 2) 임베디드 시스템에서 C의 메모리 관리 및 하드웨어 제어 기능이 첫 번째 선택이됩니다. 3) 금융 거래 분야에서 C의 고성능은 실시간 컴퓨팅의 요구를 충족시킵니다. 4) 과학 컴퓨팅에서 C의 효율적인 알고리즘 구현 및 데이터 처리 기능이 완전히 반영됩니다.

신화를 파악 : C는 정말로 죽은 언어입니까?May 05, 2025 am 12:11 AM

C는 죽지 않았지만 많은 주요 영역에서 번성했습니다 : 1) 게임 개발, 2) 시스템 프로그래밍, 3) 고성능 컴퓨팅, 4) 브라우저 및 네트워크 응용 프로그램, C는 여전히 유명한 활력 및 응용 시나리오를 보여줍니다.

C# vs. C : 프로그래밍 언어의 비교 분석May 04, 2025 am 12:03 AM

C#과 C의 주요 차이점은 구문, 메모리 관리 및 성능입니다. 1) C# Syntax는 현대적이며 Lambda 및 Linq를 지원하며 C 기능을 유지하고 템플릿을 지원합니다. 2) C# 자동으로 메모리를 관리하고 C는 수동으로 관리해야합니다. 3) C 성능은 C#보다 낫지 만 C# 성능도 최적화되고 있습니다.

C를 사용하여 XML 애플리케이션 구축 : 실제 예제May 03, 2025 am 12:16 AM

tinyxml, pugixml 또는 libxml2 라이브러리를 사용하여 C에서 XML 데이터를 처리 할 수 있습니다. 1) XML 파일을 구문 분석 할 수 있습니다. dom 또는 sax 메소드 사용, dom은 작은 파일에 적합하며 Sax는 큰 파일에 적합합니다. 2) XML 파일 생성 : 데이터 구조를 XML 형식으로 변환하고 파일에 씁니다. 이러한 단계를 통해 XML 데이터를 효과적으로 관리하고 조작 할 수 있습니다.

C의 XML : 복잡한 데이터 구조 처리May 02, 2025 am 12:04 AM

C에서 XML 데이터 구조로 작업하면 tinyxml 또는 pugixml 라이브러리를 사용할 수 있습니다. 1) pugixml 라이브러리를 사용하여 XML 파일을 구문 분석하고 생성하십시오. 2) 책 정보와 같은 복잡한 중첩 XML 요소를 처리합니다. 3) XML 처리 코드를 최적화하면 효율적인 라이브러리 및 스트리밍 구문 분석을 사용하는 것이 좋습니다. 이러한 단계를 통해 XML 데이터를 효율적으로 처리 할 수 있습니다.

See all articles