Intel Sandybridge 제품군 CPU에서 실행 속도를 크게 낮추기 위해 몬테카를로 시뮬레이션을 추가로 최적화 해제하려면 어떻게 해야 합니까?
Intel Sandybridge 제품군 CPU의 파이프라인에 대한 프로그램 최적화 해제
목표: 다음 지식을 활용하여 프로그램이 더 느리게 실행되도록 비관하는 것입니다. 인텔 i7 파이프라인.
문제:
과제는 Whetstone 또는 Monte-Carlo 프로그램의 두 가지 옵션을 제공했습니다. 학생은 Monte-Carlo 시뮬레이션 프로그램을 선택했지만 비관적인 노력으로 인해 코드 실행 시간이 1초만 늘어났습니다.
질문:
학생이 어떻게 비관을 더 할 수 있습니까? 더 중요한 목표를 달성하기 위한 코드 속도가 느려지나요?
답변:
일반 전략:
- 예측할 수 없는 분기를 도입하여 잘못된 예측 페널티를 높입니다.
- 루프 전달 종속성 체인 연장 명령 수준 병렬 처리를 줄입니다.
- 느린 FP 작업과 div, 특히 exp와 log 기능을 사용하세요.
Uarch 관련 아이디어:
내장 함수 포함 (
- 캐시에서 데이터를 제거하려면 movnti를 사용하세요.
- FP 수학 연산 사이에 정수 셔플을 사용하면 우회 지연이 발생합니다.
- 사용하지 않고 SSE와 AVX 명령어를 혼합하지 마세요. vzeroupper.
(인라인) asm 사용:
- 정렬 문제를 강제로 실행하여 uop 캐시를 중단합니다.
- self- 사용 파이프라인을 트리거하도록 코드 수정
캐시 누락 및 메모리 속도 저하 유발:
- 좁은 매장을 수행하여 매장 전달 지연을 유발합니다.
- 교체 메모리를 제어하기 위한 큰 구조체의 멤버가 있는 로컬 변수 레이아웃.
- 캐시 누락과 페이지 분할 로드를 늘리려면 메모리 레이아웃을 배열하세요.
- 캐시 라인이나 페이지 경계를 확장하려면 잘못 정렬된 변수를 사용하세요.
- 비 배열에서 루프를 반복하세요. -연속적인 순서.
- 대신 연결 목록 사용을 고려하세요.
기타 기술:
- std::atomic
느린 원자 연산을 위한 루프 카운터. - -m32 또는 -march=i386으로 컴파일하여 코드 생성 속도를 늦춥니다.
- 속도를 더 높이기 위해 정밀도가 낮은 긴 이중 계산을 강제합니다.
- CPU 선호도를 다른 CPU로 자주 설정합니다.
- 컨텍스트 전환을 위해 과도한 시스템 호출을 구현합니다.
최종 참고 사항:
- 이러한 기술은 코드 속도를 효과적으로 저하시키지만 "악마 같은 무능력" 수준은 주어진 정당성에 따라 다릅니다. .
- 과제 강사는 학생들이 단순히 이러한 기술을 적용하는 것이 아니라 파이프라인 위험 및 종속성에 대해 배우도록 의도했을 수 있습니다. 맹목적으로.
위 내용은 Intel Sandybridge 제품군 CPU에서 실행 속도를 크게 낮추기 위해 몬테카를로 시뮬레이션을 추가로 최적화 해제하려면 어떻게 해야 합니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

C 학습자와 개발자는 StackoverFlow, Reddit의 R/CPP 커뮤니티, Coursera 및 EDX 코스, GitHub의 오픈 소스 프로젝트, 전문 컨설팅 서비스 및 CPPCon에서 리소스와 지원을받을 수 있습니다. 1. StackoverFlow는 기술적 인 질문에 대한 답변을 제공합니다. 2. Reddit의 R/CPP 커뮤니티는 최신 뉴스를 공유합니다. 3. Coursera와 Edx는 공식적인 C 과정을 제공합니다. 4. LLVM 및 부스트 기술 향상과 같은 GitHub의 오픈 소스 프로젝트; 5. JetBrains 및 Perforce와 같은 전문 컨설팅 서비스는 기술 지원을 제공합니다. 6. CPPCON 및 기타 회의는 경력을 돕습니다

C#은 높은 개발 효율성과 크로스 플랫폼 지원이 필요한 프로젝트에 적합한 반면 C#은 고성능 및 기본 제어가 필요한 응용 프로그램에 적합합니다. 1) C#은 개발을 단순화하고, 쓰레기 수집 및 리치 클래스 라이브러리를 제공하며, 엔터프라이즈 레벨 애플리케이션에 적합합니다. 2) C는 게임 개발 및 고성능 컴퓨팅에 적합한 직접 메모리 작동을 허용합니다.

C 지속적인 사용 이유에는 고성능, 광범위한 응용 및 진화 특성이 포함됩니다. 1) 고효율 성능 : C는 메모리 및 하드웨어를 직접 조작하여 시스템 프로그래밍 및 고성능 컴퓨팅에서 훌륭하게 수행합니다. 2) 널리 사용 : 게임 개발, 임베디드 시스템 등의 분야에서의 빛나기.

C 및 XML의 미래 개발 동향은 다음과 같습니다. 1) C는 프로그래밍 효율성 및 보안을 개선하기 위해 C 20 및 C 23 표준을 통해 모듈, 개념 및 코 루틴과 같은 새로운 기능을 소개합니다. 2) XML은 데이터 교환 및 구성 파일에서 중요한 위치를 계속 차지하지만 JSON 및 YAML의 문제에 직면하게 될 것이며 XMLSCHEMA1.1 및 XPATH 3.1의 개선과 같이보다 간결하고 쉽게 구문 분석하는 방향으로 발전 할 것입니다.

최신 C 설계 모델은 C 11 이상의 새로운 기능을 사용하여보다 유연하고 효율적인 소프트웨어를 구축 할 수 있습니다. 1) Lambda Expressions 및 STD :: 함수를 사용하여 관찰자 패턴을 단순화하십시오. 2) 모바일 의미와 완벽한 전달을 통해 성능을 최적화하십시오. 3) 지능형 포인터는 유형 안전 및 자원 관리를 보장합니다.

C 멀티 스레딩 및 동시 프로그래밍의 핵심 개념에는 스레드 생성 및 관리, 동기화 및 상호 제외, 조건부 변수, 스레드 풀링, 비동기 프로그래밍, 일반적인 오류 및 디버깅 기술, 성능 최적화 및 모범 사례가 포함됩니다. 1) std :: 스레드 클래스를 사용하여 스레드를 만듭니다. 예제는 스레드가 완성 될 때까지 생성하고 기다리는 방법을 보여줍니다. 2) std :: mutex 및 std :: lock_guard를 사용하여 공유 리소스를 보호하고 데이터 경쟁을 피하기 위해 동기화 및 상호 배제. 3) 조건 변수는 std :: 조건 _variable을 통한 스레드 간의 통신과 동기화를 실현합니다. 4) 스레드 풀 예제는 ThreadPool 클래스를 사용하여 효율성을 향상시키기 위해 작업을 병렬로 처리하는 방법을 보여줍니다. 5) 비동기 프로그래밍은 std :: as를 사용합니다

C의 메모리 관리, 포인터 및 템플릿은 핵심 기능입니다. 1. 메모리 관리는 새롭고 삭제를 통해 메모리를 수동으로 할당하고 릴리스하며 힙과 스택의 차이에주의를 기울입니다. 2. 포인터는 메모리 주소를 직접 작동시키고주의해서 사용할 수 있습니다. 스마트 포인터는 관리를 단순화 할 수 있습니다. 3. 템플릿은 일반적인 프로그래밍을 구현하고 코드 재사용 성과 유연성을 향상 시키며 유형 파생 및 전문화를 이해해야합니다.

C는 시스템 프로그래밍 및 하드웨어 상호 작용에 적합합니다. 하드웨어에 가까운 제어 기능 및 객체 지향 프로그래밍의 강력한 기능을 제공하기 때문입니다. 1) C는 포인터, 메모리 관리 및 비트 운영과 같은 저수준 기능을 통해 효율적인 시스템 수준 작동을 달성 할 수 있습니다. 2) 하드웨어 상호 작용은 장치 드라이버를 통해 구현되며 C는 이러한 드라이버를 작성하여 하드웨어 장치와의 통신을 처리 할 수 있습니다.


핫 AI 도구

Undresser.AI Undress
사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover
사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool
무료로 이미지를 벗다

Clothoff.io
AI 옷 제거제

AI Hentai Generator
AI Hentai를 무료로 생성하십시오.

인기 기사

뜨거운 도구

Dreamweaver Mac版
시각적 웹 개발 도구

SublimeText3 Mac 버전
신 수준의 코드 편집 소프트웨어(SublimeText3)

SublimeText3 Linux 새 버전
SublimeText3 Linux 최신 버전

WebStorm Mac 버전
유용한 JavaScript 개발 도구

SecList
SecLists는 최고의 보안 테스터의 동반자입니다. 보안 평가 시 자주 사용되는 다양한 유형의 목록을 한 곳에 모아 놓은 것입니다. SecLists는 보안 테스터에게 필요할 수 있는 모든 목록을 편리하게 제공하여 보안 테스트를 더욱 효율적이고 생산적으로 만드는 데 도움이 됩니다. 목록 유형에는 사용자 이름, 비밀번호, URL, 퍼징 페이로드, 민감한 데이터 패턴, 웹 셸 등이 포함됩니다. 테스터는 이 저장소를 새로운 테스트 시스템으로 간단히 가져올 수 있으며 필요한 모든 유형의 목록에 액세스할 수 있습니다.
