OpenMP 병렬 For 루프의 std::벡터 대안
OpenMP에서 공유 std::벡터를 병렬로 사용하여 작업 루프는 성능 문제를 일으킬 수 있습니다. 이 문서에서는 특히 루프 실행 중에 크기 조정이 필요할 때 속도 이점을 제공하는 잠재적인 대안을 살펴봅니다.
후보 대안
std ::OpenMP 감소를 사용한 벡터:
이 접근 방식 #pragma omp 선언 감소로 선언된 사용자 정의 감소를 사용하는 것이 포함됩니다. 아래 코드는 벡터를 병렬로 결합하는 데 적용할 수 있는 방법을 보여줍니다.
#pragma omp declare reduction (merge : std::vector<int> : omp_out.insert(omp_out.end(), omp_in.begin(), omp_in.end())) std::vector<int> vec; #pragma omp parallel for reduction(merge: vec) for (int i = 0; i < 100; i++) vec.push_back(i);
정적 스케줄링 및 순차적 삽입을 사용하는 std::Vector:
요소의 순서를 유지하는 것이 중요한 경우 이 기술을 사용할 수 있습니다. 정적 일정과 정렬된 섹션을 활용하여 원하는 순서로 벡터를 삽입합니다.
std::vector<int> vec; #pragma omp parallel { std::vector<int> vec_private; #pragma omp for nowait schedule(static) for (int i = 0; i < N; i++) vec_private.push_back(i); #pragma omp for schedule(static) ordered for (int i = 0; i < omp_get_num_threads(); i++) { #pragma omp ordered vec.insert(vec.end(), vec_private.begin(), vec_private.end()); } }
접두사 합계 방법:
이 방법 각 스레드에 대한 벡터 저장을 피하고 병렬로 병합된 단일 벡터를 선택합니다. 접두사 합계 배열을 활용하여 삽입 지점을 추적합니다.
std::vector<int> vec; size_t *prefix; #pragma omp parallel { int ithread = omp_get_thread_num(); int nthreads = omp_get_num_threads(); #pragma omp single { prefix = new size_t[nthreads + 1]; prefix[0] = 0; } std::vector<int> vec_private; #pragma omp for schedule(static) nowait for (int i = 0; i < 100; i++) vec_private.push_back(i); prefix[ithread + 1] = vec_private.size(); #pragma omp barrier #pragma omp single { for (int i = 1; i < (nthreads + 1); i++) prefix[i] += prefix[i - 1]; vec.resize(vec.size() + prefix[nthreads]); } std::copy(vec_private.begin(), vec_private.end(), vec.begin() + prefix[ithread]); } delete[] prefix;
이러한 대안은 OpenMP 환경에서 병렬 for 루프 작업 및 벡터 크기 조정을 위한 효과적이고 효율적인 수단을 제공하여 한계를 뛰어넘습니다. std::벡터에 의해 제기되었습니다.
위 내용은 OpenMP 병렬 for 루프를 사용할 때, 특히 크기 조정이 필요할 때 `std::벡터`에 대한 효율적인 대안은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!