>백엔드 개발 >C++ >OpenMP 병렬 for 루프를 사용할 때, 특히 크기 조정이 필요할 때 `std::벡터`에 대한 효율적인 대안은 무엇입니까?

OpenMP 병렬 for 루프를 사용할 때, 특히 크기 조정이 필요할 때 `std::벡터`에 대한 효율적인 대안은 무엇입니까?

Susan Sarandon
Susan Sarandon원래의
2024-11-29 08:03:09491검색

What are the efficient alternatives to `std::vector` when using OpenMP parallel for loops, especially when resizing is needed?

OpenMP 병렬 For 루프의 std::벡터 대안

OpenMP에서 공유 std::벡터를 병렬로 사용하여 작업 루프는 성능 문제를 일으킬 수 있습니다. 이 문서에서는 특히 루프 실행 중에 크기 조정이 필요할 때 속도 이점을 제공하는 잠재적인 대안을 살펴봅니다.

후보 대안

  • std ::OpenMP 감소를 사용한 벡터:

    이 접근 방식 #pragma omp 선언 감소로 선언된 사용자 정의 감소를 사용하는 것이 포함됩니다. 아래 코드는 벡터를 병렬로 결합하는 데 적용할 수 있는 방법을 보여줍니다.

    #pragma omp declare reduction (merge : std::vector<int> : omp_out.insert(omp_out.end(), omp_in.begin(), omp_in.end()))
    
    std::vector<int> vec;
    #pragma omp parallel for reduction(merge: vec)
    for (int i = 0; i < 100; i++) vec.push_back(i);
  • 정적 스케줄링 및 순차적 삽입을 사용하는 std::Vector:

    요소의 순서를 유지하는 것이 중요한 경우 이 기술을 사용할 수 있습니다. 정적 일정과 정렬된 섹션을 활용하여 원하는 순서로 벡터를 삽입합니다.

    std::vector<int> vec;
    #pragma omp parallel
    {
        std::vector<int> vec_private;
        #pragma omp for nowait schedule(static)
        for (int i = 0; i < N; i++) vec_private.push_back(i);
        #pragma omp for schedule(static) ordered
        for (int i = 0; i < omp_get_num_threads(); i++)
        {
            #pragma omp ordered
            vec.insert(vec.end(), vec_private.begin(), vec_private.end());
        }
    }
  • 접두사 합계 방법:

    이 방법 각 스레드에 대한 벡터 저장을 피하고 병렬로 병합된 단일 벡터를 선택합니다. 접두사 합계 배열을 활용하여 삽입 지점을 추적합니다.

    std::vector<int> vec;
    size_t *prefix;
    #pragma omp parallel
    {
        int ithread = omp_get_thread_num();
        int nthreads = omp_get_num_threads();
        #pragma omp single
        {
            prefix = new size_t[nthreads + 1];
            prefix[0] = 0;
        }
        std::vector<int> vec_private;
        #pragma omp for schedule(static) nowait
        for (int i = 0; i < 100; i++) vec_private.push_back(i);
        prefix[ithread + 1] = vec_private.size();
        #pragma omp barrier
        #pragma omp single
        {
            for (int i = 1; i < (nthreads + 1); i++) prefix[i] += prefix[i - 1];
            vec.resize(vec.size() + prefix[nthreads]);
        }
        std::copy(vec_private.begin(), vec_private.end(), vec.begin() + prefix[ithread]);
    }
    delete[] prefix;

이러한 대안은 OpenMP 환경에서 병렬 for 루프 작업 및 벡터 크기 조정을 위한 효과적이고 효율적인 수단을 제공하여 한계를 뛰어넘습니다. std::벡터에 의해 제기되었습니다.

위 내용은 OpenMP 병렬 for 루프를 사용할 때, 특히 크기 조정이 필요할 때 `std::벡터`에 대한 효율적인 대안은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.