首頁 >後端開發 >C++ >如何在 OpenMP 中並行化數組縮減?

如何在 OpenMP 中並行化數組縮減?

Susan Sarandon
Susan Sarandon原創
2024-12-07 03:13:10920瀏覽

How Can Array Reduction be Parallelized in OpenMP?

在 OpenMP 中對陣列進行歸約

無法在 OpenMP 中直接對陣列執行歸約。但是,還有其他方法可以實現數組縮減並行性。

第一種方法:私有陣列和關鍵部分

此方法為每個執行緒建立陣列的私有副本。每個執行緒填入其私有數組,並使用臨界區將結果合併到最終數組中。

int A[] = {84, 30, 95, 94, 36, 73, 52, 23, 2, 13};
int S[10] = {0};

#pragma omp parallel
{
    int S_private[10] = {0};
    
    #pragma omp for
    for (int n = 0; n < 10; ++n) {
        for (int m = 0; m <= n; ++m) {
            S_private[n] += A[m];
        }
    }
    
    #pragma omp critical
    {
        for(int n = 0; n < 10; ++n) {
            S[n] += S_private[n];
        }
    }
}

第二種方法:數組擴充和執行緒無關累加

此方法建立一個跨越所有執行緒的擴充數組。每個執行緒填入數組的其部分,然後在不使用臨界區的情況下合併結果。如果在多插槽系統上不小心使用,此方法可能會出現快取問題。

int A[] = {84, 30, 95, 94, 36, 73, 52, 23, 2, 13};
int S[10] = {0};
int *S_private;

#pragma omp parallel
{
    const int nthreads = omp_get_num_threads();
    const int ithread = omp_get_thread_num();

    #pragma omp single 
    {
        S_private = new int[10 * nthreads];
        for(int i = 0; i < (10 * nthreads); i++) S_private[i] = 0;
    }
    #pragma omp for
    for (int n = 0; n < 10; ++n)
    {
        for (int m = 0; m <= n; ++m){
            S_private[ithread * 10 + n] += A[m];
        }
    }
    #pragma omp for
    for(int i = 0; i < 10; i++) {
        for(int t = 0; t < nthreads; t++) {
            S[i] += S_private[10 * t + i];
        }
    }
}
delete[] S_private;

以上是如何在 OpenMP 中並行化數組縮減?的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn