首頁 >後端開發 >C++ >如何在 OpenMP 中高效率地執行數組縮減？

如何在 OpenMP 中高效率地執行數組縮減？

Susan Sarandon原創: 2024-12-03 09:07:121151瀏覽

How to Efficiently Perform Array Reductions in OpenMP?

在 OpenMP 中求解數組歸約

在 OpenMP 中，不支援直接對陣列進行歸約。但是，存在替代方法可以實現類似的結果。

第一種方法：

一種方法涉及為每個執行緒建立陣列的私人副本並在本地減少它們。在並行部分之後，使用關鍵部分將私有數組合併到原始數組中，以防止資料競爭。

int S[10] = {0};

#pragma omp parallel
{
    int S_private[10] = {0};

    #pragma omp for
    for (int n = 0; n < 10; ++n)
    {
        for (int m = 0; m <= n; ++m)
        {
            S_private[n] += A[m];
        }
    }

    #pragma omp critical
    {
        for (int n = 0; n < 10; ++n)
        {
            S[n] += S_private[n];
        }
    }
}

第二種方法：

另一種方法是分配一個較大的數組，其維度等於陣列大小乘以執行緒數。然後每個線程填充數組的其部分。並行部分之後，將值合併到原始數組中，而不使用臨界區。

int S[10] = {0};
int *S_private;

#pragma omp parallel
{
    const int nthreads = omp_get_num_threads();
    const int ithread = omp_get_thread_num();

    #pragma omp single
    {
        S_private = new int[10 * nthreads];
        for (int i = 0; i < (10 * nthreads); i++)
        {
            S_private[i] = 0;
        }
    }

    #pragma omp for
    for (int n = 0; n < 10; ++n)
    {
        for (int m = 0; m <= n; ++m)
        {
            S_private[ithread * 10 + n] += A[m];
        }
    }

    #pragma omp for
    for (int i = 0; i < 10; i++)
    {
        for (int t = 0; t < nthreads; t++)
        {
            S[i] += S_private[10 * t + i];
        }
    }
}

第二種方法更有效率，特別是在涉及多個套接字的場景中，但它也需要仔細的記憶體處理以避免快取問題。

以上是如何在 OpenMP 中高效率地執行數組縮減？的詳細內容。更多資訊請關注PHP中文網其他相關文章！

Array for using private Thread number

陳述：

本文內容由網友自願投稿，版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容，請聯絡admin@php.cn

上一篇：C 11 的「auto」關鍵字：類型推論何時變成太多？下一篇：C 11 的「auto」關鍵字：類型推論何時變成太多？

看更多