在 OpenMP 中求解數組歸約
在 OpenMP 中,不支援直接對陣列進行歸約。但是,存在替代方法可以實現類似的結果。
第一種方法:
一種方法涉及為每個執行緒建立陣列的私人副本並在本地減少它們。在並行部分之後,使用關鍵部分將私有數組合併到原始數組中,以防止資料競爭。
int S[10] = {0}; #pragma omp parallel { int S_private[10] = {0}; #pragma omp for for (int n = 0; n < 10; ++n) { for (int m = 0; m <= n; ++m) { S_private[n] += A[m]; } } #pragma omp critical { for (int n = 0; n < 10; ++n) { S[n] += S_private[n]; } } }
第二種方法:
另一種方法是分配一個較大的數組,其維度等於陣列大小乘以執行緒數。然後每個線程填充數組的其部分。並行部分之後,將值合併到原始數組中,而不使用臨界區。
int S[10] = {0}; int *S_private; #pragma omp parallel { const int nthreads = omp_get_num_threads(); const int ithread = omp_get_thread_num(); #pragma omp single { S_private = new int[10 * nthreads]; for (int i = 0; i < (10 * nthreads); i++) { S_private[i] = 0; } } #pragma omp for for (int n = 0; n < 10; ++n) { for (int m = 0; m <= n; ++m) { S_private[ithread * 10 + n] += A[m]; } } #pragma omp for for (int i = 0; i < 10; i++) { for (int t = 0; t < nthreads; t++) { S[i] += S_private[10 * t + i]; } } }
第二種方法更有效率,特別是在涉及多個套接字的場景中,但它也需要仔細的記憶體處理以避免快取問題。
以上是如何在 OpenMP 中高效率地執行數組縮減?的詳細內容。更多資訊請關注PHP中文網其他相關文章!