Rumah  >  Artikel  >  pembangunan bahagian belakang  >  Bagaimana untuk melaksanakan pengkomputeran selari kod C++?

Bagaimana untuk melaksanakan pengkomputeran selari kod C++?

WBOY
WBOYasal
2023-11-03 10:15:331121semak imbas

Bagaimana untuk melaksanakan pengkomputeran selari kod C++?

Dengan peningkatan berterusan prestasi perkakasan komputer, pengkomputeran selari untuk pemproses berbilang teras telah menjadi topik penting dalam bidang pengaturcaraan. Sebagai bahasa pengaturcaraan yang cekap, C++ secara semula jadi mempunyai pelbagai kaedah untuk melaksanakan pengkomputeran selari. Artikel ini akan memperkenalkan beberapa kaedah pengkomputeran selari C++ yang biasa digunakan dan masing-masing menunjukkan pelaksanaan kod dan senario penggunaannya.

  1. OpenMP

OpenMP ialah API pengkomputeran selari berasaskan memori dikongsi yang boleh menambah kod selari pada program C++ dengan mudah. Ia menggunakan arahan #pragma untuk mengenal pasti segmen kod yang perlu diselaraskan dan menyediakan satu siri fungsi perpustakaan untuk melaksanakan pengkomputeran selari. Berikut ialah contoh program OpenMP yang mudah:

#include <iostream>
#include <omp.h>

using namespace std;

int main() {
    int data[1000], i, sum = 0;
    for (i=0;i<1000;i++){
        data[i] = i+1;
    }

    #pragma omp parallel for reduction(+:sum)
    for (i=0;i<1000;i++){
        sum += data[i];
    }
    cout << "Sum: " << sum << endl;
    return 0;
}

Dalam contoh ini, arahan #pragma omp digunakan untuk menyelaraskan gelung for. Pada masa yang sama, gunakan arahan pengurangan(+:sum) untuk memberitahu OpenMP untuk menambah pembolehubah jumlah. Apabila program ini dijalankan pada komputer menggunakan 4 teras, anda dapat melihat bahawa masa berjalan adalah 3-4 kali lebih cepat daripada versi single-threaded.

  1. MPI

MPI ialah antara muka penghantaran mesej yang membolehkan pengkomputeran selari teragih antara berbilang komputer. Unit asas program MPI ialah proses, dan setiap proses dilaksanakan dalam ruang memori bebas. Program MPI boleh dijalankan pada satu komputer atau pada berbilang komputer. Berikut ialah program sampel asas MPI:

#include <iostream>
#include <mpi.h>

using namespace std;

int main(int argc, char** argv) {
    int rank, size;
    MPI_Init(&argc, &argv);
    MPI_Comm_rank(MPI_COMM_WORLD, &rank);
    MPI_Comm_size(MPI_COMM_WORLD, &size);

    cout << "Hello world from rank " << rank << " of " << size << endl;

    MPI_Finalize();
    return 0;
}

Dalam contoh ini, persekitaran MPI dimulakan melalui fungsi MPI_Init() dan fungsi MPI_Comm_rank() dan MPI_Comm_size() digunakan untuk mendapatkan nombor proses bagi satu proses dan jumlah keseluruhan proses. Di sini saya hanya mengeluarkan ayat Dengan melaksanakan arahan mpirun -np 4, program ini boleh dijalankan pada 4 proses.

  1. TBB

Intel Threading Building Blocks (TBB) ialah perpustakaan C++ yang menyediakan alatan untuk memudahkan pengkomputeran selari. Konsep utama TBB ialah tugasan, yang menyelaraskan beberapa kerja melalui kerjasama antara nod dan tugasan. Berikut ialah program contoh TBB:

#include <iostream>
#include <tbb/tbb.h>

using namespace std;

class Sum {
public:
    Sum() : sum(0) {}
    Sum(Sum& s, tbb::split) : sum(0) {}
    void operator()(const tbb::blocked_range<int>& r) {
        for (int i=r.begin();i!=r.end();i++){
            sum += i;
        }
    }
    void join(Sum&s) {
        sum += s.sum;
    }
    int getSum() const {
        return sum;
    }

private:
    int sum;
};

int main() {
    Sum s;
    tbb::parallel_reduce(tbb::blocked_range<int>(0, 1000), s);
    cout << "Sum: " << s.getSum() << endl;
    return 0;
}

Dalam contoh ini, kelas Sum ditakrifkan untuk melaksanakan pengkomputeran selari, tbb::blocked_range digunakan untuk membahagikan tugasan dan keselarian diselesaikan melalui tbb::parallel_reduce() perubahan fungsi. Apabila program ini dijalankan pada komputer menggunakan 4 teras, anda dapat melihat bahawa masa berjalan adalah 3-4 kali lebih cepat daripada versi single-threaded.

Ketiga-tiga kaedah ini masing-masing mempunyai kelebihan dan keburukan masing-masing kaedah yang mana untuk dipilih terutamanya bergantung pada senario aplikasi tertentu. OpenMP sesuai untuk digunakan pada mesin tunggal dengan memori yang dikongsi, dan boleh menambah kod selari dengan mudah pada program C++ sedia ada untuk menjadikan program berjalan lebih pantas. MPI sesuai untuk digunakan pada kelompok pengkomputeran teragih dan boleh mencapai kesejajaran dengan menghantar mesej antara berbilang komputer. TBB ialah perpustakaan C++ merentas platform yang menyediakan beberapa alatan yang cekap untuk memudahkan pengkomputeran selari.

Ringkasnya, untuk aplikasi yang memerlukan pengkomputeran selari, C++ menyediakan pelbagai pilihan untuk mencapai kesejajaran yang cekap. Pembangun boleh memilih satu atau lebih kaedah untuk mencapai tugas mereka berdasarkan keperluan dan senario aplikasi mereka sendiri, dan meningkatkan prestasi program ke tahap yang baharu.

Atas ialah kandungan terperinci Bagaimana untuk melaksanakan pengkomputeran selari kod C++?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn