cari
Rumahpembangunan bahagian belakangC++Mengapa Memindahkan Matriks 512x512 Secara Ketara Lebih Lambat Daripada Memindahkan Matriks 513x513?

Why is Transposing a 512x512 Matrix Significantly Slower Than Transposing a 513x513 Matrix?

Mengapa Transposing 512x512 Matriks Lebih Lambat Daripada Transposing 513x513

Satu pemerhatian yang pelik dalam transposing matriks timbul selepas menjalankan eksperimen pada matriks yang berbeza-beza saiz^ dengan transposing saiz: n secara pengiraan lebih mahal daripada transposing satu dengan dimensi 2^n 1. Percanggahan menjadi ketara apabila n sama dengan 512.

Kod yang disediakan untuk operasi transposisi adalah seperti berikut:

#define SAMPLES 1000
#define MATSIZE 512

#include <time.h>
#include <iostream>
int mat[MATSIZE][MATSIZE];

void transpose()
{
   for ( int i = 0 ; i <p>Dengan mengubah makro MATSIZE, saiz matriks boleh diubah suai. Penanda aras berikut menggambarkan perbezaan yang ketara:</p>
<ul>
<li>Saiz 512: Purata 2.46 ms</li>
<li>Saiz 513: Purata 0.75 ms</li>
</ul>
<h2 id="Cache-Contention-dan-Critical-Stride">Cache Contention dan Critical Stride</h2>Sebab di sebalik anomali ini terletak pada tingkah laku cache dan konsep perbalahan cache. Berikut ialah pecahan:<p></p>
<ul>Cache distrukturkan ke dalam set dan baris. Pada bila-bila masa, hanya satu set diakses, dan mana-mana baris dalam set itu boleh digunakan. Jumlah saiz cache ditentukan oleh bilangan baris yang didarab dengan saiz setiap baris.<li>Untuk mengira set yang mempunyai alamat memori tertentu, formula berikut digunakan: set = ( address / lineSize ) % numberOfsets.<li>Apabila berbilang alamat memori mengakses set yang sama, konflik cache timbul. Dalam senario sedemikian, baris yang paling kurang digunakan baru-baru ini dalam set ditimpa dengan data yang baru diambil.<li>Langkah kritikal, yang mewakili bilangan akses memori yang mengakibatkan konflik cache, dikira sebagai criticalStride = numberOfSets * lineSize.<li>Dalam kes matriks 64x64 dengan cache 8kb, kritikal langkah akan diselaraskan dengan sempurna dengan baris matriks, membawa kepada pemuatan semula cache yang berlebihan semasa transposisi.<li>Walau bagaimanapun, apabila saiz matriks ditingkatkan kepada 65x65, langkah kritikal tidak lagi sejajar dengan sempurna, mengurangkan kekerapan cache konflik dan meningkatkan prestasi.<li>
</ul>Oleh itu, operasi pemindahan menjadi jauh lebih perlahan untuk matriks dengan dimensi gandaan 2^n disebabkan perbalahan cache.<p></p></iostream></time.h>

Atas ialah kandungan terperinci Mengapa Memindahkan Matriks 512x512 Secara Ketara Lebih Lambat Daripada Memindahkan Matriks 513x513?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn
C Di Dunia Moden: Aplikasi dan IndustriC Di Dunia Moden: Aplikasi dan IndustriApr 23, 2025 am 12:10 AM

C digunakan secara meluas dan penting di dunia moden. 1) Dalam pembangunan permainan, C digunakan secara meluas untuk prestasi tinggi dan polimorfisme, seperti Unrealengine dan Perpaduan. 2) Dalam sistem perdagangan kewangan, latensi rendah C dan throughput yang tinggi menjadikannya pilihan pertama, sesuai untuk perdagangan frekuensi tinggi dan analisis data masa nyata.

C XML Perpustakaan: Membandingkan dan Berbeza PilihanC XML Perpustakaan: Membandingkan dan Berbeza PilihanApr 22, 2025 am 12:05 AM

Terdapat empat perpustakaan XML yang biasa digunakan di C: TinyXML-2, PugixML, Xerces-C, dan RapidXML. 1.TinyXML-2 sesuai untuk persekitaran dengan sumber terhad, fungsi ringan tetapi terhad. 2. PugixML cepat dan menyokong pertanyaan XPath, sesuai untuk struktur XML yang kompleks. 3.xerces-C berkuasa, menyokong resolusi DOM dan SAX, dan sesuai untuk pemprosesan kompleks. 4. RapidXML memberi tumpuan kepada prestasi dan parses sangat cepat, tetapi tidak menyokong pertanyaan XPath.

C dan XML: Meneroka hubungan dan sokonganC dan XML: Meneroka hubungan dan sokonganApr 21, 2025 am 12:02 AM

C Berinteraksi dengan XML melalui perpustakaan pihak ketiga (seperti TinyXML, PugixML, Xerces-C). 1) Gunakan perpustakaan untuk menghuraikan fail XML dan menukarnya ke dalam struktur data C-diproses. 2) Apabila menjana XML, tukar struktur data C ke format XML. 3) Dalam aplikasi praktikal, XML sering digunakan untuk fail konfigurasi dan pertukaran data untuk meningkatkan kecekapan pembangunan.

C# vs C: Memahami perbezaan dan persamaan utamaC# vs C: Memahami perbezaan dan persamaan utamaApr 20, 2025 am 12:03 AM

Perbezaan utama antara C# dan C ialah sintaks, prestasi dan senario aplikasi. 1) Sintaks C# lebih ringkas, menyokong pengumpulan sampah, dan sesuai untuk pembangunan rangka kerja .NET. 2) C mempunyai prestasi yang lebih tinggi dan memerlukan pengurusan memori manual, yang sering digunakan dalam pengaturcaraan sistem dan pembangunan permainan.

C# vs C: Sejarah, evolusi, dan prospek masa depanC# vs C: Sejarah, evolusi, dan prospek masa depanApr 19, 2025 am 12:07 AM

Sejarah dan evolusi C# dan C adalah unik, dan prospek masa depan juga berbeza. 1.C dicipta oleh BjarnestroustRup pada tahun 1983 untuk memperkenalkan pengaturcaraan berorientasikan objek ke dalam bahasa C. Proses evolusinya termasuk pelbagai standardisasi, seperti C 11 memperkenalkan kata kunci auto dan ekspresi Lambda, C 20 memperkenalkan konsep dan coroutin, dan akan memberi tumpuan kepada pengaturcaraan prestasi dan sistem pada masa akan datang. 2.C# telah dikeluarkan oleh Microsoft pada tahun 2000. Menggabungkan kelebihan C dan Java, evolusinya memberi tumpuan kepada kesederhanaan dan produktiviti. Sebagai contoh, C#2.0 memperkenalkan generik dan C#5.0 memperkenalkan pengaturcaraan tak segerak, yang akan memberi tumpuan kepada produktiviti pemaju dan pengkomputeran awan pada masa akan datang.

C# vs C: Lembaran Lelajaran dan Pengalaman PemajuC# vs C: Lembaran Lelajaran dan Pengalaman PemajuApr 18, 2025 am 12:13 AM

Terdapat perbezaan yang signifikan dalam lengkung pembelajaran C# dan C dan pengalaman pemaju. 1) Keluk pembelajaran C# agak rata dan sesuai untuk pembangunan pesat dan aplikasi peringkat perusahaan. 2) Keluk pembelajaran C adalah curam dan sesuai untuk senario kawalan berprestasi tinggi dan rendah.

C# vs C: Pengaturcaraan dan ciri berorientasikan objekC# vs C: Pengaturcaraan dan ciri berorientasikan objekApr 17, 2025 am 12:02 AM

Terdapat perbezaan yang signifikan dalam bagaimana C# dan C melaksanakan dan ciri-ciri dalam pengaturcaraan berorientasikan objek (OOP). 1) Definisi kelas dan sintaks C# lebih ringkas dan menyokong ciri -ciri canggih seperti LINQ. 2) C menyediakan kawalan berbutir yang lebih baik, sesuai untuk pengaturcaraan sistem dan keperluan prestasi tinggi. Kedua -duanya mempunyai kelebihan mereka sendiri, dan pilihannya harus berdasarkan senario aplikasi tertentu.

Dari XML ke C: Transformasi dan Manipulasi DataDari XML ke C: Transformasi dan Manipulasi DataApr 16, 2025 am 12:08 AM

Menukar dari XML ke C dan melakukan operasi data boleh dicapai melalui langkah -langkah berikut: 1) Parsing Fail XML menggunakan perpustakaan TinyXML2, 2) Pemetaan data ke dalam struktur data C, 3) Menggunakan perpustakaan standard C seperti STD :: Vektor untuk operasi data. Melalui langkah -langkah ini, data yang ditukar dari XML boleh diproses dan dimanipulasi dengan cekap.

See all articles

Alat AI Hot

Undresser.AI Undress

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Clothoff.io

Penyingkiran pakaian AI

Video Face Swap

Video Face Swap

Tukar muka dalam mana-mana video dengan mudah menggunakan alat tukar muka AI percuma kami!

Alat panas

MantisBT

MantisBT

Mantis ialah alat pengesan kecacatan berasaskan web yang mudah digunakan yang direka untuk membantu dalam pengesanan kecacatan produk. Ia memerlukan PHP, MySQL dan pelayan web. Lihat perkhidmatan demo dan pengehosan kami.

Penyesuai Pelayan SAP NetWeaver untuk Eclipse

Penyesuai Pelayan SAP NetWeaver untuk Eclipse

Integrasikan Eclipse dengan pelayan aplikasi SAP NetWeaver.

ZendStudio 13.5.1 Mac

ZendStudio 13.5.1 Mac

Persekitaran pembangunan bersepadu PHP yang berkuasa

VSCode Windows 64-bit Muat Turun

VSCode Windows 64-bit Muat Turun

Editor IDE percuma dan berkuasa yang dilancarkan oleh Microsoft

SublimeText3 Linux versi baharu

SublimeText3 Linux versi baharu

SublimeText3 Linux versi terkini