Rumah >pembangunan bahagian belakang >Golang >Bagaimanakah arahan SSE dan pengoptimuman pemasangan boleh meningkatkan prestasi algoritma kiraan populasi dengan gelung dua peringkat?
Dalam kod anda, anda mengendalikan kiraan populasi dalam gelung dua peringkat dan cuba mengoptimumkan gelung dalam dengan pemasangan. Gelung berulang melalui kepingan bait dan menggunakan fungsi __mm_add_epi32_inplace_purego untuk menambah kiraan pop kedudukan pada tatasusunan.
Untuk mengoptimumkan gelung dalam, anda boleh melaksanakan __mm_add_epi32_inplace_purego dalam assembly.purego Di bawah ialah versi optimum fungsi yang dicadangkan:
<code class="assembly">.text .globl __mm_add_epi32_inplace_purego __mm_add_epi32_inplace_purego: movq rdi, [rsi] movq rsi, [rdi+8] addq rsi, rdi movups (%rsi, %rax, 8), %xmm0 addq , %rsi movups (%rsi, %rax, 8), %xmm1 paddusbd %xmm0, %xmm0 paddusbd %xmm1, %xmm1 vextracti128 <pre class="brush:php;toolbar:false"><code class="assembly">.text .globl __optimized_population_count_loop __optimized_population_count_loop: movq rdi, [rsi] leaq (0, %rdi, 4), %rdx # multiple rdi by 4, rdx = counts movq rsp, r11 and rsp, -16 subq r15, r11 movq r15, r9 mov rdi, (%rsi) movq r15, rsi mov %rsi, rsi pxor %eax, %eax dec %rsi .loop: inc %rsi addq , rsi cmp rsi, rdi cmovge %rsi, rsi movsw (%rdi, %rax, 2), %ax movsw (%rsi, %rax, 2), %dx movw %ax, (%rdx) movw %dx, 2(%rdx) .end_loop:</code>, %xmm0, %eax vextracti128 , %xmm1, %edx addl %eax, (%rdi) addl %edx, 4(%rdi) addl %r8d, (%rdi) ret
Penjelasan:
Kod pemasangan ini mengoptimumkan fungsi menggunakan arahan SSE yang dibungkus. Ia:
Penjelasan:
Yang lengkap gelung kini dioptimumkan dalam pemasangan. Ia menggunakan:
Versi yang dioptimumkan ini seharusnya meningkatkan prestasi algoritma anda dengan ketara untuk mengira kiraan populasi kedudukan.
Atas ialah kandungan terperinci Bagaimanakah arahan SSE dan pengoptimuman pemasangan boleh meningkatkan prestasi algoritma kiraan populasi dengan gelung dua peringkat?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!