尽管将列表分割成由各个 goroutine 处理的更小的块，为什么'moving_avg_concurrent2”的性能没有随着并发性的增加而提高？-Golang-PHP中文网

首页

后端开发

Golang

尽管将列表分割成由各个 goroutine 处理的更小的块，为什么'moving_avg_concurrent2”的性能没有随着并发性的增加而提高？

Linda Hamilton

Dec 23, 2024 pm 04:38 PM

Why is the performance of `moving_avg_concurrent2` not improving with increased concurrency, despite splitting the list into smaller chunks processed by individual goroutines?

为什么 moving_avg_concurrent2 的性能无法随着并发执行的增加而提升？

moving_avg_concurrent2 将列表拆分为较小的片段，并使用单个 goroutine 处理每个片段。出于某种原因（目前尚不清楚原因），由于某些原因，使用一个 goroutine 的该函数比 moving_avg_serial4 更快，但使用多个 goroutine 的性能开始比 moving_avg_serial4 差。

为什么 moving_avg_concurrent3 比 moving_avg_serial4 慢得多？

使用一个 goroutine 时，moving_avg_concurrent3 的性能比 moving_avg_serial4 差。虽然增加 num_goroutines 可以提高性能，但仍然比 moving_avg_serial4 差。

即使 goroutine 是轻量级的，它们也并非完全免费，是否可能产生的开销如此之大，以至于速度甚至低于 moving_avg_serial4？

是的，虽然 goroutine 比较轻量级，但它们并不是免费的。当使用多个 goroutine 时，启动、管理和调度这些 goroutine 的开销可能会超过提升的并行度获得的好处。

代码

函数：

// 返回包含输入移动平均值的列表（已提供，即未优化）
func moving_avg_serial(input []float64, window_size int) []float64 {
    first_time := true
    var output = make([]float64, len(input))
    if len(input) > 0 {
        var buffer = make([]float64, window_size)
        // 初始化缓冲区为 NaN
        for i := range buffer {
            buffer[i] = math.NaN()
        }
        for i, val := range input {
            old_val := buffer[int((math.Mod(float64(i), float64(window_size))))]
            buffer[int((math.Mod(float64(i), float64(window_size))))] = val
            if !NaN_in_slice(buffer) && first_time {
                sum := 0.0
                for _, entry := range buffer {
                    sum += entry
                }
                output[i] = sum / float64(window_size)
                first_time = false
            } else if i > 0 && !math.IsNaN(output[i-1]) && !NaN_in_slice(buffer) {
                output[i] = output[i-1] + (val-old_val)/float64(window_size) // 无循环的解决方案
            } else {
                output[i] = math.NaN()
            }
        }
    } else { // 空输入
        fmt.Println("moving_avg is panicking!")
        panic(fmt.Sprintf("%v", input))
    }
    return output
}

// 返回包含输入移动平均值的列表
// 重新排列控制结构以利用短路求值
func moving_avg_serial4(input []float64, window_size int) []float64 {
    first_time := true
    var output = make([]float64, len(input))
    if len(input) > 0 {
        var buffer = make([]float64, window_size)
        // 初始化缓冲区为 NaN
        for i := range buffer {
            buffer[i] = math.NaN()
        }
        for i := range input {
            //            fmt.Printf("in mvg_avg4: i=%v\n", i)
            old_val := buffer[int((math.Mod(float64(i), float64(window_size))))]
            buffer[int((math.Mod(float64(i), float64(window_size))))] = input[i]
            if first_time && !NaN_in_slice(buffer) {
                sum := 0.0
                for j := range buffer {
                    sum += buffer[j]
                }
                output[i] = sum / float64(window_size)
                first_time = false
            } else if i > 0 && !math.IsNaN(output[i-1]) /* && !NaN_in_slice(buffer)*/ {
                output[i] = output[i-1] + (input[i]-old_val)/float64(window_size) // 无循环的解决方案
            } else {
                output[i] = math.NaN()
            }
        }
    } else { // 空输入
        fmt.Println("moving_avg is panicking!")
        panic(fmt.Sprintf("%v", input))
    }
    return output
}

// 返回包含输入移动平均值的列表
// 将列表拆分为较小的片段以使用 goroutine，但不使用串行版本，即我们仅在开头具有 NaN，因此希望减少一些开销
// 仍然不能扩展（随着大小和 num_goroutines 的增加，性能下降）
func moving_avg_concurrent2(input []float64, window_size, num_goroutines int) []float64 {
    var output = make([]float64, window_size-1, len(input))
    for i := 0; i  0 {
        num_items := len(input) - (window_size - 1)
        var barrier_wg sync.WaitGroup
        n := num_items / num_goroutines
        go_avg := make([][]float64, num_goroutines)
        for i := 0; i  0 {
        num_windows := len(input) - (window_size - 1)
        var output = make([]float64, len(input))
        for i := 0; i

以上是尽管将列表分割成由各个 goroutine 处理的更小的块，为什么'moving_avg_concurrent2”的性能没有随着并发性的增加而提高？的详细内容。更多信息请关注PHP中文网其他相关文章！

声明

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

了解Goroutines：深入研究GO的并发May 01, 2025 am 12:18 AM

goroutinesarefunctionsormethodsthatruncurranceingo，启用效率和灯威量。1）shememanagedbodo'sruntimemultimusingmultiplexing，允许千sstorunonfewerosthreads.2）goroutinessimproverentimensImproutinesImproutinesImproveranceThroutinesImproveranceThrountinesimproveranceThroundinesImproveranceThroughEasySytaskParallowalizationAndeff

了解GO中的初始功能：目的和用法May 01, 2025 am 12:16 AM

purposeoftheInitfunctionoIsistoInitializeVariables，setUpConfigurations，orperformneccesSetarySetupBeforEtheMainFunctionExeCutes.useInitby.UseInitby：1）placingitinyourcodetorunautoamenationally oneraty oneraty oneraty on inity in ofideShortAndAndAndAndForemain，2）keepitiTshortAntAndFocusedonSimImimpletasks，3）

了解GO界面：综合指南May 01, 2025 am 12:13 AM

Gointerfacesaremethodsignaturesetsthattypesmustimplement,enablingpolymorphismwithoutinheritanceforcleaner,modularcode.Theyareimplicitlysatisfied,usefulforflexibleAPIsanddecoupling,butrequirecarefulusetoavoidruntimeerrorsandmaintaintypesafety.