为什么在内存中下载比从 aws s3 在文件系统中下载慢？-Golang-PHP中文网

首页

后端开发

Golang

为什么在内存中下载比从 aws s3 在文件系统中下载慢？

王林

Feb 09, 2024 am 11:57 AM

overflow

为什么在内存中下载比从 aws s3 在文件系统中下载慢？

为什么在内存中下载比从AWS S3在文件系统中下载慢？在下载文件时，我们通常会选择从AWS S3存储桶中下载到本地文件系统。然而，有时候我们会发现，使用内存中的下载方式比直接从S3下载到文件系统要慢。这是因为在内存中下载涉及到一些额外的步骤和资源消耗。首先，内存中的下载需要将文件内容读取到内存中，然后再将其写入到文件系统中。这个过程中涉及到了额外的内存操作和IO操作，相比直接从S3下载到文件系统，会导致下载速度变慢。另外，内存中的下载还可能受到内存限制的影响，当下载的文件较大时，可能会导致内存不足的问题，进而影响下载速度。因此，在选择下载方式时，需要根据具体情况权衡利弊，选择最适合的方式来进行下载操作。

问题内容

我正在使用aws gosdk从某个存储桶下载。下面是下载的两种实现

下载到文件

func (a *awsclient) downloadtofile(ctx context.context, objectkey string) (string, error) {
    params := &awss3.getobjectinput{
        bucket: aws.string(a.bucket),
        key:    aws.string(objectkey),
    }

    downloadpath := "some/valid/path"
    f, err := os.create(downloadpath)
    defer f.close()
    _, err = a.downloader.download(ctx, f, params)
    return downloadpath, err
}

下载到内存

func (a *AwsClient) DownloadToMemory(ctx context.Context, objectKey string) (string, error) {
    params := &awsS3.GetObjectInput{
        Bucket: aws.String(a.bucket),
        Key:    aws.String(objectKey),
    }

    buffer := manager.NewWriteAtBuffer([]byte{})  
    _, err = a.downloader.Download(ctx, buffer, params)
    return buffer.Bytes(), err
}

对于 100 mb 的文件，下载到内存中需要 30 秒，下载到文件系统中只需要 8 秒。我的期望是内存下载应该快得多。我的系统（apple m1、ventura、8gb ram）有足够的可用 ram，所以这不是问题。有人可以帮助我理解这种行为吗？

解决方法

将大的 S3 对象下载到动态缓冲区中效率非常低。该缓冲区被重新分配多次以处理 100M 数据和多个下载线程。内存重新分配需要大量 CPU 时间。

尝试在开始时分配 100M，而不是使用空字节片。

如果对象大小未知，您可以使用 S3.HeadObject 实时获取对象长度。

以上是为什么在内存中下载比从 aws s3 在文件系统中下载慢？的详细内容。更多信息请关注PHP中文网其他相关文章！

声明

本文转载于：stackoverflow。如有侵权，请联系admin@php.cn删除

在Golang和Python之间进行选择：适合您的项目Apr 19, 2025 am 12:21 AM

golangisidealforperformance-Critical-clitageAppations and ConcurrentPrompromming，而毛皮刺激性，快速播种和可及性。1）forhigh-porformanceneeds，pelectgolangduetoitsefefsefefseffifeficefsefeflicefsiveficefsiveandconcurrencyfeatures.2）fordataa-fordataa-fordata-fordata-driventriventriventriventriventrivendissp pynonnononesp

Golang：并发和行动绩效Apr 19, 2025 am 12:20 AM

Golang通过goroutine和channel实现高效并发：1.goroutine是轻量级线程，使用go关键字启动；2.channel用于goroutine间安全通信，避免竞态条件；3.使用示例展示了基本和高级用法；4.常见错误包括死锁和数据竞争，可用gorun-race检测；5.性能优化建议减少channel使用，合理设置goroutine数量，使用sync.Pool管理内存。

Golang vs. Python：您应该学到哪种语言？Apr 19, 2025 am 12:20 AM

Golang更适合系统编程和高并发应用，Python更适合数据科学和快速开发。1)Golang由Google开发，静态类型，强调简洁性和高效性，适合高并发场景。2)Python由GuidovanRossum创造，动态类型，语法简洁，应用广泛，适合初学者和数据处理。

Golang vs. Python：性能和可伸缩性Apr 19, 2025 am 12:18 AM

Golang在性能和可扩展性方面优于Python。1)Golang的编译型特性和高效并发模型使其在高并发场景下表现出色。2)Python作为解释型语言，执行速度较慢，但通过工具如Cython可优化性能。

Golang vs.其他语言：比较Apr 19, 2025 am 12:11 AM

Go语言在并发编程、性能、学习曲线等方面有独特优势：1.并发编程通过goroutine和channel实现，轻量高效。2.编译速度快，运行性能接近C语言。3.语法简洁，学习曲线平缓，生态系统丰富。

Golang和Python：了解差异Apr 18, 2025 am 12:21 AM

Golang和Python的主要区别在于并发模型、类型系统、性能和执行速度。1.Golang使用CSP模型，适用于高并发任务；Python依赖多线程和GIL，适合I/O密集型任务。2.Golang是静态类型，Python是动态类型。3.Golang编译型语言执行速度快，Python解释型语言开发速度快。