Ampere云原生平台:性能、可持续性和成本效益的完美结合
本文是Ampere Computing“加速云计算”系列文章的第四部分,探讨了向云原生平台迁移的诸多益处。前文已阐述了x86架构与云原生平台的差异以及云原生迁移所需的投资。本篇将重点介绍云原生平台带来的优势。
云原生处理器在云计算中的优势:
云原生处理器实现峰值性能
与承载大量遗留功能的x86架构不同,Ampere云原生处理器专为高效执行常见云应用程序任务而设计。这显着提升了企业最依赖的关键云工作负载的性能。
图1:Ampere云原生平台在关键云工作负载方面的性能显着高于x86平台。图片来自《云原生处理器的核心可持续性》。
云原生带来更高的响应速度、一致性和可预测性
对于提供网络服务的应用程序而言,用户请求的响应时间是关键性能指标。响应速度取决于负载和扩展性;随着请求速率的上升,保持可接受的最终用户响应时间至关重要。
虽然峰值性能很重要,但许多应用程序必须满足特定的服务等级协议(SLA),例如在两秒内响应。因此,云运营团队通常使用P99延迟(即99%的请求在该时间内得到满足的响应时间)来衡量响应速度。
为了衡量P99延迟,我们增加对服务的请求数量,以确定99%的事务仍在所需SLA内完成的点。这使我们能够评估在保持SLA的同时可能达到的最大吞吐量,并评估用户数量增加时对性能的影响。
一致性和可预测性是影响整体延迟和响应速度的两个主要因素。当任务性能更一致时,响应速度更可预测。换句话说,延迟和性能的差异越小,任务的响应速度就越可预测。可预测性还有助于简化工作负载均衡。
如本系列第一部分所述,x86核心采用超线程技术来提高核心利用率。由于两个线程共享一个核心,因此很难保证SLA。超线程开销以及其他x86架构问题固有的不一致性导致与Ampere云原生处理器相比,任务之间的延迟差异更大(见图2)。因此,基于x86的平台可以保持较高的峰值性能,但由于高延迟差异,很快就会超过SLA。此外,SLA越严格(即秒与毫秒),这种差异对P99延迟和响应速度的影响就越大。
图2:超线程和其他x86架构问题导致延迟差异增大,从而对吞吐量和SLA产生负面影响。图片来自《云原生处理器的核心可持续性》。
在这种情况下,降低延迟的唯一方法是降低请求速率。换句话说,为了保证SLA,必须分配更多x86资源,以确保每个核心在较低的负载下运行,从而解决高负载下线程之间响应速度差异较大的问题。因此,基于x86的应用程序在能够管理的请求数量方面受到更多限制,同时仍能保持其SLA。
NGINX、Redis、h.264媒体编码和Memcached性能及能效对比图
云原生带来更高的性价比
云原生方法能够以可重复的方式为SLA提供一致的响应速度和更高的性能,这也意味着更高的性价比。这直接降低了运营成本,因为可以用更少的核心来管理更多的请求。简而言之,云原生平台使应用程序能够用更少的核心做更多的事情,而不会影响SLA。更高的利用率直接转化为更低的运营成本——因为与基于x86的平台相比,你需要更少的云原生核心来管理同等负载。
那么,你能节省多少呢?云计算的基本计算单元是vCPU。但是,对于基于x86的平台,每个x86核心运行两个线程,因此,如果要禁用超线程,则必须成对租用x86 vCPU。否则,应用程序将与另一个应用程序共享x86核心。
在云原生平台上,租用vCPU时,会分配整个核心。考虑到1)云服务提供商(CSP)上的单个基于Ampere的vCPU提供完整的Ampere核心,2)Ampere每个插槽提供更多核心,相应的每瓦性能更高,以及3)Ampere vCPU的每小时成本通常更低,因为核心密度更高,运营成本更低,这导致某些云原生工作负载的Ampere云原生平台的成本/性能优势达到4.28倍。
更高的能效、更好的可持续性和更低的运营成本
功耗是一个全球性问题,功耗管理正迅速成为云服务提供商面临的主要挑战之一。目前,数据中心消耗全球1%到3%的电力,预计到2032年这一比例将翻一番。2022年,云数据中心预计占此能源需求的80%。
由于其架构在40多年来为不同的用例而发展,英特尔x86核心的功耗高于大多数基于云微服务的应用程序所需。此外,机架的功耗预算以及这些核心的散热量使得CSP无法用x86服务器填满机架。鉴于x86处理器的功耗和散热限制,CSP可能需要在机架中留出空位,从而浪费宝贵的空间。事实上,到2025年,传统的(x86)云计算方法预计会使数据中心电力需求翻一番,并将房地产需求增加1.6倍。
图7:继续预期的数据中心增长所需的电力和空间。图片来自《云原生处理器的核心可持续性》。
考虑到成本和性能,云计算需要从通用x86计算转向更高能效和更高性能的云原生平台。具体来说,我们需要在数据中心拥有更高的核心密度,以及更高效、更节能、更低运营成本的高性能核心。
由于Ampere云原生平台专为能效而设计,因此应用程序在不影响性能或响应速度的情况下功耗更低。下面的图8显示了在基于x86的平台和Ampere云原生平台上运行的大规模工作负载的功耗。根据应用程序的不同,Ampere的每瓦性能(以每瓦性能衡量)显著高于x86平台。
图8:Ampere云原生平台在关键云工作负载方面的能效显著高于x86平台。图片来自《云原生处理器的核心可持续性》。
云原生平台的低功耗架构能够实现更高的每机架核心密度。例如,Ampere® Altra®(80个核心)和Altra Max(128个核心)的高核心数量使CSP能够实现令人难以置信的核心密度。使用Altra Max,一个带有两个插槽的1U机箱可以在单个机架中拥有256个核心(见图8)。
使用云原生处理器,开发人员和架构师无需再在低功耗和高性能之间做出选择。Altra系列处理器的架构提供了更高的计算能力——每机架性能提升高达2.5倍——以及为获得与传统x86处理器相同的计算性能所需机架数量减少三倍。云原生处理器的效率架构还提供了业界最佳的每瓦成本。
图9:x86平台的低效能导致机架容量闲置,而Ampere Altra Max的高能效则充分利用了所有可用空间。
优势令人印象深刻。到2025年,在基于Ampere的云数据中心中运行的云原生应用程序可以将电力需求降低到当前用量的估计80%。与此同时,房地产需求预计将下降70%(见上图7)。Ampere云原生平台提供了3倍的每瓦性能优势,有效地将数据中心的容量提高了三倍,而功耗却保持不变。
请注意,这种云原生方法不需要先进的液冷技术。虽然液冷确实可以增加机架中x86核心的密度,但它会带来更高的成本,而不会带来新的价值。云原生平台通过使CSP能够利用其现有的房地产和电力容量做更多的事情,将对这种先进冷却的需求推迟到更远的未来。
云原生平台的能效意味着更可持续的云部署(见下面的图10)。它还允许公司减少碳足迹,这是一个日益受到投资者和消费者等利益相关者重视的因素。与此同时,CSP将能够支持更多的计算能力,以满足其现有房地产容量和电力限制内的不断增长的需求。为了提供额外的竞争优势,寻求扩大其云原生市场的CSP将把电力支出纳入计算资源定价——这将为云原生平台带来竞争优势。
图10:为什么云原生计算对可持续性至关重要。图片来自《云原生处理器的核心可持续性》。
云原生实现更高的响应速度和可扩展性性能
云计算使公司能够摆脱大型单体应用程序,转向可以按需创建更多组件副本进行扩展的应用程序组件(或微服务)。由于这些云原生应用程序本质上是分布式的,并且专为云部署而设计,因此它们可以在云原生平台上无缝地扩展到10万用户。
例如,如果部署多个MYSQL容器,则需要确保每个容器都具有稳定的性能。使用Ampere,每个应用程序都拥有自己的核心。无需验证与另一个线程的隔离,也无需管理超线程的开销。相反,每个应用程序都提供一致、可预测和可重复的性能,并具有无缝的可扩展性。
转向云原生的另一个优势是线性可扩展性。简而言之,与x86性能相比,每个云原生核心都以线性方式提高性能——随着利用率的提高,x86性能会下降。下面的图11说明了H.264编码的情况。
图11:Ampere云原生计算线性扩展,不会造成容量闲置,这与x86计算不同。图片来自《云原生处理器的核心可持续性》。
云原生优势总结
很明显,目前的x86技术将无法满足日益严格的电力限制和法规。由于其高效的架构,Ampere云原生平台提供的每个核心的性能比x86架构高出2倍。此外,较低的延迟差异导致更高的一致性、更高的可预测性和更好的响应速度——使您能够满足SLA,而无需大幅度地过度配置计算资源。云原生平台的简化架构还带来了更高的能效,从而实现了更可持续的运营和更低的运营成本。
云原生效率和可扩展性的证明最好体现在高负载期间,例如服务10万用户。这就是Ampere云原生平台的一致性带来巨大优势的地方,在规模化云原生应用程序中,其价格/性能比x86高出4.28倍,同时仍能保持客户SLA。
在本系列的第五部分中,我们将介绍如何与合作伙伴合作,立即开始利用云原生平台,同时最大限度地减少投资或风险。
请访问Ampere Computing开发者中心,了解更多相关内容和最新新闻。您还可以注册Ampere Computing开发者通讯,或加入Ampere Computing开发者社区。
我们与Ampere Computing合作撰写了这篇文章。感谢您支持使SitePoint成为可能的合作伙伴。
以上是加速云:云原生时会有什么期望的详细内容。更多信息请关注PHP中文网其他相关文章!