您是否想知道 Azure 上的 Polars Deltalake 与消费级笔记本电脑的性能相比如何?
不?嗯,我有。如果我激起了您的好奇心,请继续阅读。
以下是参赛者
- EliteBook 840 G10,AMD Ryzen 7840U,8 核,16 线程,64 GB RAM
- 在 Linux B3 SKU 应用服务计划上运行的 Azure Function(4 核,7 GB RAM)
- 具有标准 ADLS2 存储
- 具有高级 ADLS2 存储
请参阅定价以获取可用应用服务计划的完整列表。
测试设置
测试测量三种场景
- 创建增量表
- 写入增量表
- 从增量表读取
代码通过 REST API 端点执行:
- polars_azure_create:https://function-hekori-learning-002.azurewebsites.net/api/polars/azure/create
- polars_azure_read:https://function-hekori-learning-002.azurewebsites.net/api/polars/azure/read
- polars_azure_write:https://function-hekori-learning-002.azurewebsites.net/api/polars/azure/write
- polars_local_create:http://localhost:7071/api/polars/local/create
- polars_local_read:http://localhost:7071/api/polars/local/read
- polars_local_write:http://localhost:7071/api/polars/local/write
在 HP EliteBook 上,我使用 func start 启动 https://localhost:7071。
要发布到 Azure I,请按照 https://learn.microsoft.com/en-us/azure/azure-functions/create-first-function-cli-python
中的说明进行操作
搭建必要的开发环境。这使我能够通过
发布该函数
func azure functionapp 发布 function-hekori-learning-002.
我使用 terraform 在北欧区域设置了 Azure 资源。
这是一个代码片段,显示访问 https://function-hekori-learning-002.azurewebsites.net/api/polars/azure/read
时执行的代码
@app.route(route="polars/azure/read", auth_level=func.AuthLevel.ANONYMOUS) def polars_azure_read(req: func.HttpRequest) -> func.HttpResponse: logging.info('Reading from delta table') tic = time.time() df = pl.read_delta(AZURE_STORAGE_PATH, storage_options=storage_options ) df = df.sql( "select sum(value) as sum, avg(value) as mean, count() as count, name from self group by name order by sum asc" ) toc = time.time() logging.info(f"Elapsed time {toc - tic:.2f} seconds") return func.HttpResponse( "Success from polars." + str(df) + '\n' + "Elapsed time " + str(toc - tic) + " seconds", status_code=200 )
测试结果
正如我们所见,HP EliteBook 在所有情况下都快了大约一个数量级。
解释
这是我个人的解读
- Azure Function 计时对于同步任务来说足够了。例如,用在 POST 请求中,客户端期望在
- 如果您的数据量较小并希望获得最佳性能,您应该考虑在裸机或虚拟机上运行具有低 IO 延迟的 Polars。
请注意,增量表的大小较小,只有 3 个提交和 2 个 parquet 文件。即,运行时有效地测量计算单元访问文件的开销。
如果您❤️这篇文章,并且想要查看更大数据集的更多基准测试结果以进行核心处理,请给这篇文章一个?
并订阅?到我的频道???.
以上是Polars Delta Lake:小数据方面的 Azure Function 与笔记本电脑的详细内容。更多信息请关注PHP中文网其他相关文章!

Python列表切片的基本语法是list[start:stop:step]。1.start是包含的第一个元素索引,2.stop是排除的第一个元素索引,3.step决定元素之间的步长。切片不仅用于提取数据,还可以修改和反转列表。

ListSoutPerformarRaysin:1)DynamicsizicsizingandFrequentInsertions/删除,2)储存的二聚体和3)MemoryFeliceFiceForceforseforsparsedata,butmayhaveslightperformancecostsinclentoperations。

toConvertapythonarraytoalist,usEthelist()constructororageneratorexpression.1)intimpthearraymoduleandcreateanArray.2)USELIST(ARR)或[XFORXINARR] to ConconverTittoalist,请考虑performorefformanceandmemoryfformanceandmemoryfformienceforlargedAtasetset。

choosearraysoverlistsinpythonforbetterperformanceandmemoryfliceSpecificScenarios.1)largenumericaldatasets:arraysreducememoryusage.2)绩效 - 临界杂货:arraysoffersoffersOffersOffersOffersPoostSfoostSforsssfortasssfortaskslikeappensearch orearch.3)testessenforcety:arraysenforce:arraysenforc

在Python中,可以使用for循环、enumerate和列表推导式遍历列表;在Java中,可以使用传统for循环和增强for循环遍历数组。1.Python列表遍历方法包括:for循环、enumerate和列表推导式。2.Java数组遍历方法包括:传统for循环和增强for循环。

本文讨论了Python版本3.10中介绍的新“匹配”语句,该语句与其他语言相同。它增强了代码的可读性,并为传统的if-elif-el提供了性能优势

Python中的功能注释将元数据添加到函数中,以进行类型检查,文档和IDE支持。它们增强了代码的可读性,维护,并且在API开发,数据科学和图书馆创建中至关重要。


热AI工具

Undresser.AI Undress
人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover
用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool
免费脱衣服图片

Clothoff.io
AI脱衣机

Video Face Swap
使用我们完全免费的人工智能换脸工具轻松在任何视频中换脸!

热门文章

热工具

SecLists
SecLists是最终安全测试人员的伙伴。它是一个包含各种类型列表的集合,这些列表在安全评估过程中经常使用,都在一个地方。SecLists通过方便地提供安全测试人员可能需要的所有列表,帮助提高安全测试的效率和生产力。列表类型包括用户名、密码、URL、模糊测试有效载荷、敏感数据模式、Web shell等等。测试人员只需将此存储库拉到新的测试机上,他就可以访问到所需的每种类型的列表。

适用于 Eclipse 的 SAP NetWeaver 服务器适配器
将Eclipse与SAP NetWeaver应用服务器集成。

Atom编辑器mac版下载
最流行的的开源编辑器

SublimeText3汉化版
中文版,非常好用

ZendStudio 13.5.1 Mac
功能强大的PHP集成开发环境