搜索
首页后端开发Python教程Polars Delta Lake:小数据方面的 Azure Function 与笔记本电脑

Polars   Delta Lake: Azure Function vs. Laptop on Small Data

您是否想知道 Azure 上的 Polars Deltalake 与消费级笔记本电脑的性能相比如何?
不?嗯,我有。如果我激起了您的好奇心,请继续阅读。

以下是参赛者

  1. EliteBook 840 G10,AMD Ryzen 7840U,8 核,16 线程,64 GB RAM
  2. 在 Linux B3 SKU 应用服务计划上运行的 Azure Function(4 核,7 GB RAM)
    • 具有标准 ADLS2 存储
    • 具有高级 ADLS2 存储

请参阅定价以获取可用应用服务计划的完整列表。

测试设置

测试测量三种场景

  1. 创建增量表
  2. 写入增量表
  3. 从增量表读取

代码通过 REST API 端点执行:

  1. polars_azure_create:https://function-hekori-learning-002.azurewebsites.net/api/polars/azure/create
  2. polars_azure_read:https://function-hekori-learning-002.azurewebsites.net/api/polars/azure/read
  3. polars_azure_write:https://function-hekori-learning-002.azurewebsites.net/api/polars/azure/write
  4. polars_local_create:http://localhost:7071/api/polars/local/create
  5. polars_local_read:http://localhost:7071/api/polars/local/read
  6. polars_local_write:http://localhost:7071/api/polars/local/write

在 HP EliteBook 上,我使用 func start 启动 https://localhost:7071。
要发布到 Azure I,请按照 https://learn.microsoft.com/en-us/azure/azure-functions/create-first-function-cli-python
中的说明进行操作 搭建必要的开发环境。这使我能够通过
发布该函数 func azure functionapp 发布 function-hekori-learning-002.

我使用 terraform 在北欧区域设置了 Azure 资源。

这是一个代码片段,显示访问 https://function-hekori-learning-002.azurewebsites.net/api/polars/azure/read
时执行的代码

@app.route(route="polars/azure/read", auth_level=func.AuthLevel.ANONYMOUS)
def polars_azure_read(req: func.HttpRequest) -> func.HttpResponse:
    logging.info('Reading from delta table')

    tic = time.time()
    df = pl.read_delta(AZURE_STORAGE_PATH, storage_options=storage_options
                       )

    df = df.sql(
        "select sum(value) as sum, avg(value) as mean, count() as count, name from self group by name order by sum asc"
    )

    toc = time.time()

    logging.info(f"Elapsed time {toc - tic:.2f} seconds")

    return func.HttpResponse(
        "Success from polars." + str(df) + '\n' + "Elapsed time " + str(toc - tic) + " seconds",
        status_code=200
    )

测试结果

正如我们所见,HP EliteBook 在所有情况下都快了大约一个数量级。

Polars   Delta Lake: Azure Function vs. Laptop on Small Data

解释

这是我个人的解读

  1. Azure Function 计时对于同步任务来说足够了。例如,用在 POST 请求中,客户端期望在
  2. 如果您的数据量较小并希望获得最佳性能,您应该考虑在裸机或虚拟机上运行具有低 IO 延迟的 Polars。

请注意,增量表的大小较小,只有 3 个提交和 2 个 parquet 文件。即,运行时有效地测量计算单元访问文件的开销。

如果您❤️这篇文章,并且想要查看更大数据集的更多基准测试结果以进行核心处理,请给这篇文章一个?
并订阅?到我的频道???.

以上是Polars Delta Lake:小数据方面的 Azure Function 与笔记本电脑的详细内容。更多信息请关注PHP中文网其他相关文章!

声明
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn
您如何切成python阵列?您如何切成python阵列?May 01, 2025 am 12:18 AM

Python列表切片的基本语法是list[start:stop:step]。1.start是包含的第一个元素索引,2.stop是排除的第一个元素索引,3.step决定元素之间的步长。切片不仅用于提取数据,还可以修改和反转列表。

在什么情况下,列表的表现比数组表现更好?在什么情况下,列表的表现比数组表现更好?May 01, 2025 am 12:06 AM

ListSoutPerformarRaysin:1)DynamicsizicsizingandFrequentInsertions/删除,2)储存的二聚体和3)MemoryFeliceFiceForceforseforsparsedata,butmayhaveslightperformancecostsinclentoperations。

如何将Python数组转换为Python列表?如何将Python数组转换为Python列表?May 01, 2025 am 12:05 AM

toConvertapythonarraytoalist,usEthelist()constructororageneratorexpression.1)intimpthearraymoduleandcreateanArray.2)USELIST(ARR)或[XFORXINARR] to ConconverTittoalist,请考虑performorefformanceandmemoryfformanceandmemoryfformienceforlargedAtasetset。

当Python中存在列表时,使用数组的目的是什么?当Python中存在列表时,使用数组的目的是什么?May 01, 2025 am 12:04 AM

choosearraysoverlistsinpythonforbetterperformanceandmemoryfliceSpecificScenarios.1)largenumericaldatasets:arraysreducememoryusage.2)绩效 - 临界杂货:arraysoffersoffersOffersOffersOffersPoostSfoostSforsssfortasssfortaskslikeappensearch orearch.3)testessenforcety:arraysenforce:arraysenforc

说明如何通过列表和数组的元素迭代。说明如何通过列表和数组的元素迭代。May 01, 2025 am 12:01 AM

在Python中,可以使用for循环、enumerate和列表推导式遍历列表;在Java中,可以使用传统for循环和增强for循环遍历数组。1.Python列表遍历方法包括:for循环、enumerate和列表推导式。2.Java数组遍历方法包括:传统for循环和增强for循环。

什么是Python Switch语句?什么是Python Switch语句?Apr 30, 2025 pm 02:08 PM

本文讨论了Python版本3.10中介绍的新“匹配”语句,该语句与其他语言相同。它增强了代码的可读性,并为传统的if-elif-el提供了性能优势

Python中有什么例外组?Python中有什么例外组?Apr 30, 2025 pm 02:07 PM

Python 3.11中的异常组允许同时处理多个异常,从而改善了并发场景和复杂操作中的错误管理。

Python中的功能注释是什么?Python中的功能注释是什么?Apr 30, 2025 pm 02:06 PM

Python中的功能注释将元数据添加到函数中,以进行类型检查,文档和IDE支持。它们增强了代码的可读性,维护,并且在API开发,数据科学和图书馆创建中至关重要。

See all articles

热AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover

AI Clothes Remover

用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool

Undress AI Tool

免费脱衣服图片

Clothoff.io

Clothoff.io

AI脱衣机

Video Face Swap

Video Face Swap

使用我们完全免费的人工智能换脸工具轻松在任何视频中换脸!

热工具

SecLists

SecLists

SecLists是最终安全测试人员的伙伴。它是一个包含各种类型列表的集合,这些列表在安全评估过程中经常使用,都在一个地方。SecLists通过方便地提供安全测试人员可能需要的所有列表,帮助提高安全测试的效率和生产力。列表类型包括用户名、密码、URL、模糊测试有效载荷、敏感数据模式、Web shell等等。测试人员只需将此存储库拉到新的测试机上,他就可以访问到所需的每种类型的列表。

适用于 Eclipse 的 SAP NetWeaver 服务器适配器

适用于 Eclipse 的 SAP NetWeaver 服务器适配器

将Eclipse与SAP NetWeaver应用服务器集成。

Atom编辑器mac版下载

Atom编辑器mac版下载

最流行的的开源编辑器

SublimeText3汉化版

SublimeText3汉化版

中文版,非常好用

ZendStudio 13.5.1 Mac

ZendStudio 13.5.1 Mac

功能强大的PHP集成开发环境