搜索
首页后端开发Python教程如何在 Pandas 中有效地旋转数据帧?

How Can I Efficiently Pivot DataFrames in Pandas?

透视 DataFrame

简介

透视,也称为转置,是数据转换中的常见操作,其中交换行和列。它对于将数据重塑为更合适的格式或创建跨多个维度汇总数据的报告等任务非常有用。在 Python 中,pandas 提供了多种用于旋转 DataFrame 的方法,每种方法都有自己的优点和局限性。

基本旋转

对于基本旋转,您可以使用以下方法:

pandas.pivot_table: 该方法通过指定要旋转的列,提供了灵活的数据透视接口用作行、列和值。支持各种聚合函数,如平均值、总和、计数等

pandas.DataFrame.groupby pandas.unstack:使用groupby按所需列对数据进行分组,然后使用unstack结果MultiIndex unstack 以创建旋转的 DataFrame。

高级旋转

用于更复杂的旋转操作,您可以使用以下方法:

pandas.DataFrame.set_index pandas.unstack: 与 groupby 类似,但如果您在一组唯一的行和列上进行旋转,则效率更高。

pandas.DataFrame.pivot:pivot_table 的更简洁版本,但功能有限

其他方法

pandas.crosstab: 用于创建列联表(交叉表),这是一种跨两个分类变量聚合数据的数据透视表。

pandas.factorize numpy.bincount: 更多先进的技术可以更快地执行某些操作。使用因式分解将分类值转换为唯一整数,然后使用 bincount 计算出现次数。

pandas.get_dummies pandas.DataFrame.dot: 使用虚拟变量执行交叉表的创造性方法.

示例

以下是一些如何使用的示例这些方法:

# Import pandas
import pandas as pd

# Create a sample DataFrame
df = pd.DataFrame({
    "key": ["a", "b", "c", "a", "b"],
    "row": [1, 2, 3, 4, 5],
    "col": ["col1", "col2", "col3", "col1", "col2"],
    "val": [10, 20, 30, 40, 50]
})

# Pivot using pivot_table
pivoted_df = pd.pivot_table(
    df, index="row", columns="col", values="val", aggfunc='mean', fill_value=0
)

# Pivot using groupby and unstack
pivoted_df = df.groupby(['row', 'col'])['val'].mean().unstack(fill_value=0)

展平

要展平透视 DataFrame 的多索引,您可以根据列类型使用不同的方法:

如果列是字符串:

pivoted_df.columns = pivoted_df.columns.map('|'.join)

如果列是元组:

pivoted_df.columns = pivoted_df.columns.map('{0[0]}|{0[1]}'.format)

附加说明

  • 选择要旋转的列时,确保它们是分类的或具有有限数量的唯一值,以避免创建宽 DataFrame许多列。
  • 使用聚合函数处理缺失时请注意填充值数据。
  • 考虑对大型数据集使用 set_index 和分解等性能增强技术。
  • 如果需要将数据从宽格式转置为长格式,请探索其他选项,例如 pandas.wide_to_long。

以上是如何在 Pandas 中有效地旋转数据帧?的详细内容。更多信息请关注PHP中文网其他相关文章!

声明
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn
Python中的合并列表:选择正确的方法Python中的合并列表:选择正确的方法May 14, 2025 am 12:11 AM

Tomergelistsinpython,YouCanusethe操作员,estextMethod,ListComprehension,Oritertools

如何在Python 3中加入两个列表?如何在Python 3中加入两个列表?May 14, 2025 am 12:09 AM

在Python3中,可以通过多种方法连接两个列表:1)使用 运算符,适用于小列表,但对大列表效率低;2)使用extend方法,适用于大列表,内存效率高,但会修改原列表;3)使用*运算符,适用于合并多个列表,不修改原列表;4)使用itertools.chain,适用于大数据集,内存效率高。

Python串联列表字符串Python串联列表字符串May 14, 2025 am 12:08 AM

使用join()方法是Python中从列表连接字符串最有效的方法。1)使用join()方法高效且易读。2)循环使用 运算符对大列表效率低。3)列表推导式与join()结合适用于需要转换的场景。4)reduce()方法适用于其他类型归约,但对字符串连接效率低。完整句子结束。

Python执行,那是什么?Python执行,那是什么?May 14, 2025 am 12:06 AM

pythonexecutionistheprocessoftransformingpypythoncodeintoExecutablestructions.1)InternterPreterReadSthecode,ConvertingTingitIntObyTecode,whepythonvirtualmachine(pvm)theglobalinterpreterpreterpreterpreterlock(gil)the thepythonvirtualmachine(pvm)

Python:关键功能是什么Python:关键功能是什么May 14, 2025 am 12:02 AM

Python的关键特性包括:1.语法简洁易懂,适合初学者;2.动态类型系统,提高开发速度;3.丰富的标准库,支持多种任务;4.强大的社区和生态系统,提供广泛支持;5.解释性,适合脚本和快速原型开发;6.多范式支持,适用于各种编程风格。

Python:编译器还是解释器?Python:编译器还是解释器?May 13, 2025 am 12:10 AM

Python是解释型语言,但也包含编译过程。1)Python代码先编译成字节码。2)字节码由Python虚拟机解释执行。3)这种混合机制使Python既灵活又高效,但执行速度不如完全编译型语言。

python用于循环与循环时:何时使用哪个?python用于循环与循环时:何时使用哪个?May 13, 2025 am 12:07 AM

useeAforloopWheniteratingOveraseQuenceOrforAspecificnumberoftimes; useAwhiLeLoopWhenconTinuingUntilAcIntiment.ForloopSareIdeAlforkNownsences,而WhileLeleLeleLeleLoopSituationSituationSituationsItuationSuationSituationswithUndEtermentersitations。

Python循环:最常见的错误Python循环:最常见的错误May 13, 2025 am 12:07 AM

pythonloopscanleadtoerrorslikeinfiniteloops,modifyingListsDuringteritation,逐个偏置,零indexingissues,andnestedloopineflinefficiencies

See all articles

热AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover

AI Clothes Remover

用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool

Undress AI Tool

免费脱衣服图片

Clothoff.io

Clothoff.io

AI脱衣机

Video Face Swap

Video Face Swap

使用我们完全免费的人工智能换脸工具轻松在任何视频中换脸!

热门文章

热工具

适用于 Eclipse 的 SAP NetWeaver 服务器适配器

适用于 Eclipse 的 SAP NetWeaver 服务器适配器

将Eclipse与SAP NetWeaver应用服务器集成。

MinGW - 适用于 Windows 的极简 GNU

MinGW - 适用于 Windows 的极简 GNU

这个项目正在迁移到osdn.net/projects/mingw的过程中,你可以继续在那里关注我们。MinGW:GNU编译器集合(GCC)的本地Windows移植版本,可自由分发的导入库和用于构建本地Windows应用程序的头文件;包括对MSVC运行时的扩展,以支持C99功能。MinGW的所有软件都可以在64位Windows平台上运行。

禅工作室 13.0.1

禅工作室 13.0.1

功能强大的PHP集成开发环境

ZendStudio 13.5.1 Mac

ZendStudio 13.5.1 Mac

功能强大的PHP集成开发环境

mPDF

mPDF

mPDF是一个PHP库,可以从UTF-8编码的HTML生成PDF文件。原作者Ian Back编写mPDF以从他的网站上“即时”输出PDF文件,并处理不同的语言。与原始脚本如HTML2FPDF相比,它的速度较慢,并且在使用Unicode字体时生成的文件较大,但支持CSS样式等,并进行了大量增强。支持几乎所有语言,包括RTL(阿拉伯语和希伯来语)和CJK(中日韩)。支持嵌套的块级元素(如P、DIV),