搜索
首页后端开发Python教程不同的 Pandas `merge()` 连接类型如何组合 DataFrame?

How Do Different Pandas `merge()` Join Types Combine DataFrames?

Pandas 合并 101:基础知识

简介

在 Pandas 中合并 DataFrame 是组合和操作数据的强大工具来自不同的来源。本指南全面概述了联接的基本类型及其应用。

联接类型

1. INNER JOIN(默认)

  • 匹配两个 DataFrame 中具有公共键的行。
  • 仅返回在两个 DataFrame 中具有匹配值的行
  • 示例:

    left.merge(right, on='key')

2. LEFT OUTER JOIN

  • 将左侧 DataFrame 中的行与右侧 DataFrame 中的相应行进行匹配。
  • 如果找不到匹配行,则将 NaN 插入到输出中右侧缺少列数据框。
  • 示例:

    left.merge(right, on='key', how='left')

3. RIGHT OUTER JOIN

  • 将右侧 DataFrame 中的行与左侧 DataFrame 中的相应行进行匹配。
  • 如果找不到匹配行,则将 NaN 插入到输出中左侧缺少列数据框。
  • 示例:

    left.merge(right, on='key', how='right')

4. FULL OUTER JOIN

  • 匹配两个 DataFrame 中的所有行,无论它们是否具有公共键。
  • 为两个 DataFrame 中缺失的行插入 NaN
  • 示例:

    left.merge(right, on='key', how='outer')

其他连接变体

1. LEFT-排除 JOIN

  • 返回左侧 DataFrame 中与右侧 DataFrame 中的任何行都不匹配的行。

2. RIGHT-排除 JOIN

  • 返回右 DataFrame 中与左 DataFrame 中的任何行都不匹配的行。

3. ANTI JOIN(不包括任何一侧)

  • 从两个 DataFrame 返回与另一侧任何行都不匹配的行。

处理不同的数据键列名称

  • 使用left_on 和 right_on 参数用于合并具有不同名称的列。

避免输出中出现重复的键列

  • 将索引设置为初步步骤合并索引并消除重复键

从一个 DataFrame 中合并单个列

  • 在合并之前对列进行子集化,以从其中一个 DataFrame 中选择特定列。
  • 在只有一列的情况下,使用映射是一种更有效的方法

合并多列

  • 指定 on(或 left_on 和 right_on)的列表以合并多列。

以上是不同的 Pandas `merge()` 连接类型如何组合 DataFrame?的详细内容。更多信息请关注PHP中文网其他相关文章!

声明
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn
您如何将元素附加到Python列表中?您如何将元素附加到Python列表中?May 04, 2025 am 12:17 AM

toAppendElementStoApythonList,usetheappend()方法forsingleements,Extend()formultiplelements,andinsert()forspecificpositions.1)useeAppend()foraddingoneOnelementAttheend.2)useextendTheEnd.2)useextendexendExendEnd(

您如何创建Python列表?举一个例子。您如何创建Python列表?举一个例子。May 04, 2025 am 12:16 AM

TocreateaPythonlist,usesquarebrackets[]andseparateitemswithcommas.1)Listsaredynamicandcanholdmixeddatatypes.2)Useappend(),remove(),andslicingformanipulation.3)Listcomprehensionsareefficientforcreatinglists.4)Becautiouswithlistreferences;usecopy()orsl

讨论有效存储和数值数据的处理至关重要的实际用例。讨论有效存储和数值数据的处理至关重要的实际用例。May 04, 2025 am 12:11 AM

金融、科研、医疗和AI等领域中,高效存储和处理数值数据至关重要。 1)在金融中,使用内存映射文件和NumPy库可显着提升数据处理速度。 2)科研领域,HDF5文件优化数据存储和检索。 3)医疗中,数据库优化技术如索引和分区提高数据查询性能。 4)AI中,数据分片和分布式训练加速模型训练。通过选择适当的工具和技术,并权衡存储与处理速度之间的trade-off,可以显着提升系统性能和可扩展性。

您如何创建Python数组?举一个例子。您如何创建Python数组?举一个例子。May 04, 2025 am 12:10 AM

pythonarraysarecreatedusiseThearrayModule,notbuilt-Inlikelists.1)importThearrayModule.2)指定tefifythetypecode,例如,'i'forineizewithvalues.arreaysofferbettermemoremorefferbettermemoryfforhomogeNogeNogeNogeNogeNogeNogeNATATABUTESFELLESSFRESSIFERSTEMIFICETISTHANANLISTS。

使用Shebang系列指定Python解释器有哪些替代方法?使用Shebang系列指定Python解释器有哪些替代方法?May 04, 2025 am 12:07 AM

除了shebang线,还有多种方法可以指定Python解释器:1.直接使用命令行中的python命令;2.使用批处理文件或shell脚本;3.使用构建工具如Make或CMake;4.使用任务运行器如Invoke。每个方法都有其优缺点,选择适合项目需求的方法很重要。

列表和阵列之间的选择如何影响涉及大型数据集的Python应用程序的整体性能?列表和阵列之间的选择如何影响涉及大型数据集的Python应用程序的整体性能?May 03, 2025 am 12:11 AM

ForhandlinglargedatasetsinPython,useNumPyarraysforbetterperformance.1)NumPyarraysarememory-efficientandfasterfornumericaloperations.2)Avoidunnecessarytypeconversions.3)Leveragevectorizationforreducedtimecomplexity.4)Managememoryusagewithefficientdata

说明如何将内存分配给Python中的列表与数组。说明如何将内存分配给Python中的列表与数组。May 03, 2025 am 12:10 AM

Inpython,ListSusedynamicMemoryAllocationWithOver-Asalose,而alenumpyArraySallaySallocateFixedMemory.1)listssallocatemoremoremoremorythanneededinentientary上,respizeTized.2)numpyarsallaysallaysallocateAllocateAllocateAlcocateExactMemoryForements,OfferingPrediCtableSageButlessemageButlesseflextlessibility。

您如何在Python数组中指定元素的数据类型?您如何在Python数组中指定元素的数据类型?May 03, 2025 am 12:06 AM

Inpython,YouCansspecthedatatAtatatPeyFelemereModeRernSpant.1)Usenpynernrump.1)Usenpynyp.dloatp.dloatp.ploatm64,formor professisconsiscontrolatatypes。

See all articles

热AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover

AI Clothes Remover

用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool

Undress AI Tool

免费脱衣服图片

Clothoff.io

Clothoff.io

AI脱衣机

Video Face Swap

Video Face Swap

使用我们完全免费的人工智能换脸工具轻松在任何视频中换脸!

热工具

SublimeText3 Linux新版

SublimeText3 Linux新版

SublimeText3 Linux最新版

Dreamweaver CS6

Dreamweaver CS6

视觉化网页开发工具

Dreamweaver Mac版

Dreamweaver Mac版

视觉化网页开发工具

SecLists

SecLists

SecLists是最终安全测试人员的伙伴。它是一个包含各种类型列表的集合,这些列表在安全评估过程中经常使用,都在一个地方。SecLists通过方便地提供安全测试人员可能需要的所有列表,帮助提高安全测试的效率和生产力。列表类型包括用户名、密码、URL、模糊测试有效载荷、敏感数据模式、Web shell等等。测试人员只需将此存储库拉到新的测试机上,他就可以访问到所需的每种类型的列表。

VSCode Windows 64位 下载

VSCode Windows 64位 下载

微软推出的免费、功能强大的一款IDE编辑器