在保留初始信息的同时合并列上的 DataFrame
尽管使用 Pandas 的合并功能,但在合并数据帧 df1 和 df2 时遇到困难在“名称”列上,同时保留 df1信息。
问题:
在合并操作中:
df1 = pd.merge(df1, df2, on = 'Name', how = 'outer ')
您正在执行外部联接,其中包括来自两个数据帧的个体。这会导致 df2 中的个体包含在 df1 中,即使它们最初没有出现在 df1 中。
解决方案:
要解决此问题,您可以使用一个以下方法之一:
方法 1:使用由创建的系列地图set_index:
df1['Sex'] = df1['Name'].map(df2.set_index('Name')['Sex'])
此方法建立一个系列,其中“Name”作为 df2 的“Sex”列的索引。然后,df1 的“Name”列映射到该系列以分配匹配的“Sex”值。通过将缺失值设置为 NaN 来解决。
方法 2:执行左连接:
df = df1.merge(df2[['Name','Sex']], on='Name', how='left')
左连接可确保 df1 中的个体优先,如果缺失值不存在于中,则用 NaN 填充df2.
注意事项:
- 多个合并列:如果合并多个列,请在 'on' 参数中指定它们,例如。, on=['Year','Code'].
- 重复值:重复的合并列值可能会导致问题。考虑在合并之前删除重复项或通过字典使用映射来选择适当的值。
以上是如何合并一列上的数据帧,同时保留一个数据帧中的初始信息?的详细内容。更多信息请关注PHP中文网其他相关文章!

Python适合数据科学、Web开发和自动化任务,而C 适用于系统编程、游戏开发和嵌入式系统。 Python以简洁和强大的生态系统着称,C 则以高性能和底层控制能力闻名。

2小时内可以学会Python的基本编程概念和技能。1.学习变量和数据类型,2.掌握控制流(条件语句和循环),3.理解函数的定义和使用,4.通过简单示例和代码片段快速上手Python编程。

Python在web开发、数据科学、机器学习、自动化和脚本编写等领域有广泛应用。1)在web开发中,Django和Flask框架简化了开发过程。2)数据科学和机器学习领域,NumPy、Pandas、Scikit-learn和TensorFlow库提供了强大支持。3)自动化和脚本编写方面,Python适用于自动化测试和系统管理等任务。

两小时内可以学到Python的基础知识。1.学习变量和数据类型,2.掌握控制结构如if语句和循环,3.了解函数的定义和使用。这些将帮助你开始编写简单的Python程序。

如何在10小时内教计算机小白编程基础?如果你只有10个小时来教计算机小白一些编程知识,你会选择教些什么�...

使用FiddlerEverywhere进行中间人读取时如何避免被检测到当你使用FiddlerEverywhere...

Python3.6环境下加载Pickle文件报错:ModuleNotFoundError:Nomodulenamed...

如何解决jieba分词在景区评论分析中的问题?当我们在进行景区评论分析时,往往会使用jieba分词工具来处理文�...


热AI工具

Undresser.AI Undress
人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover
用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool
免费脱衣服图片

Clothoff.io
AI脱衣机

AI Hentai Generator
免费生成ai无尽的。

热门文章

热工具

Atom编辑器mac版下载
最流行的的开源编辑器

螳螂BT
Mantis是一个易于部署的基于Web的缺陷跟踪工具,用于帮助产品缺陷跟踪。它需要PHP、MySQL和一个Web服务器。请查看我们的演示和托管服务。

ZendStudio 13.5.1 Mac
功能强大的PHP集成开发环境

EditPlus 中文破解版
体积小,语法高亮,不支持代码提示功能

SecLists
SecLists是最终安全测试人员的伙伴。它是一个包含各种类型列表的集合,这些列表在安全评估过程中经常使用,都在一个地方。SecLists通过方便地提供安全测试人员可能需要的所有列表,帮助提高安全测试的效率和生产力。列表类型包括用户名、密码、URL、模糊测试有效载荷、敏感数据模式、Web shell等等。测试人员只需将此存储库拉到新的测试机上,他就可以访问到所需的每种类型的列表。