我敢打赌,你可能遇到过在 Python 中尝试压缩两个不同长度的列表时丢失数据的挫败感。
itertools.zip_longest 来拯救世界。在这里我想探索如何使用 zip_longest(),将其与标准 zip 进行比较,并深入研究它的闪光点的实际场景。
Python 中 itertools 模块中的 zip_longest() 函数允许您压缩多个可迭代对象,并用指定值(默认)填充较短的可迭代对象。这可以确保即使迭代的长度不同,也不会丢失数据。
考虑这样一个场景:您尝试在教室中为学生安排座位,但学生人数和可用课桌数量不匹配。您要确保每个学生都有座位,并且每个座位都尽可能坐满。
如果您使用zip(),一旦用完学生或课桌,配对就会停止。这意味着一些课桌可能是空的,或者一些学生可能会站着。
使用zip_longest(),您可以为每个学生配备一张桌子,如果您的桌子用完,您可以注意到额外的学生需要站立。或者,如果课桌数量多于学生,您可以将多余的课桌标记为“空”。每个学生都被记录下来,并且您确切地知道哪些课桌未被占用。
考虑一个课桌数量超过学生数量的示例,同时使用 zip() 和 zip_longest()。
students = ['Alice', 'Bob'] desks = ['Desk 1', 'Desk 2', 'Desk 3'] # Using zip to pair students with desks seating_zip = list(zip(students, desks)) print("Seating with zip:") for student, desk in seating_zip: print(f"{student} is assigned to {desk}")
输出:
Seating with zip: Alice is assigned to Desk 1 Bob is assigned to Desk 2
使用zip(),一旦较短的列表(学生)用完,配对就会停止。办公桌 3 仍未分配,并且没有迹象表明它未被使用。
from itertools import zip_longest students = ['Alice', 'Bob'] desks = ['Desk 1', 'Desk 2', 'Desk 3'] # Using zip_longest to pair students with desks seating_zip_longest = list(zip_longest(students, desks, fillvalue='Empty Seat')) print("\nSeating with zip_longest:") for student, desk in seating_zip_longest: print(f"{student} is assigned to {desk}")
输出:
Seating with zip_longest: Alice is assigned to Desk 1 Bob is assigned to Desk 2 Empty Seat is assigned to Desk 3
使用zip_longest(),即使没有足够的学生来填满所有座位,每张课桌都会被计算在内。在这种情况下,办公桌 3 与“空座位”配对,表示该办公桌仍然无人占用。当您需要跟踪所有资源并确保不遗漏任何内容时,此方法特别有用。
? zip_longest() 的优点:
保留数据:确保填充较短的迭代不会丢失数据。
灵活性:允许指定自定义填充值。
全面配对:在需要对齐不同长度迭代的数据处理任务中很有用。
? zip_longest() 的缺点:
填充可能是不需要的:在某些情况下,填充可能会带来不必要的复杂性。
内存使用:如果处理大型迭代和大填充值,可能会使用更多内存。
? zip() 的优点:
简单高效:适用于等长度的可迭代。
更少的内存使用:无填充意味着潜在的更少的内存开销。
? zip() 的缺点:
数据丢失: 截断为最短的迭代,丢失较长迭代的数据。
zip_longest() 是 Python 武器库中的一个强大工具,特别是在处理不同长度的可迭代时。它通过填充缺失值来确保数据完整性,使其成为各种数据处理任务的理想选择。虽然 zip() 更简单、更节省内存,但 zip_longest() 提供了许多实际场景所需的灵活性。
以上是除了拉上外套拉链之外:掌握 Python 中的“zip_longest”的详细内容。更多信息请关注PHP中文网其他相关文章!