python 비디오 튜토리얼 칼럼은 계속해서 Python 데이터 구조의 Namedtuple을 이해하도록 안내합니다.
1부Python 데이터 구조: 과소평가된 Namedtuple (1)namedtuple의 몇 가지 기본 사용법에 대해 이야기한 이 기사는 계속됩니다.
Python 3.7 이전에는 다음 방법 중 하나를 사용하여 간단한 데이터 컨테이너를 만들 수 있었습니다:
attrs
attrs
如果您想使用常规类,那意味着您将必须实现几个方法。例如,常规类将需要一种__init__
方法来在类实例化期间设置属性。如果您希望该类是可哈希的,则意味着自己实现一个__hash__
方法。为了比较不同的对象,还需要__eq__
实现一个方法。最后,为了简化调试,您需要一种__repr__
方法。
让我们使用常规类来实现下我们的颜色用例。
class Color: """A regular class that represents a color.""" def __init__(self, r, g, b, alpha=0.0): self.r = r self.g = g self.b = b self.alpha = alpha def __hash__(self): return hash((self.r, self.g, self.b, self.alpha)) def __repr__(self): return "{0}({1}, {2}, {3}, {4})".format( self.__class__.__name__, self.r, self.g, self.b, self.alpha ) def __eq__(self, other): if not isinstance(other, Color): return False return ( self.r == other.r and self.g == other.g and self.b == other.b and self.alpha == other.alpha )复制代码
如上,你需要实现好多方法。您只需要一个容器来为您保存数据,而不必担心分散注意力的细节。同样,人们偏爱实现类的一个关键区别是常规类是可变的。
实际上,引入数据类(Data Class)
的PEP将它们称为“具有默认值的可变namedtuple”(译者注:Data Class python 3.7引入,参考:docs.python.org/zh-cn/3/lib…
现在,让我们看看如何用数据类
来实现。
from dataclasses import dataclass ...@dataclassclass Color: """A regular class that represents a color.""" r: float g: float b: float alpha: float复制代码
哇!就是这么简单。由于没有__init__
,您只需在docstring后面定义属性即可。此外,必须使用类型提示对其进行注释。
除了可变之外,数据类还可以开箱即用提供可选字段。假设我们的Color类不需要alpha字段。然后我们可以设置为可选。
from dataclasses import dataclassfrom typing import Optional ...@dataclassclass Color: """A regular class that represents a color.""" r: float g: float b: float alpha: Optional[float]复制代码
我们可以像这样实例化它:
>>> blue = Color(r=0, g=0, b=255)复制代码
由于它们是可变的,因此我们可以更改所需的任何字段。我们可以像这样实例化它:
>>> blue = Color(r=0, g=0, b=255) >>> blue.r = 1 >>> # 可以设置更多的属性字段 >>> blue.e = 10复制代码
相较之下,namedtuple
默认情况下没有可选字段。要添加它们,我们需要一点技巧和一些元编程。
提示:要添加__hash__
方法,您需要通过将设置unsafe_hash
为使其不可变True
:
@dataclass(unsafe_hash=True)class Color: ...复制代码
另一个区别是,拆箱(unpacking)是namedtuples的自带的功能(first-class citizen)。如果希望数据类
具有相同的行为,则必须实现自己。
from dataclasses import dataclass, astuple ...@dataclassclass Color: """A regular class that represents a color.""" r: float g: float b: float alpha: float def __iter__(self): yield from dataclasses.astuple(self)复制代码
仅比较功能是不够的,namedtuple和数据类在性能上也有所不同。数据类基于纯Python实现dict。这使得它们在访问字段时更快。另一方面,namedtuples只是常规的扩展tuple。这意味着它们的实现基于更快的C代码并具有较小的内存占用量。
为了证明这一点,请考虑在Python 3.8.5上进行此实验。
In [6]: import sys In [7]: ColorTuple = namedtuple("Color", "r g b alpha") In [8]: @dataclass ...: class ColorClass: ...: """A regular class that represents a color.""" ...: r: float ...: g: float ...: b: float ...: alpha: float ...: In [9]: color_tup = ColorTuple(r=50, g=205, b=50, alpha=1.0) In [10]: color_cls = ColorClass(r=50, g=205, b=50, alpha=1.0) In [11]: %timeit color_tup.r36.8 ns ± 0.109 ns per loop (mean ± std. dev. of 7 runs, 10000000 loops each) In [12]: %timeit color_cls.r38.4 ns ± 0.112 ns per loop (mean ± std. dev. of 7 runs, 10000000 loops each) In [15]: sys.getsizeof(color_tup) Out[15]: 72In [16]: sys.getsizeof(color_cls) + sys.getsizeof(vars(color_cls)) Out[16]: 152复制代码
如上,数据类在中访问字段的速度稍快一些,但是它们比nametuple占用更多的内存空间。
数据类默认使用类型提示。我们也可以将它们放在namedtuples上。通过导入Namedtuple注释类型并从中继承,我们可以对Color元组进行注释。
from typing import NamedTuple ...class Color(NamedTuple): """A namedtuple that represents a color.""" r: float g: float b: float alpha: float复制代码
另一个可能未引起注意的细节是,这种方式还允许我们使用docstring。如果输入,help(Color)我们将能够看到它们。
Help on class Color in module __main__:class Color(builtins.tuple) | Color(r: float, g: float, b: float, alpha: Union[float, NoneType]) | | A namedtuple that represents a color. | | Method resolution order: | Color | builtins.tuple | builtins.object | | Methods defined here: | | __getnewargs__(self) | Return self as a plain tuple. Used by copy and pickle. | | __repr__(self) | Return a nicely formatted representation string | | _asdict(self) | Return a new dict which maps field names to their values.复制代码
在上一节中,我们了解了数据类可以具有可选值。另外,我提到要模仿上的相同行为,namedtuple
需要进行一些技巧修改操作。事实证明,我们可以使用继承,如下例所示。
from collections import namedtupleclass Color(namedtuple("Color", "r g b alpha")): __slots__ = () def __new__(cls, r, g, b, alpha=None): return super().__new__(cls, r, g, b, alpha)>>> c = Color(r=0, g=0, b=0)>>> c Color(r=0, g=0, b=0, alpha=None)复制代码
元组是一个非常强大的数据结构。它们使我们的代码更清洁,更可靠。尽管与新的数据类
竞争激烈,但他们仍有大量的场景可用。在本教程中,我们学习了使用namedtuples
__init__
메서드가 필요합니다. 클래스를 해시 가능하게 하려면 __hash__
메서드를 직접 구현해야 합니다. 다양한 객체를 비교하려면 __eq__
메서드도 구현해야 합니다. 마지막으로 디버깅을 단순화하려면 __repr__
메서드가 필요합니다. 와우,정규 클래스를 사용하여 색상 사용 사례를 구현해 보겠습니다. rrreee 위와 같이 여러 메소드를 구현해야 합니다. 주의를 산만하게 하는 세부 사항에 대해 걱정하지 않고 데이터를 보관할 수 있는 컨테이너만 있으면 됩니다. 다시 말하지만 사람들이 구현 클래스를 선호하는 주요 차이점은 일반 클래스가 변경 가능하다는 것입니다. 사실
rrreee데이터 클래스
를 도입한 PEP는 이를 "기본값이 있는 변경 가능한 명명된 튜플"이라고 지칭합니다(번역자 참고 사항: Python 3.7에 도입된 데이터 클래스, 참조: docs.python .org/zh- cn/3/lib…이제데이터 클래스
를 사용하여 이를 수행하는 방법을 살펴보겠습니다.
__init__
가 없기 때문에 간단합니다. docstring 뒤에 속성을 정의하면 됩니다. 또한 유형 힌트로 주석을 달아야 합니다. 🎜🎜변경 가능한 것 외에도 클래스에는 알파 필드가 필요하지 않습니다. 선택사항으로 만들 수 있습니다. 🎜rrreee🎜 다음과 같이 인스턴스화할 수 있습니다. 🎜rrreee🎜 변경 가능하므로 원하는 필드를 변경할 수 있습니다. 변환: 🎜rrreee🎜 대조적으로 namedtuple
은 그렇지 않습니다. 기본적으로 선택적 필드를 추가하려면 약간의 트릭과 약간의 메타프로그래밍이 필요합니다. 🎜🎜팁: __hash__.
메서드를 추가하려면 unsafe_hash를 설정하여 변경할 수 없도록 만들어야 합니다. code>를 <code>True
로 변경: 🎜rrreee🎜또 다른 차이점은 명명된 튜플 기능(일급 시민)에 대해 압축 풀기가 자동으로 이루어진다는 것입니다. 데이터 클래스
가 동일한 동작을 하도록 하려면 다음과 같이 하세요. 🎜rrreeenamedtuple
에서 동일한 동작을 모방하려면 몇 가지 까다로운 수정이 필요하다고 언급했습니다. 다음 예와 같이 상속을 사용할 수 있음이 밝혀졌습니다. 🎜rrreee데이터 클래스
와의 치열한 경쟁에도 불구하고 여전히 사용할 수 있는 시나리오가 많습니다. 이 튜토리얼에서 우리는 namedtuples
를 사용하는 여러 가지 방법을 배웠으며 여러분도 이를 사용할 수 있기를 바랍니다. 🎜🎜🎜🎜관련 무료 학습 권장사항: 🎜🎜🎜python 비디오 튜토리얼🎜🎜🎜🎜위 내용은 Python 데이터 구조: 과소평가된 Namedtuple(2)의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!