>  기사  >  백엔드 개발  >  Python 데이터 구조: 과소평가된 Namedtuple(2)

Python 데이터 구조: 과소평가된 Namedtuple(2)

coldplay.xixi
coldplay.xixi앞으로
2020-10-20 17:10:303379검색

python 비디오 튜토리얼 칼럼은 계속해서 Python 데이터 구조의 Namedtuple을 이해하도록 안내합니다.

Python 데이터 구조: 과소평가된 Namedtuple(2)

1부Python 데이터 구조: 과소평가된 Namedtuple (1)namedtuple의 몇 가지 기본 사용법에 대해 이야기한 이 기사는 계속됩니다.

네임드튜플과 데이터 클래스의 차이점은 무엇인가요?

Features

Python 3.7 이전에는 다음 방법 중 하나를 사용하여 간단한 데이터 컨테이너를 만들 수 있었습니다:

  • namedtuple
  • 일반 클래스
  • 타사 라이브러리, attrsattrs

如果您想使用常规类,那意味着您将必须实现几个方法。例如,常规类将需要一种__init__方法来在类实例化期间设置属性。如果您希望该类是可哈希的,则意味着自己实现一个__hash__方法。为了比较不同的对象,还需要__eq__实现一个方法。最后,为了简化调试,您需要一种__repr__方法。

让我们使用常规类来实现下我们的颜色用例。

class Color:
    """A regular class that represents a color."""

    def __init__(self, r, g, b, alpha=0.0):
        self.r = r
        self.g = g
        self.b = b
        self.alpha = alpha    def __hash__(self):
        return hash((self.r, self.g, self.b, self.alpha))    def __repr__(self):
        return "{0}({1}, {2}, {3}, {4})".format(
            self.__class__.__name__, self.r, self.g, self.b, self.alpha
        )    def __eq__(self, other):
        if not isinstance(other, Color):            return False
        return (
            self.r == other.r            and self.g == other.g            and self.b == other.b            and self.alpha == other.alpha
        )复制代码

如上,你需要实现好多方法。您只需要一个容器来为您保存数据,而不必担心分散注意力的细节。同样,人们偏爱实现类的一个关键区别是常规类是可变的。

实际上,引入数据类(Data Class)的PEP将它们称为“具有默认值的可变namedtuple”(译者注:Data Class python 3.7引入,参考:docs.python.org/zh-cn/3/lib…

现在,让我们看看如何用数据类来实现。

from dataclasses import dataclass
...@dataclassclass Color:
    """A regular class that represents a color."""
    r: float
    g: float
    b: float
    alpha: float复制代码

哇!就是这么简单。由于没有__init__,您只需在docstring后面定义属性即可。此外,必须使用类型提示对其进行注释。

除了可变之外,数据类还可以开箱即用提供可选字段。假设我们的Color类不需要alpha字段。然后我们可以设置为可选。

from dataclasses import dataclassfrom typing import Optional
...@dataclassclass Color:
    """A regular class that represents a color."""
    r: float
    g: float
    b: float
    alpha: Optional[float]复制代码

我们可以像这样实例化它:

>>> blue = Color(r=0, g=0, b=255)复制代码

由于它们是可变的,因此我们可以更改所需的任何字段。我们可以像这样实例化它:

>>> blue = Color(r=0, g=0, b=255)
>>> blue.r = 1
>>> # 可以设置更多的属性字段
>>> blue.e = 10复制代码

相较之下,namedtuple默认情况下没有可选字段。要添加它们,我们需要一点技巧和一些元编程。

提示:要添加__hash__方法,您需要通过将设置unsafe_hash为使其不可变True

@dataclass(unsafe_hash=True)class Color:
    ...复制代码

另一个区别是,拆箱(unpacking)是namedtuples的自带的功能(first-class citizen)。如果希望数据类具有相同的行为,则必须实现自己。

from dataclasses import dataclass, astuple
...@dataclassclass Color:
    """A regular class that represents a color."""
    r: float
    g: float
    b: float
    alpha: float    def __iter__(self):
        yield from dataclasses.astuple(self)复制代码

性能比较

仅比较功能是不够的,namedtuple和数据类在性能上也有所不同。数据类基于纯Python实现dict。这使得它们在访问字段时更快。另一方面,namedtuples只是常规的扩展tuple。这意味着它们的实现基于更快的C代码并具有较小的内存占用量。

为了证明这一点,请考虑在Python 3.8.5上进行此实验。

In [6]: import sys

In [7]: ColorTuple = namedtuple("Color", "r g b alpha")

In [8]: @dataclass
   ...: class ColorClass:
   ...:     """A regular class that represents a color."""
   ...:     r: float
   ...:     g: float
   ...:     b: float
   ...:     alpha: float
   ...: 

In [9]: color_tup = ColorTuple(r=50, g=205, b=50, alpha=1.0)

In [10]: color_cls = ColorClass(r=50, g=205, b=50, alpha=1.0)

In [11]: %timeit color_tup.r36.8 ns ± 0.109 ns per loop (mean ± std. dev. of 7 runs, 10000000 loops each)

In [12]: %timeit color_cls.r38.4 ns ± 0.112 ns per loop (mean ± std. dev. of 7 runs, 10000000 loops each)

In [15]: sys.getsizeof(color_tup)
Out[15]: 72In [16]: sys.getsizeof(color_cls) + sys.getsizeof(vars(color_cls))
Out[16]: 152复制代码

如上,数据类在中访问字段的速度稍快一些,但是它们比nametuple占用更多的内存空间。

如何将类型提示添加到 namedtuple

数据类默认使用类型提示。我们也可以将它们放在namedtuples上。通过导入Namedtuple注释类型并从中继承,我们可以对Color元组进行注释。

from typing import NamedTuple
...class Color(NamedTuple):
    """A namedtuple that represents a color."""
    r: float
    g: float
    b: float
    alpha: float复制代码

另一个可能未引起注意的细节是,这种方式还允许我们使用docstring。如果输入,help(Color)我们将能够看到它们。

Help on class Color in module __main__:class Color(builtins.tuple)
 |  Color(r: float, g: float, b: float, alpha: Union[float, NoneType])
 |  
 |  A namedtuple that represents a color.
 |  
 |  Method resolution order:
 |      Color
 |      builtins.tuple
 |      builtins.object
 |  
 |  Methods defined here:
 |  
 |  __getnewargs__(self)
 |      Return self as a plain tuple.  Used by copy and pickle.
 |  
 |  __repr__(self)
 |      Return a nicely formatted representation string
 |  
 |  _asdict(self)
 |      Return a new dict which maps field names to their values.复制代码

如何将可选的默认值添加到 namedtuple

在上一节中,我们了解了数据类可以具有可选值。另外,我提到要模仿上的相同行为,namedtuple需要进行一些技巧修改操作。事实证明,我们可以使用继承,如下例所示。

from collections import namedtupleclass Color(namedtuple("Color", "r g b alpha")):
    __slots__ = ()    def __new__(cls, r, g, b, alpha=None):
        return super().__new__(cls, r, g, b, alpha)>>> c = Color(r=0, g=0, b=0)>>> c
Color(r=0, g=0, b=0, alpha=None)复制代码

结论

元组是一个非常强大的数据结构。它们使我们的代码更清洁,更可靠。尽管与新的数据类竞争激烈,但他们仍有大量的场景可用。在本教程中,我们学习了使用namedtuples

일반 클래스를 사용하려면 여러 메서드를 구현해야 한다는 의미입니다. 예를 들어, 일반 클래스에는 클래스 인스턴스화 중에 속성을 설정하기 위해 __init__ 메서드가 필요합니다. 클래스를 해시 가능하게 하려면 __hash__ 메서드를 직접 구현해야 합니다. 다양한 객체를 비교하려면 __eq__ 메서드도 구현해야 합니다. 마지막으로 디버깅을 단순화하려면 __repr__ 메서드가 필요합니다.

정규 클래스를 사용하여 색상 사용 사례를 구현해 보겠습니다. rrreee 위와 같이 여러 메소드를 구현해야 합니다. 주의를 산만하게 하는 세부 사항에 대해 걱정하지 않고 데이터를 보관할 수 있는 컨테이너만 있으면 됩니다. 다시 말하지만 사람들이 구현 클래스를 선호하는 주요 차이점은 일반 클래스가 변경 가능하다는 것입니다. 사실 데이터 클래스를 도입한 PEP는 이를 "기본값이 있는 변경 가능한 명명된 튜플"이라고 지칭합니다(번역자 참고 사항: Python 3.7에 도입된 데이터 클래스, 참조: docs.python .org/zh- cn/3/lib…이제 데이터 클래스를 사용하여 이를 수행하는 방법을 살펴보겠습니다.

rrreee
와우, __init__가 없기 때문에 간단합니다. docstring 뒤에 속성을 정의하면 됩니다. 또한 유형 힌트로 주석을 달아야 합니다. 🎜🎜변경 가능한 것 외에도 클래스에는 알파 필드가 필요하지 않습니다. 선택사항으로 만들 수 있습니다. 🎜rrreee🎜 다음과 같이 인스턴스화할 수 있습니다. 🎜rrreee🎜 변경 가능하므로 원하는 필드를 변경할 수 있습니다. 변환: 🎜rrreee🎜 대조적으로 namedtuple은 그렇지 않습니다. 기본적으로 선택적 필드를 추가하려면 약간의 트릭과 약간의 메타프로그래밍이 필요합니다. 🎜🎜팁: __hash__. 메서드를 추가하려면 unsafe_hash를 설정하여 변경할 수 없도록 만들어야 합니다. code>를 <code>True로 변경: 🎜rrreee🎜또 다른 차이점은 명명된 튜플 기능(일급 시민)에 대해 압축 풀기가 자동으로 이루어진다는 것입니다. 데이터 클래스가 동일한 동작을 하도록 하려면 다음과 같이 하세요. 🎜rrreee

성능 비교🎜🎜만 구현해야 합니다. 비교 기능만으로는 충분하지 않으며, 네임드튜플과 데이터 클래스도 성능이 다릅니다. 반면에 Namedtuple은 더 빠른 C 코드를 기반으로 하며 메모리 사용량이 더 적습니다. 🎜🎜이를 증명하려면 Python 3.8.5에서 이 실험을 실행해 보세요. 🎜 rrreee🎜위와 같이 데이터 클래스는 필드에 약간 더 빠르게 액세스하지만 nametuple보다 더 많은 메모리 공간을 차지합니다. 🎜

namedtuple에 유형 힌트를 추가하는 방법🎜🎜데이터 클래스가 사용합니다. 기본적으로 유형 힌트를 넣을 수도 있습니다. Namedtuple 주석 유형을 가져오고 이를 상속하면 Color 튜플에 주석을 달 수 있습니다. 독스트링을 사용합니다. help(Color)를 입력하면 이를 볼 수 있습니다. 🎜rrreee

namedtuple에 선택적 기본값을 추가하는 방법🎜🎜이전 섹션에서는 데이터 클래스가 선택적 값을 가질 수 있다는 것을 배웠습니다. 또한 namedtuple에서 동일한 동작을 모방하려면 몇 가지 까다로운 수정이 필요하다고 언급했습니다. 다음 예와 같이 상속을 사용할 수 있음이 밝혀졌습니다. 🎜rrreee

결론🎜🎜튜플은 매우 강력한 데이터 구조입니다. 이는 우리의 코드를 더욱 깔끔하고 안정적으로 만듭니다. 새로운 데이터 클래스와의 치열한 경쟁에도 불구하고 여전히 사용할 수 있는 시나리오가 많습니다. 이 튜토리얼에서 우리는 namedtuples를 사용하는 여러 가지 방법을 배웠으며 여러분도 이를 사용할 수 있기를 바랍니다. 🎜🎜🎜🎜관련 무료 학습 권장사항: 🎜🎜🎜python 비디오 튜토리얼🎜🎜🎜🎜

위 내용은 Python 데이터 구조: 과소평가된 Namedtuple(2)의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
이 기사는 juejin.im에서 복제됩니다. 침해가 있는 경우 admin@php.cn으로 문의하시기 바랍니다. 삭제

관련 기사

더보기