이 글에서는 NumPy(2. 배열 1)에 대한 심층적인 이해를 위한 간결한 튜토리얼을 주로 소개합니다. NumPy 배열은 다차원 배열 객체이며 관심 있는 친구들이 참고할 수 있습니다.
제가 현재 하고 있는 일은 Pyston(Dropbox에서 구현한 Python 컴파일러/인터프리터)에 NumPy를 도입하는 것입니다. 작업 과정에서 NumPy 소스 코드에 대해 심층적으로 접촉하고 구현을 이해했으며 NumPy 버그를 수정하기 위해 PR을 제출했습니다. NumPy 소스 코드와 NumPy 개발자를 다루는 과정에서 현재 중국어 NumPy 튜토리얼의 대부분이 번역되거나 영어 문서를 참조하므로 누락되는 부분이 많다는 것을 발견했습니다. 예를 들어 NumPy 배열의 브로드캐스트 기능은 거의 모든 중국어 문서에서 "브로드캐스트"로 번역됩니다. NumPy 개발자 중 한 명은 "broadcast는 복합어입니다. 영어 원어민은 "broad" + "cast" = "넓게 캐스트(scatter, distribution), 아마도 "cast(scatter, distribution) broadly"라고 생각합니다."라고 답했습니다. 아마도 (NumPy에서의 의미)"에 더 가까울 것입니다. 이를 고려하여 NumPy 사용법과 소스 코드 수준에 대한 이해를 바탕으로 일련의 튜토리얼을 작성하는 프로젝트를 시작할 계획입니다. >NumPy 배열
NumPy 배열은 ndarray라는 다차원 배열 개체입니다.
이러한 데이터를 설명하는 메타데이터
대부분의 작업은 메타데이터만 대상으로 하며 기본 실제 데이터는 변경하지 않습니다. >NumPy 배열에 대해 알아야 할 몇 가지 사항이 있습니다.
NumPy 배열의 첨자는 0부터 시작합니다.
ndarray.dtype: 배열의 요소 유형을 나타내는 객체입니다. dtype은 표준 Python 유형을 사용하여 생성하거나 지정할 수 있습니다. 또한 이전 글에서 소개한 NumPy에서 제공하는 데이터 유형을 사용할 수도 있습니다.
ndarray.itemsize: 배열에 있는 각 요소의 바이트 크기입니다. 예를 들어, 요소 유형이 float64인 배열의 itemsiz 속성 값은 8입니다(float64는 64비트를 차지하고 각 바이트의 길이는 8이므로 64/8은 8바이트를 차지합니다). complex32. 배열 항목 속성은 4(32/8)입니다.
ndarray.data: 실제 배열 요소를 포함하는 버퍼입니다. 일반적으로 요소는 배열의 인덱스를 통해 획득되므로 일반적으로 이 속성을 사용할 필요가 없습니다.
>>> from numpy import * >>> a = array( [2,3,4] ) >>> a array([2, 3, 4]) >>> a.dtype dtype('int32') >>> b = array([1.2, 3.5, 5.1]) >>> b.dtype dtype('float64')
배열 함수를 사용하여 생성할 때 매개변수는 대괄호로 묶인 목록이어야 하며, 여러 값으로 배열을 호출할 수 없습니다. 매개변수로.
>>> a = array(1,2,3,4) # 错误 >>> a = array([1,2,3,4]) # 正确
>>> b = array( [ (1.5,2,3), (4,5,6) ] ) >>> b array([[ 1.5, 2. , 3. ], [ 4. , 5. , 6. ]])
배열을 생성할 때 배열의 요소 유형을 명시적으로 지정할 수 있습니다.
>>> c = array( [ [1,2], [3,4] ], dtype=complex) >>> c array([[ 1.+0.j, 2.+0.j], [ 3.+0.j, 4.+0.j]])
일반적으로 처음에는 배열의 요소를 알 수 없지만 배열의 크기는 알고 있습니다. 따라서 NumPy는 자리 표시자를 사용하여 배열을 생성하기 위한 몇 가지 기능을 제공합니다. 이러한 함수는 높은 계산 오버헤드를 줄이는 동시에 배열 확장 요구 사항을 충족하는 데 도움이 됩니다.
>>> d = zeros((3,4)) >>> d.dtype dtype('float64') >>> d array([[ 0., 0., 0., 0.], [ 0., 0., 0., 0.], [ 0., 0., 0., 0.]]) >>> d.dtype.itemsize 8배열의 요소 유형을 직접 지정할 수도 있습니다
>>> ones( (2,3,4), dtype=int16 ) #手动指定数组中元素类型 array([[[1, 1, 1, 1], [1, 1, 1, 1], [1, 1, 1, 1]], [[1, 1, 1, 1], [1, 1, 1, 1], [1, 1, 1, 1]]], dtype=int16) >>> empty((2,3)) array([[ 2.65565858e-316, 0.00000000e+000, 0.00000000e+000], [ 0.00000000e+000, 0.00000000e+000, 0.00000000e+000]])
NumPy提供一个类似arange的函数返回一个数列形式的数组:
>>> arange(10, 30, 5) array([10, 15, 20, 25])
以10开始,差值为5的等差数列。该函数不仅接受整数,还接受浮点参数:
>>> arange(0,2,0.5) array([ 0. , 0.5, 1. , 1.5])
当arange使用浮点数参数时,由于浮点数精度有限,通常无法预测获得的元素个数。因此,最好使用函数linspace去接收我们想要的元素个数来代替用range来指定步长。linespace用法如下,将在通用函数一节中详细介绍。
>>> numpy.linspace(-1, 0, 5) array([-1. , -0.75, -0.5 , -0.25, 0. ])
数组中的元素是通过下标来访问的,可以通过方括号括起一个下标来访问数组中单一一个元素,也可以以切片的形式访问数组中多个元素。关于切片访问,将在切片一节介绍。
知识点:NumPy中的数据类型
对于科学计算来说,Python中自带的整型、浮点型和复数类型远远不够,因此NumPy中添加了许多数据类型。如下:
NumPy中的基本数据类型
名称 | 描述 |
bool | 用一个字节存储的布尔类型(True或False) |
inti | 由所在平台决定其大小的整数(一般为int32或int64) |
int8 | 一个字节大小,-128 至 127 |
int16 | 整数,-32768 至 32767 |
int32 | 整数,-2 ** 31 至 2 ** 32 -1 |
int64 | 整数,-2 ** 63 至 2 ** 63 - 1 |
uint8 | 无符号整数,0 至 255 |
uint16 | 无符号整数,0 至 65535 |
uint32 | 无符号整数,0 至 2 ** 32 - 1 |
uint64 | 无符号整数,0 至 2 ** 64 - 1 |
float16 | 半精度浮点数:16位,正负号1位,指数5位,精度10位 |
float32 | 单精度浮点数:32位,正负号1位,指数8位,精度23位 |
float64或float | 双精度浮点数:64位,正负号1位,指数11位,精度52位 |
complex64 | 复数,分别用两个32位浮点数表示实部和虚部 |
complex128或complex | 复数,分别用两个64位浮点数表示实部和虚部 |
NumPy类型转换方式如下:
>>> float64(42) 42.0 >>> int8(42.0) 42 >>> bool(42) True >>> bool(42.0) True >>> float(True) 1.0
许多函数的参数中可以指定参数的类型,当然,这个类型参数是可选的。如下:
>>> arange(7, dtype=uint16) array([0, 1, 2, 3, 4, 5, 6], dtype=uint16)
输出数组
当输出一个数组时,NumPy以特定的布局用类似嵌套列表的形式显示:
第一行从左到右输出
每行依次自上而下输出
每个切片通过一个空行与下一个隔开
一维数组被打印成行,二维数组成矩阵,三维数组成矩阵列表。
>>> a = arange(6) # 1d array >>> print a [0 1 2 3 4 5] >>> b = arange(12).reshape(4,3) # 2d array >>> print b [[ 0 1 2] [ 3 4 5] [ 6 7 8] [ 9 10 11]] >>> c = arange(24).reshape(2,3,4) # 3d array >>> print c [[[ 0 1 2 3] [ 4 5 6 7] [ 8 9 10 11]] [[12 13 14 15] [16 17 18 19] [20 21 22 23]]]
reshape将在下一篇文章中介绍
如果一个数组太长,则NumPy自动省略中间部分而只打印两端的数据:
>>> print arange(10000) [ 0 1 2 ..., 9997 9998 9999] >>> print arange(10000).reshape(100,100) [[ 0 1 2 ..., 97 98 99] [ 100 101 102 ..., 197 198 199] [ 200 201 202 ..., 297 298 299] ..., [9700 9701 9702 ..., 9797 9798 9799] [9800 9801 9802 ..., 9897 9898 9899] [9900 9901 9902 ..., 9997 9998 9999]]
可通过设置printoptions参数来禁用NumPy的这种行为并强制打印整个数组。
set_printoptions(threshold='nan')
这样,输出时数组的所有元素都会显示出来。
以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持PHP中文网。
更多深入理解NumPy简明教程---数组1相关文章请关注PHP中文网!