집 >백엔드 개발 >파이썬 튜토리얼 >NumPy 간결한 튜토리얼에 대한 심층적인 이해---Array 2

NumPy 간결한 튜토리얼에 대한 심층적인 이해---Array 2

高洛峰원래의: 2017-02-23 16:53:541397검색

NumPy 배열(2. 배열 연산)

기본 연산

배열 연산은 요소별로 수행됩니다. 배열 작업은 작업 결과를 포함하는 새 배열을 만듭니다.

>>> a= np.array([20,30,40,50]) 
>>> b= np.arange( 4) 
>>> b 
array([0, 1, 2, 3]) 
>>> c= a-b 
>>> c 
array([20, 29, 38, 47]) 
>>> b**2 
array([0, 1, 4, 9]) 
>>> 10*np.sin(a) 
array([ 9.12945251,-9.88031624, 7.4511316, -2.62374854]) 
>>> a<35 
array([True, True, False, False], dtype=bool)

다른 행렬 언어와 달리 NumPy의 곱셈 연산자*는 요소별로 계산됩니다. 행렬 곱셈은 도트 함수를 사용하거나 행렬 객체를 생성하여 구현할 수 있습니다. (다음 장에서 소개합니다)

>>> A= np.array([[1,1], 
...[0,1]]) 
>>> B= np.array([[2,0], 
...[3,4]]) 
>>> A*B # 逐个元素相乘 
array([[2, 0], 
  　　 [0, 4]]) 
>>> np.dot(A,B) # 矩阵相乘 
array([[5, 4], 
  　　 [3, 4]])

+= 및 *=와 같은 일부 연산자는 새 배열을 생성하지 않고 기존 배열을 수정하는 데 사용됩니다.

>>> a= np.ones((2,3), dtype=int) 
>>> b= np.random.random((2,3)) 
>>> a*= 3 
>>> a 
array([[3, 3, 3], 
  　　 [3, 3, 3]]) 
>>> b+= a 
>>> b 
array([[ 3.69092703, 3.8324276, 3.0114541], 
  　　　 [ 3.18679111, 3.3039349, 3.37600289]]) 
>>> a+= b # b转换为整数类型 
>>> a 
array([[6, 6, 6], 
      [6, 6, 6]])

배열이 다른 유형의 요소를 저장할 때 배열은 더 많은 비트를 차지하는 데이터 유형을 자체 데이터 유형으로 사용합니다. 정확한 데이터 유형(이 동작을 업캐스트라고 함)

>>> a= np.ones(3, dtype=np.int32) 
>>> b= np.linspace(0,np.pi,3) 
>>> b.dtype.name 
&#39;float64&#39; 
>>> c= a+b 
>>> c 
array([ 1., 2.57079633, 4.14159265]) 
>>> c.dtype.name 
&#39;float64&#39; 
>>> d= exp(c*1j) 
>>> d 
array([ 0.54030231+0.84147098j,-0.84147098+0.54030231j, 
  　　　 -0.54030231-0.84147098j]) 
>>> d.dtype.name 
&#39;complex128&#39;

배열의 모든 요소의 합을 계산하는 등 배열이 아닌 많은 작업은 ndarray 클래스의 메서드로 구현됩니다. ndarray 클래스의 인스턴스가 필요합니다.

>>> a= np.random.random((2,3)) 
>>> a 
array([[ 0.65806048, 0.58216761, 0.59986935], 
      [ 0.6004008, 0.41965453, 0.71487337]]) 
>>> a.sum() 
　 3.5750261436902333 
>>> a.min() 
   0.41965453489104032 
>>> a.max() 
   0.71487337095581649

이러한 작업은 배열을 1차원 선형 목록으로 처리합니다. 그러나 축 매개변수(즉, 배열의 행)를 지정하여 지정된 축에서 해당 작업을 수행할 수 있습니다.

>>> b= np.arange(12).reshape(3,4) 
>>> b 
array([[ 0, 1, 2, 3], 
      [ 4, 5, 6, 7], 
      [ 8, 9, 10, 11]]) 
>>> b.sum(axis=0) # 计算每一列的和，注意理解轴的含义，参考数组的第一篇文章 
array([12, 15, 18, 21]) 
>>> b.min(axis=1) # 获取每一行的最小值 
array([0, 4, 8]) 
>>> b.cumsum(axis=1) # 计算每一行的累积和 
array([[ 0, 1, 3, 6], 
      [ 4, 9, 15, 22], 
      [ 8, 17, 27, 38]])

인덱싱 , 슬라이싱 및 반복

목록 및 기타 Python 시퀀스와 마찬가지로 1차원 배열도 인덱싱, 슬라이싱 및 반복이 가능합니다.

>>> a= np.arange(10)**3 #记住，操作符是对数组中逐元素处理的！ 
>>> a 
array([0, 1, 8, 27, 64, 125, 216, 343, 512, 729]) 
>>> a[2] 
8 
>>> a[2:5] 
array([ 8, 27, 64]) 
>>> a[:6:2]= -1000 # 等同于a[0:6:2]= -1000，从开始到第6个位置，每隔一个元素将其赋值为-1000 
>>> a 
array([-1000, 1,-1000, 27,-1000, 125, 216, 343, 512, 729]) 
>>> a[: :-1] # 反转a 
array([ 729, 512, 343, 216, 125,-1000, 27,-1000, 1,-1000]) 
>>>for i in a: 
...  print i**(1/3.), 
... 
nan 1.0 nan 3.0 nan 5.0 6.0 7.0 8.0 9.0

다차원 배열은 축당 하나의 인덱스를 가질 수 있습니다. 인덱스는 쉼표로 구분된 튜플로 제공됩니다.

>>>def f(x,y): 
...  return 10*x+y 
... 
>>> b= np.fromfunction(f,(5,4),dtype=int) #fromfunction是一个函数，下篇文章介绍。 
>>> b 
array([[ 0, 1, 2, 3], 
      [10, 11, 12, 13], 
      [20, 21, 22, 23], 
      [30, 31, 32, 33], 
      [40, 41, 42, 43]]) 
>>> b[2,3] 
23 
>>> b[0:5, 1] # 每行的第二个元素 
array([ 1, 11, 21, 31, 41]) 
>>> b[: ,1] # 与前面的效果相同 
array([ 1, 11, 21, 31, 41]) 
>>> b[1:3,: ] # 每列的第二和第三个元素 
array([[10, 11, 12, 13], 
      [20, 21, 22, 23]])

제공된 인덱스의 개수가 축의 개수보다 적을 경우, 주어진 값을 순위순으로 복사하며 누락된 인덱스는 기본값으로 설정 to는 전체 슬라이스입니다.

>>> b[-1] # 最后一行，等同于b[-1,:]，-1是第一个轴，而缺失的认为是：，相当于整个切片。 
array([40, 41, 42, 43])

b[i] 괄호 안의 표현식은 i와 일련의 :로 처리되어 나머지 축을 나타냅니다. NumPy를 사용하면 b[i,...]와 같은 "포인트"를 사용할 수도 있습니다.

점(…)은 완전한 인덱스 튜플을 생성하는 데 필요한 세미콜론 수를 나타냅니다. x가 랭크 5의 배열인 경우(즉, 5개의 축이 있음)

x[1,2,…]는 x[1,2,:,:와 동일합니다. ,:],
x[…,3]은 x[:,:,:,:,3]
x와 동일합니다. [ 4,…,5,:]는 x[4,:,:,5,:]

>>> c= array( [ [[ 0, 1, 2], #三维数组（两个2维数组叠加而成） 
...[ 10, 12, 13]], 
... 
...[[100,101,102], 
...[110,112,113]]] ) 
>>> c.shape 
 (2, 2, 3) 
>>> c[1,...] #等同于c[1,:,:]或c[1] 
array([[100, 101, 102], 
      [110, 112, 113]]) 
>>> c[...,2] #等同于c[:,:,2] 
array([[ 2, 13], 
      [102, 113]])

순회와 동일합니다. 다차원 배열의 첫 번째 축을 기준으로 합니다:

>>>for row in b: 
...  print row 
... 
[0 1 2 3] 
[10 11 12 13] 
[20 21 22 23] 
[30 31 32 33] 
[40 41 42 43]

배열의 각 요소를 처리하려면 flat 속성을 사용할 수 있습니다. 배열 요소 반복자입니다:

>>>for element in b.flat: 
...  print element, 
... 
0 1 2 3 10 11 12 13 20 21 22 23 30 31 32 33 40 41 42 43

모양 연산

배열 모양 변경

배열은 각 축의 요소 수에 따라 다릅니다.

>>> a= np.floor(10*np.random.random((3,4))) 
>>> a 
array([[ 7., 5., 9., 3.], 
      [ 7., 2., 7., 8.], 
      [ 6., 8., 3., 2.]]) 
>>> a.shape 
(3, 4)

를 사용할 수 있습니다. 모양 수정

>>> a.ravel() # 平坦化数组 
array([ 7., 5., 9., 3., 7., 2., 7., 8., 6., 8., 3., 2.]) 
>>> a.shape= (6, 2) 
>>> a.transpose() 
array([[ 7., 9., 7., 7., 6., 3.], 
      [ 5., 3., 2., 8., 8., 2.]])

ravel()에 의해 평면화된 배열 요소의 순서는 일반적으로 동작에 따라 "C 스타일"입니다. , 가장 오른쪽 인덱스가 가장 빠르게 변경되므로 요소 a[0,0] 뒤에 a[0,1]이 옵니다. 배열의 모양을 다른 모양으로 변경해도 배열은 여전히 "C 스타일"입니다. NumPy는 일반적으로 이 순서대로 데이터를 보유하는 배열을 생성하므로 ravel()은 일반적으로 호출 배열의 복사본을 생성할 필요가 없습니다. 그러나 배열이 다른 배열을 통해 분할되거나 특이한 옵션이 있는 경우 해당 배열의 복사본을 만들어야 할 수도 있습니다. 또한 일부 선택적 매개 변수 함수를 사용하여 reshape() 및 ravel()이 FORTRAN 스타일 배열을 구성하도록 할 수 있습니다. 즉, 가장 왼쪽 인덱스가 가장 빠르게 변경됩니다.

reshape 함수는 호출 배열의 모양을 변경하고 배열을 반환하는 반면, resize 함수는 호출 배열 자체를 변경합니다.

>>> a 
array([[ 7., 5.], 
      [ 9., 3.], 
      [ 7., 2.], 
      [ 7., 8.], 
      [ 6., 8.], 
      [ 3., 2.]]) 
>>> a.resize((2,6)) 
>>> a 
array([[ 7., 5., 9., 3., 7., 2.], 
      [ 7., 8., 6., 8., 3., 2.]])

reshape 작업에서 치수를 -1로 지정하면 실제 상황에 따라 정확한 치수가 계산됩니다

위 내용은 이 글의 전체 내용입니다. 모든 분들의 학습에 도움이 되기를 바랍니다.

NumPy의 간결한 튜토리얼을 더 깊이 이해하려면---Array 2 관련 기사를 PHP 중국어 웹사이트에 주목하세요!

성명：

이전 기사：NumPy 간결한 튜토리얼에 대한 심층적인 이해---배열 1다음 기사：NumPy 간결한 튜토리얼에 대한 심층적인 이해---배열 1