Rumah > Artikel > pembangunan bahagian belakang > Cara memilih versi numpy yang betul untuk mengoptimumkan aliran kerja sains data anda
Numpy ialah perpustakaan operasi matematik yang biasa digunakan dalam Python Ia menyediakan operasi tatasusunan yang berkuasa dan fungsi pengiraan berangka. Walau bagaimanapun, kerana versi numpy sentiasa dikemas kini, cara pengguna memilih versi yang sesuai telah menjadi isu penting. Memilih versi numpy yang betul boleh mengoptimumkan aliran kerja sains data anda dan meningkatkan kebolehselenggaraan dan kebolehbacaan kod anda. Artikel ini akan memperkenalkan cara memilih versi numpy dan menyediakan contoh kod sebenar untuk rujukan pembaca.
1 Fahami ciri-ciri pelbagai versi numpy
Pustaka numpy dikemas kini dengan cepat, dan versi terkini ialah 1.21.2. Apabila menggunakan numpy, memahami perubahan dan ciri antara versi berbeza boleh membantu kami memilih versi numpy yang sesuai dan meningkatkan kecekapan dan kebolehselenggaraan kod. Versi utama numpy termasuk 1.11, 1.12, 1.13, 1.14, 1.15, 1.16, 1.17, 1.18, 1.19, 1.20 dan 1.21. Perubahan utama antara versi berbeza ialah:
Ciri versi
1.11 - Memperkenalkan fungsi np.random.choice
dan np.random.permutation
np.random.choice
和np.random.permutation
函数
np.histogramdd
函数np.isclose
函数np.matmul
函数np.loadtxt
和np.genfromtxt
函数np.piecewise
函数np.stack
函数np.moveaxis
函数np.copyto
函数np.count_nonzero
和np.bincount
函数np.compress
函数np.isin
函数np.promote_types
函数np.histogram_bin_edges
函数np.searchsorted
函数np.unique
函数的性能np.linalg.lstsq
函数的rcond
参数np.cell
函数np.format_float_positional
函数从上表可以看出,numpy的每个版本都有不同的变化和优化。在选择numpy版本时,需要结合具体需求和使用场景,选择相应版本。如果需要使用某个新特性或者解决某个特定问题,可以选择较新的版本。如果考虑稳定性和向下兼容性,可以选择较旧的版本。
2.如何更换numpy版本
在Python中,可以使用pip命令安装和更换numpy版本。以下是更换numpy版本的步骤:
!pip list | grep numpy
输出:
numpy 1.19.5
该结果显示当前安装的numpy版本为1.19.5。
# 卸载numpy !pip uninstall -y numpy # 安装新的numpy版本 !pip install numpy==1.20
在代码中numpy==1.20
表示安装1.20版本,读者可以根据需要选择合适版本号进行安装。
3.使用numpy的优化技巧
除了选择合适的numpy版本之外,针对具体的数据科学问题,还可以采用一些numpy的优化技巧,提高代码的效率和可读性。以下是几个实用的numpy优化技巧的示例:
(1) 使用numpy的向量化计算
numpy使得向量化计算变得非常容易。处理大量数据时,使用向量化计算比逐个元素地循环计算更快。以下是一个例子,实现对两个数组的逐个元素求和:
import numpy as np # 生成两个向量 a = np.array([1,2,3,4]) b = np.array([5,6,7,8]) # 使用循环计算元素和 c = np.zeros(len(a)) for i in range(len(a)): c[i] = a[i] + b[i] # 使用向量化计算元素和 d = a + b # 输出结果 print(c) # [ 6. 8. 10. 12.] print(d) # [ 6 8 10 12]
从上例可以看出,使用向量化计算可以大大简化代码,同时提高效率。
(2) 使用numpy的广播功能
numpy的广播(broadcast)功能是一种非常强大的工具,它可以让不同形状的数组之间进行数学计算。广播的规则可以使得一些计算变得非常简单。下面是一个例子,实现两个形状不同的数组的相加:
import numpy as np # 生成两个数组 a = np.array([[ 0.0, 0.0, 0.0], [10.0, 10.0, 10.0], [20.0, 20.0, 20.0], [30.0, 30.0, 30.0]]) b = np.array([1.0, 2.0, 3.0]) # 使用广播计算元素和 c = a + b # 输出结果 print(c)
该代码片段将数字1、2和3视为一个列向量,将其与a
np.histogramdd
1.13 - Memperkenalkan sokongan untuk versi UMFPACK yang dipertingkat
np.icloseFungsi
np.matmulFungsi berbilang benang
np.loadtxt
dan np.genfromtxt
yang dipertingkatkannp .piecewise
np.stack
fungsinp.moveaxis
np.copyto
np.count_nonzero
dan np.bincount
🎜1.19 - Memperkenalkan np. fungsi compress
li>np.isin
np.promote_types
🎜1.20 - Diperkenalkan np.histogram_bin_edges
Fungsinp.searchsorted
np.unique
fungsi 🎜1.21 - diperkenalkan Menambah parameter rcond
bagi fungsi np.linalg.lstsq
np.cell
functionnp.format_float_positional
import numpy as np # 生成一个数组 a = np.array([[ 0, 1, 2, 3], [10, 11, 12, 13], [20, 21, 22, 23], [30, 31, 32, 33], [40, 41, 42, 43]]) # 切片选择子数组 b = a[:, 1:3] # 输出子数组 print(b)🎜Output: 🎜
[[ 1 2] [11 12] [21 22] [31 32] [41 42]]🎜Hasilnya menunjukkan bahawa versi numpy yang sedang dipasang ialah 1.19.5. 🎜
import numpy as np # 生成一个数组 a = np.array([[ 0, 1, 2, 3], [10, 11, 12, 13], [20, 21, 22, 23], [30, 31, 32, 33], [40, 41, 42, 43]]) # 使用索引选择特定元素 b = a[[0, 1, 2, 3], [1, 2, 3, 0]] # 输出选中的元素 print(b)🎜Dalam kod,
numpy==1.20
bermaksud memasang versi 1.20. Pembaca boleh memilih nombor versi yang sesuai pasang mengikut keperluan mereka. 🎜🎜3. Gunakan teknik pengoptimuman numpy🎜🎜Selain memilih versi numpy yang sesuai, anda juga boleh menggunakan beberapa teknik pengoptimuman numpy untuk meningkatkan kecekapan dan kebolehbacaan kod untuk masalah sains data tertentu. Berikut ialah beberapa contoh teknik pengoptimuman numpy praktikal: 🎜🎜(1) Menggunakan pengiraan vektor numpy🎜🎜numpy menjadikan pengiraan vektor sangat mudah. Apabila bekerja dengan jumlah data yang besar, pengiraan bervektor lebih pantas daripada menggelung elemen satu demi satu. Berikut ialah contoh untuk melaksanakan penjumlahan elemen demi elemen bagi dua tatasusunan: 🎜[ 1 12 23 30]🎜 Seperti yang dapat dilihat daripada contoh di atas, menggunakan pengiraan vektor boleh memudahkan kod dan meningkatkan kecekapan pada masa yang sama. 🎜🎜(2) Gunakan fungsi siaran numpy🎜🎜Fungsi siaran numpy ialah alat yang sangat berkuasa yang membolehkan pengiraan matematik dilakukan antara tatasusunan bentuk yang berbeza. Peraturan penyiaran boleh membuat beberapa pengiraan sangat mudah. Berikut ialah contoh menambah dua tatasusunan bentuk yang berbeza: 🎜rrreee🎜Coretan kod ini merawat nombor 1, 2 dan 3 sebagai vektor lajur, menambahkannya pada setiap tatasusunan
a
: Tambahkan satu baris pada satu masa. Mekanisme penyiaran membolehkan numpy membuat kesimpulan secara automatik yang paksi untuk melaksanakan operasi penyiaran, menjadikan pengiraan sangat mudah. 🎜🎜(3) Gunakan fungsi penghirisan dan pengindeksan numpy🎜numpy提供了切片和索引的功能,使得对数组中特定元素的访问变得非常方便。例如,如果想要选择数组中的一个子集,可以使用切片:
import numpy as np # 生成一个数组 a = np.array([[ 0, 1, 2, 3], [10, 11, 12, 13], [20, 21, 22, 23], [30, 31, 32, 33], [40, 41, 42, 43]]) # 切片选择子数组 b = a[:, 1:3] # 输出子数组 print(b)
该代码片段选择了数组a
中第2列和第3列的所有行作为子数组,结果如下:
[[ 1 2] [11 12] [21 22] [31 32] [41 42]]
除了切片,numpy还提供了强大的索引功能,可以使用它来选择特定的元素或子数组:
import numpy as np # 生成一个数组 a = np.array([[ 0, 1, 2, 3], [10, 11, 12, 13], [20, 21, 22, 23], [30, 31, 32, 33], [40, 41, 42, 43]]) # 使用索引选择特定元素 b = a[[0, 1, 2, 3], [1, 2, 3, 0]] # 输出选中的元素 print(b)
该代码片段选择了数组a
中的4个元素,分别是(0,1)、(1,2)、(2,3)和(3,0),结果如下:
[ 1 12 23 30]
4.结语
选择合适的numpy版本和使用优化技巧是提高数据科学工作效率的有效方法。通过与具体的场景结合,使用numpy的向量化计算、广播、切片和索引等优化技巧,能够简化代码、提高效率、降低资源消耗。读者可以基于本文提供的实际代码示例,进一步探索numpy的强大功能。
Atas ialah kandungan terperinci Cara memilih versi numpy yang betul untuk mengoptimumkan aliran kerja sains data anda. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!