Memahami astype() dalam Python
Fungsi astype() ialah kaedah yang berkuasa dalam Python, terutamanya digunakan dalam pustaka pandas untuk menukar lajur atau set data dalam DataFrame atau Siri kepada jenis data tertentu. Ia juga tersedia dalam NumPy untuk menghantar elemen tatasusunan kepada jenis yang berbeza.
Penggunaan Asas astype()
Fungsi astype() digunakan untuk menghantar jenis data objek panda (seperti Siri atau DataFrame) atau tatasusunan NumPy ke dalam jenis lain.
Sintaks untuk panda:
DataFrame.astype(dtype, copy=True, errors='raise')
Sintaks untuk NumPy:
ndarray.astype(dtype, order='K', casting='unsafe', subok=True, copy=True)
Parameter Utama
1. dtype
Jenis data sasaran yang anda ingin tukarkan data. Ini boleh ditentukan menggunakan:
- Satu jenis (cth., float, int, str).
- Kamus memetakan nama lajur kepada jenis (untuk DataFrames panda).
2. salinan (panda dan NumPy)
- Lalai: Betul
- Tujuan: Sama ada hendak mengembalikan salinan data asal (jika Benar) atau mengubah suainya di tempatnya (jika Salah).
3. ralat (panda sahaja)
-
Pilihan:
- 'naikkan' (lalai): Naikkan ralat jika penukaran gagal.
- 'abaikan': Abaikan ralat secara senyap.
4. pesanan (NumPy sahaja)
- Mengawal susun atur memori tatasusunan output. Pilihan:
- 'C': C-pesanan bersebelahan.
- 'F': Perintah bersebelahan Fortran.
- 'A': Gunakan perintah Fortran jika input adalah Fortran-bersambung, jika tidak, pesanan C.
- 'K': Padankan reka letak tatasusunan input.
5. pemutus (NumPy sahaja)
- Mengawal tingkah laku pemutus:
- 'tidak': Tiada penghantaran dibenarkan.
- 'equiv': Hanya perubahan tertib bait dibenarkan.
- 'selamat': Hanya hantaran yang mengekalkan nilai dibenarkan.
- 'same_kind': Hanya cast atau cast yang selamat dalam jenis (cth., float -> int) dibenarkan.
- 'tidak selamat': Sebarang penukaran data dibenarkan.
6. subok (NumPy sahaja)
- Jika Benar, subkelas dilalui; jika Salah, tatasusunan yang dikembalikan akan menjadi tatasusunan kelas asas.
Contoh
1. Penukaran Asas dalam panda
import pandas as pd # Example DataFrame df = pd.DataFrame({'A': ['1', '2', '3'], 'B': [1.5, 2.5, 3.5]}) # Convert column 'A' to integer df['A'] = df['A'].astype(int) print(df.dtypes)
Output:
A int64 B float64 dtype: object
2. Pemetaan Kamus untuk Berbilang Lajur
# Convert multiple columns df = df.astype({'A': float, 'B': int}) print(df.dtypes)
Output:
DataFrame.astype(dtype, copy=True, errors='raise')
3. Menggunakan errors='ignore'
ndarray.astype(dtype, order='K', casting='unsafe', subok=True, copy=True)
Output:
import pandas as pd # Example DataFrame df = pd.DataFrame({'A': ['1', '2', '3'], 'B': [1.5, 2.5, 3.5]}) # Convert column 'A' to integer df['A'] = df['A'].astype(int) print(df.dtypes)
- Penukaran gagal untuk 'dua', tetapi tiada ralat dibangkitkan.
4. Menggunakan astype() dalam NumPy
A int64 B float64 dtype: object
Output:
# Convert multiple columns df = df.astype({'A': float, 'B': int}) print(df.dtypes)
5. Menghantar dalam NumPy dengan casting='safe'
A float64 B int64 dtype: object
Output:
df = pd.DataFrame({'A': ['1', 'two', '3'], 'B': [1.5, 2.5, 3.5]}) # Attempt conversion with errors='ignore' df['A'] = df['A'].astype(int, errors='ignore') print(df)
6. Mengendalikan Jenis Bukan Berangka dalam panda
A B 0 1 1.5 1 two 2.5 2 3 3.5
Output:
import numpy as np # Example array arr = np.array([1.1, 2.2, 3.3]) # Convert to integer arr_int = arr.astype(int) print(arr_int)
7. Pengoptimuman Memori Menggunakan astype()
Kod:
[1 2 3]
Output:
Sebelum Pengoptimuman (Penggunaan Memori Asal):
arr = np.array([1.1, 2.2, 3.3]) # Attempt an unsafe conversion try: arr_str = arr.astype(str, casting='safe') except TypeError as e: print(e)
Selepas Pengoptimuman (Penggunaan Memori Dioptimumkan):
Cannot cast array data from dtype('float64') to dtype('<u32 according to the rule> <hr> <h3> <strong>Penjelasan:</strong> </h3> <ul> <li> <p><strong>Penggunaan Memori Asal:</strong></p> <ul> <li>Lajur A sebagai int64 menggunakan 24 bait (8 bait setiap elemen × 3 elemen).</li> <li>Lajur B sebagai float64 menggunakan 24 bait (8 bait setiap elemen × 3 elemen).</li> </ul> </li> <li> <p><strong>Penggunaan Memori Dioptimumkan:</strong></p> <ul> <li>Lajur A sebagai int8 menggunakan 3 bait (1 bait setiap elemen × 3 elemen).</li> <li>Lajur B sebagai float32 menggunakan 12 bait (4 bait setiap elemen × 3 elemen).</li> </ul> </li> </ul> <h2> Penggunaan memori dikurangkan dengan ketara dengan menggunakan jenis data yang lebih kecil, terutamanya apabila bekerja dengan set data yang besar. </h2> <h3> <strong>Perangkap Biasa</strong> </h3> <ol> <li> <strong>Penukaran Tidak Sah</strong>: Menukar jenis yang tidak serasi (cth., rentetan kepada jenis angka apabila nilai bukan angka wujud). </li> </ol> <pre class="brush:php;toolbar:false">df = pd.DataFrame({'A': ['2022-01-01', '2023-01-01'], 'B': ['True', 'False']}) # Convert to datetime and boolean df['A'] = pd.to_datetime(df['A']) df['B'] = df['B'].astype(bool) print(df.dtypes)
Ralat Senyap dengan ralat='ignore': Gunakan dengan berhati-hati kerana ia mungkin gagal untuk menukar secara senyap.
Kehilangan Ketepatan: Menukar daripada jenis ketepatan lebih tinggi (cth., float64) kepada jenis ketepatan lebih rendah (cth., float32).
Contoh Terperinci
1. Penghantaran Jenis Data Kompleks
A datetime64[ns] B bool dtype: object
Output:
import pandas as pd # Original DataFrame df = pd.DataFrame({'A': [1, 2, 3], 'B': [1.1, 2.2, 3.3]}) print("Original memory usage:") print(df.memory_usage()) # Downcast numerical types df['A'] = df['A'].astype('int8') df['B'] = df['B'].astype('float32') print("Optimized memory usage:") print(df.memory_usage())
2. Menggunakan astype() dalam NumPy untuk Tatasusunan Berstruktur
Index 128 A 24 B 24 dtype: int64
Output:
DataFrame.astype(dtype, copy=True, errors='raise')
Ringkasan
Fungsi astype() ialah alat serba boleh untuk penukaran jenis data dalam kedua-dua panda dan NumPy. Ia membenarkan kawalan terperinci ke atas tingkah laku penghantaran, pengoptimuman memori dan pengendalian ralat. Penggunaan parameternya yang betul, seperti ralat dalam panda dan penghantaran dalam NumPy, memastikan transformasi jenis data yang mantap dan cekap.
Atas ialah kandungan terperinci Apakah fungsi astype() dalam Python. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Tutorial ini menunjukkan cara menggunakan Python untuk memproses konsep statistik undang -undang ZIPF dan menunjukkan kecekapan membaca dan menyusun fail teks besar Python semasa memproses undang -undang. Anda mungkin tertanya -tanya apa maksud pengedaran ZIPF istilah. Untuk memahami istilah ini, kita perlu menentukan undang -undang Zipf. Jangan risau, saya akan cuba memudahkan arahan. Undang -undang Zipf Undang -undang Zipf hanya bermaksud: Dalam korpus bahasa semulajadi yang besar, kata -kata yang paling kerap berlaku muncul kira -kira dua kali lebih kerap sebagai kata -kata kerap kedua, tiga kali sebagai kata -kata kerap ketiga, empat kali sebagai kata -kata kerap keempat, dan sebagainya. Mari kita lihat contoh. Jika anda melihat corpus coklat dalam bahasa Inggeris Amerika, anda akan melihat bahawa perkataan yang paling kerap adalah "th

Artikel ini menerangkan cara menggunakan sup yang indah, perpustakaan python, untuk menghuraikan html. Ia memperincikan kaedah biasa seperti mencari (), find_all (), pilih (), dan get_text () untuk pengekstrakan data, pengendalian struktur dan kesilapan HTML yang pelbagai, dan alternatif (sel

Berurusan dengan imej yang bising adalah masalah biasa, terutamanya dengan telefon bimbit atau foto kamera resolusi rendah. Tutorial ini meneroka teknik penapisan imej di Python menggunakan OpenCV untuk menangani isu ini. Penapisan Imej: Alat yang berkuasa Penapis Imej

Artikel ini membandingkan tensorflow dan pytorch untuk pembelajaran mendalam. Ia memperincikan langkah -langkah yang terlibat: penyediaan data, bangunan model, latihan, penilaian, dan penempatan. Perbezaan utama antara rangka kerja, terutamanya mengenai grap pengiraan

Python, kegemaran sains dan pemprosesan data, menawarkan ekosistem yang kaya untuk pengkomputeran berprestasi tinggi. Walau bagaimanapun, pengaturcaraan selari dalam Python memberikan cabaran yang unik. Tutorial ini meneroka cabaran -cabaran ini, memberi tumpuan kepada Interprete Global

Tutorial ini menunjukkan mewujudkan struktur data saluran paip tersuai di Python 3, memanfaatkan kelas dan pengendali yang berlebihan untuk fungsi yang dipertingkatkan. Fleksibiliti saluran paip terletak pada keupayaannya untuk menggunakan siri fungsi ke set data, GE

Serialization dan deserialization objek Python adalah aspek utama dari mana-mana program bukan remeh. Jika anda menyimpan sesuatu ke fail python, anda melakukan siri objek dan deserialization jika anda membaca fail konfigurasi, atau jika anda menjawab permintaan HTTP. Dalam erti kata, siri dan deserialization adalah perkara yang paling membosankan di dunia. Siapa yang peduli dengan semua format dan protokol ini? Anda mahu berterusan atau mengalirkan beberapa objek python dan mengambilnya sepenuhnya pada masa yang akan datang. Ini adalah cara yang baik untuk melihat dunia pada tahap konseptual. Walau bagaimanapun, pada tahap praktikal, skim siri, format atau protokol yang anda pilih boleh menentukan kelajuan, keselamatan, kebebasan status penyelenggaraan, dan aspek lain dari program

Modul Statistik Python menyediakan keupayaan analisis statistik data yang kuat untuk membantu kami dengan cepat memahami ciri -ciri keseluruhan data, seperti biostatistik dan analisis perniagaan. Daripada melihat titik data satu demi satu, cuma melihat statistik seperti min atau varians untuk menemui trend dan ciri dalam data asal yang mungkin diabaikan, dan membandingkan dataset besar dengan lebih mudah dan berkesan. Tutorial ini akan menjelaskan cara mengira min dan mengukur tahap penyebaran dataset. Kecuali dinyatakan sebaliknya, semua fungsi dalam modul ini menyokong pengiraan fungsi min () dan bukan hanya menjumlahkan purata. Nombor titik terapung juga boleh digunakan. Import secara rawak Statistik import dari fracti


Alat AI Hot

Undresser.AI Undress
Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover
Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool
Gambar buka pakaian secara percuma

Clothoff.io
Penyingkiran pakaian AI

AI Hentai Generator
Menjana ai hentai secara percuma.

Artikel Panas

Alat panas

mPDF
mPDF ialah perpustakaan PHP yang boleh menjana fail PDF daripada HTML yang dikodkan UTF-8. Pengarang asal, Ian Back, menulis mPDF untuk mengeluarkan fail PDF "dengan cepat" dari tapak webnya dan mengendalikan bahasa yang berbeza. Ia lebih perlahan dan menghasilkan fail yang lebih besar apabila menggunakan fon Unicode daripada skrip asal seperti HTML2FPDF, tetapi menyokong gaya CSS dsb. dan mempunyai banyak peningkatan. Menyokong hampir semua bahasa, termasuk RTL (Arab dan Ibrani) dan CJK (Cina, Jepun dan Korea). Menyokong elemen peringkat blok bersarang (seperti P, DIV),

SublimeText3 versi Inggeris
Disyorkan: Versi Win, menyokong gesaan kod!

Dreamweaver Mac版
Alat pembangunan web visual

Muat turun versi mac editor Atom
Editor sumber terbuka yang paling popular

Hantar Studio 13.0.1
Persekitaran pembangunan bersepadu PHP yang berkuasa
