Rumah >pembangunan bahagian belakang >Tutorial Python >Bermula dengan Python untuk Pembelajaran Mesin
Kepopularan Python dalam Pembelajaran Mesin (ML) berpunca daripada kemudahan penggunaan, fleksibiliti dan sokongan perpustakaan yang meluas. Panduan ini menyediakan pengenalan asas untuk menggunakan Python untuk ML, meliputi perpustakaan penting dan menunjukkan binaan model mudah.
Penguasaan Python dalam bidang ML adalah disebabkan oleh beberapa kelebihan utama:
Python menawarkan alatan yang komprehensif untuk setiap peringkat proses ML, daripada analisis data kepada penggunaan model.
Sebelum memulakan perjalanan ML anda, biasakan diri anda dengan perpustakaan Python yang penting ini:
NumPy: Asas pengkomputeran berangka dalam Python. Menyediakan sokongan untuk tatasusunan, matriks dan fungsi matematik.
Panda: Pustaka yang berkuasa untuk manipulasi dan analisis data. Struktur DataFramenya memudahkan kerja dengan data berstruktur.
Scikit-learn: Pustaka ML yang paling banyak digunakan dalam Python. Menawarkan alatan yang cekap untuk perlombongan dan analisis data, termasuk algoritma untuk pengelasan, regresi dan pengelompokan.
Pasang perpustakaan yang diperlukan menggunakan pip:
<code class="language-bash">pip install numpy pandas scikit-learn</code>
Setelah dipasang, anda sudah bersedia untuk memulakan pengekodan.
Mari bina model ML asas menggunakan set data Iris, yang mengelaskan spesies iris berdasarkan ukuran kelopak.
Langkah 1: Import Perpustakaan
Import perpustakaan yang diperlukan:
<code class="language-python">import numpy as np import pandas as pd from sklearn.datasets import load_iris from sklearn.model_selection import train_test_split from sklearn.ensemble import RandomForestClassifier from sklearn.metrics import accuracy_score</code>
Langkah 2: Muatkan Set Data
Muatkan set data Iris menggunakan Scikit-learn:
<code class="language-python"># Load the Iris dataset iris = load_iris() # Convert to a Pandas DataFrame data = pd.DataFrame(iris.data, columns=iris.feature_names) data['species'] = iris.target</code>
Langkah 3: Penerokaan Data
Analisis data:
<code class="language-python"># Display initial rows print(data.head()) # Check for missing values print(data.isnull().sum()) # Summary statistics print(data.describe())</code>
Langkah 4: Penyediaan Data
Asingkan ciri (X) dan label (y), dan bahagikan data kepada set latihan dan ujian:
<code class="language-python"># Features (X) and labels (y) X = data.drop('species', axis=1) y = data['species'] # Train-test split X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)</code>
Langkah 5: Latihan Model
Latih pengelas Hutan Rawak:
<code class="language-bash">pip install numpy pandas scikit-learn</code>
Langkah 6: Ramalan dan Penilaian
Buat ramalan dan nilaikan ketepatan model:
<code class="language-python">import numpy as np import pandas as pd from sklearn.datasets import load_iris from sklearn.model_selection import train_test_split from sklearn.ensemble import RandomForestClassifier from sklearn.metrics import accuracy_score</code>
Tahniah! Anda telah membuat model ML pertama anda. Untuk melanjutkan pembelajaran anda:
Atas ialah kandungan terperinci Bermula dengan Python untuk Pembelajaran Mesin. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!