Cara menggunakan perpustakaan pembelajaran mesin belajar scikit dalam Python.-Tutorial Python-php.cn

Rumah

pembangunan bahagian belakang

Tutorial Python

Cara menggunakan perpustakaan pembelajaran mesin belajar scikit dalam Python.

PHPz

Apr 22, 2023 pm 10:31 PM

pythonscikit-learn

Kata Pengantar

scikit-learn ialah salah satu perpustakaan pembelajaran mesin paling popular dalam Python Ia menyediakan pelbagai algoritma dan alatan pembelajaran mesin, termasuk pengelasan, regresi, pengelompokan, pengurangan dimensi, dsb.

Kelebihan scikit-learn ialah:

Mudah digunakan: Antara muka scikit-learn adalah ringkas dan mudah difahami, membolehkan pengguna memulakan dengan mudah pembelajaran mesin. API Bersepadu: API scikit-learn sangat bersatu, dan kaedah menggunakan pelbagai algoritma pada asasnya adalah sama, menjadikan pembelajaran dan penggunaan lebih mudah.
Sebilangan besar algoritma pembelajaran mesin telah dilaksanakan: scikit-learn melaksanakan pelbagai algoritma pembelajaran mesin klasik dan menyediakan pelbagai alatan dan fungsi, menjadikan penyahpepijatan dan pengoptimuman algoritma lebih mudah .
Sumber terbuka dan percuma: scikit-learn adalah sumber terbuka sepenuhnya dan percuma, dan sesiapa sahaja boleh menggunakan dan mengubah suai kodnya.
Cekap dan stabil: scikit-learn melaksanakan pelbagai algoritma pembelajaran mesin yang cekap, boleh mengendalikan set data berskala besar dan berprestasi baik dari segi kestabilan dan kebolehpercayaan. scikit-learn sangat sesuai untuk pembelajaran mesin peringkat permulaan kerana API sangat bersatu dan modelnya agak mudah. Cadangan saya di sini adalah untuk mengkaji bersama dengan dokumentasi rasmi, yang bukan sahaja memperkenalkan skop penggunaan setiap model tetapi juga menyediakan sampel kod.

Model Regresi Linear-Regression Linear

Model Regresi Linear ialah model berdasarkan regresi linear dan sesuai untuk menyelesaikan masalah ramalan pembolehubah berterusan. Idea asas model ini adalah untuk mewujudkan persamaan linear, memodelkan hubungan antara pembolehubah bebas dan pembolehubah bersandar sebagai garis lurus, dan menggunakan data latihan untuk menyesuaikan garis lurus untuk mencari pekali persamaan linear, dan kemudian gunakan persamaan ini untuk menguji data untuk ramalan.

Model LinearRegression sesuai untuk masalah di mana terdapat hubungan linear antara pembolehubah bebas dan pembolehubah bersandar, seperti ramalan harga perumahan, ramalan jualan, ramalan tingkah laku pengguna, dll. Sudah tentu, apabila hubungan antara pembolehubah bebas dan pembolehubah bersandar adalah tidak linear, prestasi model LinearRegression akan menjadi lemah. Pada masa ini, regresi polinomial, regresi rabung, regresi Lasso dan kaedah lain boleh digunakan untuk menyelesaikan masalah.

Sediakan set data

Selepas mengetepikan pengaruh faktor lain, terdapat hubungan linear tertentu antara masa pembelajaran dan prestasi pembelajaran Sudah tentu, masa pembelajaran di sini merujuk kepada pembelajaran yang berkesan masa, prestasi Apabila masa belajar meningkat, gred juga akan meningkat. Jadi kami menyediakan set data masa belajar dan gred. Beberapa data dalam set data adalah seperti berikut:

Masa pembelajaran, markah
0.5,15
0.75,23
1.0,14
1.25,42
1.5,21
1.75,28
1.75,35
2.0,51
2.25,61
2.5,49

untuk menentukan jumlah ciri Matlamat

Antara masa belajar dan gred, masa belajar ialah ciri, iaitu pembolehubah bebas ialah label, iaitu pembolehubah bersandar, jadi kita perlu mengekstrak ciri dan label daripada set data masa belajar dan gred yang disediakan.

Bahagikan set latihan dan set ujian

import pandas as pd
import numpy as np
from sklearn.metrics import r2_score, mean_squared_error
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
# 读取学习时间和成绩CSV数据文件
data = pd.read_csv(&#39;data/study_time_score.csv&#39;)
# 提取数据特征学习时间
X = data[&#39;学习时间&#39;]
# 提取数据目标(标签)分数
Y = data[&#39;分数&#39;]

Selepas data ciri dan label disediakan, gunakan LinearRegression scikit-learn untuk latihan dan bahagikan set data kepada set latihan dan set ujian.

Pilih model dan muatkan data

"""
将特征数据和目标数据划分为测试集和训练集
通过test_size=0.25将百分之二十五的数据划分为测试集
"""
X_train, X_test, Y_train, Y_test = train_test_split(X, Y, test_size=0.25, random_state=0)
x_train = X_train.values.reshape(-1, 1)
model.fit(x_train, Y_train)

Selepas menyediakan set ujian dan set latihan, kita boleh memilih model yang sesuai untuk muat set latihan supaya kita boleh meramal Cari matlamat sepadan dengan ciri lain

Dapatkan parameter model

# 选择模型，选择模型为LinearRegression
model = LinearRegression()
# Scikit-learn中，机器学习模型的输入必须是一个二维数组。我们需要将一维数组转换为二维数组，才能在模型中使用。
x_train = X_train.values.reshape(-1, 1)
# 进行拟合
model.fit(x_train, Y_train)

Memandangkan set data hanya mengandungi dua masa dan gred pembelajaran, ia adalah model linear yang sangat mudah, dan formula matematik di belakangnya ialah y=ax+b, di mana pembolehubah bersandar y ialah gred, dan pembolehubah tidak bersandar x ialah masa belajar.

Backtest

"""
输出模型关键参数
Intercept: 截距 即b
Coefficients: 变量权重 即a
"""
print(&#39;Intercept:&#39;, model.intercept_)
print(&#39;Coefficients:&#39;, model.coef_)

Model pemasangan di atas hanya menggunakan data set ujian Seterusnya, kita perlu menggunakan data set ujian untuk menjalankan ujian belakang pada pemasangan model set latihan untuk mensimulasikan Selepas menggabungkan, kita boleh meramalkan set ujian ciri Dengan membandingkan hasil ramalan sasaran yang diperolehi dengan nilai sasaran sebenar, kita boleh memperoleh tahap kesesuaian model.

# 转换为n行1列的二维数组
x_test = X_test.values.reshape(-1, 1)
# 在测试集上进行预测并计算评分
Y_pred = model.predict(x_test)
# 打印测试特征数据
print(x_test)
# 打印特征数据对应的预测结果
print(Y_pred)
# 将预测结果与原特征数据对应的实际目标值进行比较，从而获得模型拟合度
# R2 (R-squared)：模型拟合优度，取值范围在0~1之间，越接近1表示模型越好的拟合了数据。
print("R2:", r2_score(Y_test, Y_pred))

Keputusan ramalan:

[. 47.43726068 33.05457106 49.83437561 63.41802692 41.84399249 37.84880 093 63.41802692 42.6430308 21.86803469 69.81033341 7 77.80071653 28.26034119 13.87765157 61.81995029 90.58532953 77.80071653 3 6.25072431 >R2: 0.8935675710322939

Atas ialah kandungan terperinci Cara menggunakan perpustakaan pembelajaran mesin belajar scikit dalam Python.. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan

Artikel ini dikembalikan pada:亿速云. Jika ada pelanggaran, sila hubungi admin@php.cn Padam

Artikel Berkaitan

Tujuan utama python: fleksibiliti dan kemudahan penggunaanApr 17, 2025 am 12:14 AM

Fleksibiliti Python dicerminkan dalam sokongan multi-paradigma dan sistem jenis dinamik, sementara kemudahan penggunaan berasal dari sintaks mudah dan perpustakaan standard yang kaya. 1. Fleksibiliti: Menyokong pengaturcaraan berorientasikan objek, fungsional dan prosedur, dan sistem jenis dinamik meningkatkan kecekapan pembangunan. 2. Kemudahan Penggunaan: Tatabahasa adalah dekat dengan bahasa semulajadi, perpustakaan standard merangkumi pelbagai fungsi, dan memudahkan proses pembangunan.

Python: Kekuatan pengaturcaraan serba bolehApr 17, 2025 am 12:09 AM

Python sangat disukai kerana kesederhanaan dan kuasa, sesuai untuk semua keperluan dari pemula hingga pemaju canggih. Kepelbagaiannya dicerminkan dalam: 1) mudah dipelajari dan digunakan, sintaks mudah; 2) perpustakaan dan kerangka yang kaya, seperti numpy, panda, dan sebagainya; 3) sokongan silang platform, yang boleh dijalankan pada pelbagai sistem operasi; 4) Sesuai untuk tugas skrip dan automasi untuk meningkatkan kecekapan kerja.

Belajar python dalam 2 jam sehari: panduan praktikalApr 17, 2025 am 12:05 AM

Ya, pelajari Python dalam masa dua jam sehari. 1. Membangunkan pelan kajian yang munasabah, 2. Pilih sumber pembelajaran yang betul, 3 menyatukan pengetahuan yang dipelajari melalui amalan. Langkah -langkah ini dapat membantu anda menguasai Python dalam masa yang singkat.

Python vs C: Pro and Cons untuk PemajuApr 17, 2025 am 12:04 AM

Python sesuai untuk pembangunan pesat dan pemprosesan data, manakala C sesuai untuk prestasi tinggi dan kawalan asas. 1) Python mudah digunakan, dengan sintaks ringkas, dan sesuai untuk sains data dan pembangunan web. 2) C mempunyai prestasi tinggi dan kawalan yang tepat, dan sering digunakan dalam pengaturcaraan permainan dan sistem.

Python: komitmen masa dan kadar pembelajaranApr 17, 2025 am 12:03 AM

Masa yang diperlukan untuk belajar python berbeza dari orang ke orang, terutamanya dipengaruhi oleh pengalaman pengaturcaraan sebelumnya, motivasi pembelajaran, sumber pembelajaran dan kaedah, dan irama pembelajaran. Tetapkan matlamat pembelajaran yang realistik dan pelajari terbaik melalui projek praktikal.

Python: Automasi, skrip, dan pengurusan tugasApr 16, 2025 am 12:14 AM

Python cemerlang dalam automasi, skrip, dan pengurusan tugas. 1) Automasi: Sandaran fail direalisasikan melalui perpustakaan standard seperti OS dan Shutil. 2) Penulisan Skrip: Gunakan Perpustakaan Psutil untuk memantau sumber sistem. 3) Pengurusan Tugas: Gunakan perpustakaan jadual untuk menjadualkan tugas. Kemudahan penggunaan Python dan sokongan perpustakaan yang kaya menjadikannya alat pilihan di kawasan ini.

Python dan Masa: Memanfaatkan masa belajar andaApr 14, 2025 am 12:02 AM

Untuk memaksimumkan kecekapan pembelajaran Python dalam masa yang terhad, anda boleh menggunakan modul, masa, dan modul Python. 1. Modul DateTime digunakan untuk merakam dan merancang masa pembelajaran. 2. Modul Masa membantu menetapkan kajian dan masa rehat. 3. Modul Jadual secara automatik mengatur tugas pembelajaran mingguan.

Python: Permainan, GUI, dan banyak lagiApr 13, 2025 am 12:14 AM

Python cemerlang dalam permainan dan pembangunan GUI. 1) Pembangunan permainan menggunakan pygame, menyediakan lukisan, audio dan fungsi lain, yang sesuai untuk membuat permainan 2D. 2) Pembangunan GUI boleh memilih tkinter atau pyqt. TKInter adalah mudah dan mudah digunakan, PYQT mempunyai fungsi yang kaya dan sesuai untuk pembangunan profesional.

See all articles