介紹
機器學習是一個快速發展的領域,新的技術和演算法不斷湧現。然而,創建和增強機器學習模型可能是一項耗時且具有挑戰性的任務,需要高度的專業知識。自動化機器學習,通常稱為autoML,旨在透過自動化一些繁重的任務,如特徵工程、超參數調整和模型選擇,簡化機器學習模型的創建和最佳化過程。
auto-sklearn是一個強大的開源自動化機器學習框架,建構在Python中最著名的機器學習庫之一scikit-learn之上。它透過貝葉斯優化和元學習,在給定資料集上自動搜尋潛在的機器學習管線,並自動識別最佳模型和超參數。本教學將介紹在Python中使用Auto-sklearn的用法,包括安裝、匯入資料、資料準備、建立和訓練模型以及評估模型效果的指導。即使是初學者也可以使用Auto-sklearn快速簡單地創建強大的機器學習模型。
在node-red中處理錯誤的方法
Auto-sklearn
使用高效的開源軟體程式Auto-sklearn自動化創建和持續改進機器學習模型。使用貝葉斯優化和元學習自動找到特定資料集的理想模型和超參數,這本身是基於著名的機器學習程式scikit-learn的。
只有少數幾個autosklearn為分類和迴歸問題所建立的應用程式包括自然語言處理、圖片分類和時間序列預測。
該程式庫透過對潛在的機器學習流程集合進行搜尋來運行,其中包括特徵工程、模型選擇和資料準備過程。它使用貝葉斯優化有效地搜尋這個空間,並透過元學習從先前的測試中不斷提高搜尋效率。
此外,Auto-sklearn還提供了一系列強大的功能,包括動態整合選擇、自動模型整合和主動學習。此外,它還提供了簡單易用的API,用於開發、測試和訓練模型。
AutoML 程式碼
現在讓我們使用Auto-sklearn更詳細地檢查AutoML程式碼。我們將使用scikit-learn中的數字資料集,這是一個手寫數字的資料集。預測從數位圖片中的數字是目標。這是程式碼 -
Program
的中文翻譯為:程式
import autosklearn.classification from sklearn.datasets import load_digits from sklearn.model_selection import train_test_split # Load the dataset X, y = load_digits(return_X_y=True) X_train, X_test, y_train, y_test = train_test_split(X, y, random_state=1) # Create and fit the AutoML model automl = autosklearn.classification.AutoSklearnClassifier(time_left_for_this_task=180, per_run_time_limit=30) automl.fit(X_train, y_train) # Evaluate the model on the test set print("Accuracy:", automl.score(X_test, y_test))
輸出
Accuracy: 0.9866666666666667
程式碼解釋
這個程式使用自動化機器學習(AutoML)從MNIST資料集中對手寫數字進行分類,其中包括使用Auto-sklearn模組。以下是程式碼的簡要概述−
從autosklearn.classification模組導入AutoSklearnClassifier類,該類別包含將被使用的AutoML分類模型,導入autosklearn.classification模組。
從sklearn.datasets導入load_digits函數:這將從sklearn.datasets套件中導入MNIST資料集的load_digits函式。
從sklearn中選擇模型。 MNIST資料集使用sklearn.model selection模組中的train test split函數分為訓練集和測試集,這裡進行了導入。
載入了MNIST資料集,輸入特徵儲存在X中,對應的標籤儲存在y中。 X, y = load_digits(return_X_y=True):這將載入MNIST資料集。
X訓練集、X測試集、y訓練集、y測試集= train_test_split(X, y, random_state=1)
將資料集依照75:25的比例分成訓練集和測試集,並將隨機種子設為1以確保可重複性
Automl等同於autosklearn.classification。 AutoSklearnClassifier(每次運行時間限制=30,此任務剩餘時間=180):將在MNIST資料集上訓練的AutoML模型形成為AutoSklearnClassifier類別的實例。每次運行時間限製表示每個單獨模型可以運行的最長時間(以秒為單位),而此任務的剩餘時間表示AutoML過程可以運行的最長時間(以秒為單位)。
使用 automl.fit 函數(X train, y train),透過訓練集 X train 和相關標籤 Y train 訓練 AutoSklearnClassifier 模型。
accuracy:", print(X test, y test), automl.score 這確定了AutoSklearnClassifier模型在評估其在X test和Y test相關標籤上的性能後,在測試集上的準確性.score方法給出了模型在給定資料集上的準確性。
#上述程式碼實現了AutoML方法,這是一種機器學習技術,可以自動化模型建立過程的每一步,包括特徵選擇、超參數調整和資料準備。即使是非專家也可以藉助AutoML創建強大的模型,這減少了創建機器學習模型所需的人工工作量。
首先,將所需的函式庫,如pandas,numpy,sklearn和tpot,匯入到程式碼中。 Sklearn用於機器學習任務,如資料預處理、模型選擇和評估,Pandas用於資料操作,NumPy用於數值計算。實作AutoML演算法的主要函式庫是TPOT。
接著使用pandas的read_csv函數載入資料集,並將輸入特徵和輸出標籤分開儲存在不同的變數中。 'y'變數保存輸出的標籤,而'X'變數儲存輸入的特徵。
為了適應資料並產生機器學習模型,程式碼首先載入資料集,然後建立TPOTRegressor類別的一個實例。 TPOTRegressor類是TPOTBase類別的子類,使用遺傳演算法選擇特徵和調整超參數。 TPOTRegressor類別處理迴歸問題,而TPOTClassifier類別處理分類問題。
使用Sklearn的train-test-split方法將資料集分為訓練集和測試集。這是機器學習中常見的做法,將資料分為兩個集合:一個用於擬合模型的訓練集,一個用於評估模型效能的測試集。
一旦資料被分割,TPOTRegressor實例的fit方法被調用,該方法會根據訓練資料調整模型。透過fit技術,使用遺傳演算法找到給定資料的最佳特徵子集和超參數。然後將最佳模型返回。
然後,透過使用評分方法,程式碼對模型在測試集上的表現進行評估,以確定模型的準確性。準確度分數表示模型與資料的適合程度,數值越接近1表示適合程度越好。
最佳模型隨後使用匯出函數匯出到Python檔案中,同時附帶其在測試集上的準確度得分。
結論
總之,Auto-sklearn是一個強大的函式庫,可以簡化機器學習模型的建立和改進過程。透過自動尋找給定資料集的最佳模型和超參數,它可以節省時間和精力。本教學介紹如何在Python中使用Auto-sklearn,包括安裝它、匯入資料、準備資料、建立和訓練模型以及評估模型效能的指導。即使是新手也可以使用Auto-sklearn快速簡單地創建強大的機器學習模型。
以上是自動機器學習Python等效程式碼解釋的詳細內容。更多資訊請關注PHP中文網其他相關文章!

Python在自動化、腳本編寫和任務管理中表現出色。 1)自動化:通過標準庫如os、shutil實現文件備份。 2)腳本編寫:使用psutil庫監控系統資源。 3)任務管理:利用schedule庫調度任務。 Python的易用性和豐富庫支持使其在這些領域中成為首選工具。

要在有限的時間內最大化學習Python的效率,可以使用Python的datetime、time和schedule模塊。 1.datetime模塊用於記錄和規劃學習時間。 2.time模塊幫助設置學習和休息時間。 3.schedule模塊自動化安排每週學習任務。

Python在遊戲和GUI開發中表現出色。 1)遊戲開發使用Pygame,提供繪圖、音頻等功能,適合創建2D遊戲。 2)GUI開發可選擇Tkinter或PyQt,Tkinter簡單易用,PyQt功能豐富,適合專業開發。

Python适合数据科学、Web开发和自动化任务,而C 适用于系统编程、游戏开发和嵌入式系统。Python以简洁和强大的生态系统著称,C 则以高性能和底层控制能力闻名。

2小時內可以學會Python的基本編程概念和技能。 1.學習變量和數據類型,2.掌握控制流(條件語句和循環),3.理解函數的定義和使用,4.通過簡單示例和代碼片段快速上手Python編程。

Python在web開發、數據科學、機器學習、自動化和腳本編寫等領域有廣泛應用。 1)在web開發中,Django和Flask框架簡化了開發過程。 2)數據科學和機器學習領域,NumPy、Pandas、Scikit-learn和TensorFlow庫提供了強大支持。 3)自動化和腳本編寫方面,Python適用於自動化測試和系統管理等任務。

兩小時內可以學到Python的基礎知識。 1.學習變量和數據類型,2.掌握控制結構如if語句和循環,3.了解函數的定義和使用。這些將幫助你開始編寫簡單的Python程序。

如何在10小時內教計算機小白編程基礎?如果你只有10個小時來教計算機小白一些編程知識,你會選擇教些什麼�...


熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

AI Hentai Generator
免費產生 AI 無盡。

熱門文章

熱工具

DVWA
Damn Vulnerable Web App (DVWA) 是一個PHP/MySQL的Web應用程序,非常容易受到攻擊。它的主要目標是成為安全專業人員在合法環境中測試自己的技能和工具的輔助工具,幫助Web開發人員更好地理解保護網路應用程式的過程,並幫助教師/學生在課堂環境中教授/學習Web應用程式安全性。 DVWA的目標是透過簡單直接的介面練習一些最常見的Web漏洞,難度各不相同。請注意,該軟體中

SublimeText3漢化版
中文版,非常好用

MantisBT
Mantis是一個易於部署的基於Web的缺陷追蹤工具,用於幫助產品缺陷追蹤。它需要PHP、MySQL和一個Web伺服器。請查看我們的演示和託管服務。

SublimeText3 英文版
推薦:為Win版本,支援程式碼提示!

mPDF
mPDF是一個PHP庫,可以從UTF-8編碼的HTML產生PDF檔案。原作者Ian Back編寫mPDF以從他的網站上「即時」輸出PDF文件,並處理不同的語言。與原始腳本如HTML2FPDF相比,它的速度較慢,並且在使用Unicode字體時產生的檔案較大,但支援CSS樣式等,並進行了大量增強。支援幾乎所有語言,包括RTL(阿拉伯語和希伯來語)和CJK(中日韓)。支援嵌套的區塊級元素(如P、DIV),