Scikit-Learn を使用して機械学習の予測方法をすばやくマスターする-AI-php.cn

ホームページ

テクノロジー周辺機器

Scikit-Learn を使用して機械学習の予測方法をすばやくマスターする

王林

May 27, 2023 pm 02:26 PM

データ方法

この記事では、予測関数の違いとその使用法について説明します。

機械学習では、predict メソッドと、predict_proba、predict_log_proba、および Decision_function メソッドはすべて、トレーニングされたモデルに基づいて予測を行うために使用されます。

predict メソッド

predict メソッドを使用して、二項分類または多変量分類を予測し、予測ラベルを出力します。たとえば、顧客が製品を購入するかどうかを予測するロジスティック回帰モデルをトレーニングした場合、predict メソッドを使用して、新しい顧客が製品を購入するかどうかを予測できます。

scikit-learn の乳がんデータセットを使用します。このデータセットには、腫瘍の観察結果と、腫瘍が悪性か良性かを示す対応するラベルが含まれています。

import numpy as npfrom sklearn.svm import SVCfrom sklearn.preprocessing import StandardScalerfrom sklearn.pipeline import make_pipelineimport matplotlib.pyplot as pltfrom sklearn.datasets import load_breast_cancer# 加载数据集dataset = load_breast_cancer(as_frame=True)# 创建特征和目标X = dataset['data']y = dataset['target']# 将数据集分割成训练集和测试集from sklearn.model_selection import train_test_splitX_train, X_test, y_train, y_test = train_test_split(X, y , test_size=0.25, random_state=0)# 我们创建一个简单的管道来规范数据并使用`SVC`分类器训练模型svc_clf = make_pipeline(StandardScaler(),SVC(max_iter=1000, probability=True))svc_clf.fit(X_train, y_train)

# 我们正在预测X_test的第一个条目print(svc_clf.predict(X_test[:1]))

# 预测X_test的第一个条目属于哪一类[0]

predict_proba メソッド

predict_proba 関数を使用して、各カテゴリの確率予測を行い、各カテゴリラベルの可能な確率推定値を返します。二値または多変量の分類問題では、このアプローチは、考えられるそれぞれの結果の確率を決定するために一般的に使用されます。たとえば、動物の画像を猫、犬、馬に分類するモデルをトレーニングした場合、predict_proba メソッドを使用して各カテゴリラベルの確率推定値を取得できます。

print(svc_clf.predict_proba(X_test[:1]))

[[0.99848307 0.00151693]]

predict_log_proba メソッド

predict_log_proba メソッドは、predict_proba に似ていますが、生の確率ではなく、確率推定の対数を返します。これは、数値のアンダーフローやオーバーフローの問題を回避できるため、非常に小さいまたは非常に大きい確率値を扱う場合に非常に役立ちます。

print(svc_clf.predict_log_proba(X_test[:1]))

rrree

decision_function メソッド

線形二項分類モデルは、decion_function メソッドを利用できます。各入力データポイントのスコアを生成し、対応するクラスラベルを推測するために使用できます。データポイントを正または負に分類するしきい値は、アプリケーションまたはドメインの知識に基づいて設定できます。

[[-1.51808474e-03 -6.49106473e+00]]

print(svc_clf.decision_function(X_test[:1]))

概要

入力データの予測されたクラスラベルを取得する場合は、バイナリまたは多変量分類問題に対して detect を使用します。
考えられる各クラスラベルの確率推定値を取得する場合は、バイナリまたは多変量分類問題に対して detect_proba を使用します。
非常に小さいまたは非常に大きい確率値を処理する必要がある場合、または数値のアンダーフローまたはオーバーフローの問題を回避したい場合は、predict_log_proba を使用します。
各入力データポイントのスコアを取得する場合は、decion_function を使用して線形モデルの二値分類問題を処理します。

注: 一部の分類子の予測メソッドは不完全であるか、関数にアクセスするために追加のパラメーターが必要な場合があります。例: 確率予測を使用するには、SVC が確率パラメーターを True に設定する必要があります。

以上がScikit-Learn を使用して機械学習の予測方法をすばやくマスターするの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明

この記事は51CTO.COMで複製されています。侵害がある場合は、admin@php.cn までご連絡ください。

Gemma Scope：AI＆＃039;の思考プロセスを覗くためのGoogle＆＃039;の顕微鏡Apr 17, 2025 am 11:55 AM

ジェマの範囲で言語モデルの内部の仕組みを探る AI言語モデルの複雑さを理解することは、重要な課題です。包括的なツールキットであるGemma ScopeのGoogleのリリースは、研究者に掘り下げる強力な方法を提供します

ビジネスインテリジェンスアナリストは誰で、どのようになるか？Apr 17, 2025 am 11:44 AM

ビジネスの成功のロック解除：ビジネスインテリジェンスアナリストになるためのガイド生データを組織の成長を促進する実用的な洞察に変換することを想像してください。これはビジネスインテリジェンス（BI）アナリストの力です - GUにおける重要な役割

SQLに列を追加する方法は？ - 分析VidhyaApr 17, 2025 am 11:43 AM

SQLの変更テーブルステートメント：データベースに列を動的に追加するデータ管理では、SQLの適応性が重要です。その場でデータベース構造を調整する必要がありますか？ Alter Tableステートメントはあなたの解決策です。このガイドの詳細は、コルを追加します

ビジネスアナリストとデータアナリストApr 17, 2025 am 11:38 AM

導入 2人の専門家が重要なプロジェクトで協力している賑やかなオフィスを想像してください。ビジネスアナリストは、会社の目標に焦点を当て、改善の分野を特定し、市場動向との戦略的整合を確保しています。シム

ExcelのCountとCountaとは何ですか？ - 分析VidhyaApr 17, 2025 am 11:34 AM

Excelデータカウントと分析：カウントとカウントの機能の詳細な説明特に大規模なデータセットを使用する場合、Excelでは、正確なデータカウントと分析が重要です。 Excelは、これを達成するためにさまざまな機能を提供し、CountおよびCounta関数は、さまざまな条件下でセルの数をカウントするための重要なツールです。両方の機能はセルをカウントするために使用されますが、設計ターゲットは異なるデータ型をターゲットにしています。 CountおよびCounta機能の特定の詳細を掘り下げ、独自の機能と違いを強調し、データ分析に適用する方法を学びましょう。キーポイントの概要カウントとcouを理解します

ChromeはAIと一緒にここにいます：毎日何か新しいことを体験してください!!Apr 17, 2025 am 11:29 AM

Google Chrome'sAI Revolution：パーソナライズされた効率的なブラウジングエクスペリエンス人工知能（AI）は私たちの日常生活を急速に変換しており、Google ChromeはWebブラウジングアリーナで料金をリードしています。この記事では、興奮を探ります

ai＆＃x27; s Human Side：Wellbeing and the Quadruple bottuntApr 17, 2025 am 11:28 AM

インパクトの再考：四重材のボトムライン長い間、会話はAIの影響の狭い見方に支配されており、主に利益の最終ラインに焦点を当てています。ただし、より全体的なアプローチは、BUの相互接続性を認識しています

5ゲームを変える量子コンピューティングの使用ケースあなたが知っておくべきであるApr 17, 2025 am 11:24 AM

物事はその点に向かって着実に動いています。量子サービスプロバイダーとスタートアップに投資する投資は、業界がその重要性を理解していることを示しています。そして、その価値を示すために、現実世界のユースケースの数が増えています

See all articles

ホットAIツール

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

脱衣画像を無料で

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

SecLists

SecLists は、セキュリティテスターの究極の相棒です。これは、セキュリティ評価中に頻繁に使用されるさまざまな種類のリストを 1 か所にまとめたものです。 SecLists は、セキュリティテスターが必要とする可能性のあるすべてのリストを便利に提供することで、セキュリティテストをより効率的かつ生産的にするのに役立ちます。リストの種類には、ユーザー名、パスワード、URL、ファジングペイロード、機密データパターン、Web シェルなどが含まれます。テスターはこのリポジトリを新しいテストマシンにプルするだけで、必要なあらゆる種類のリストにアクセスできるようになります。

Safe Exam Browser

Safe Exam Browser は、オンライン試験を安全に受験するための安全なブラウザ環境です。このソフトウェアは、あらゆるコンピュータを安全なワークステーションに変えます。あらゆるユーティリティへのアクセスを制御し、学生が無許可のリソースを使用するのを防ぎます。

AtomエディタMac版ダウンロード

最も人気のあるオープンソースエディター

MinGW - Minimalist GNU for Windows

このプロジェクトは osdn.net/projects/mingw に移行中です。引き続きそこでフォローしていただけます。 MinGW: GNU Compiler Collection (GCC) のネイティブ Windows ポートであり、ネイティブ Windows アプリケーションを構築するための自由に配布可能なインポートライブラリとヘッダーファイルであり、C99 機能をサポートする MSVC ランタイムの拡張機能が含まれています。すべての MinGW ソフトウェアは 64 ビット Windows プラットフォームで実行できます。