ホームページ >バックエンド開発 >Python チュートリアル >ML でのラベルエンコーディング

ML でのラベルエンコーディング

王林オリジナル: 2024-08-23 06:01:081405ブラウズ

ラベルエンコーディング は、機械学習で最もよく使用される手法の 1 つです。カテゴリデータを数値形式に変換するために使用されます。したがって、データをモデルに当てはめることができます。

ラベルエンコーディングを使用する理由を理解しましょう。 string の形式で必須の列を含むデータがあると想像してください。しかし、モデリングは数値データに対してのみ機能するため、このデータをモデルに当てはめることはできません。どうすればよいでしょうか?ここで、フィッティング用のデータを準備する前処理ステップで評価される救命テクニック、ラベルエンコーディング を紹介します。

Label Encoder の仕組みを理解するために、Scikit-Learn ライブラリの iris データセットを使用します。次のライブラリがインストールされていることを確認してください。

pandas
scikit-learn

ライブラリとしてインストールするには、次のコマンドを実行します:

$ python install -U pandas scikit-learn

ここで、Google Colab ノートブックを開いて、Label Encoder のコーディングと学習に取り組みましょう。

コードを書いてみましょう

次のライブラリをインポートすることから始めます:

import pandas as pd
from sklearn import preprocessing

iris データセットをインポートし、使用できるように初期化します。

from sklearn.datasets import load_iris
iris = load_iris()

次に、エンコードするデータを選択する必要があります。アヤメの種名をエンコードします。

species = iris.target_names
print(species)

出力:

array(['setosa', 'versicolor', 'virginica'], dtype='<U10')

前処理 からクラス LabelEncoder をインスタンス化しましょう。

label_encoder = preprocessing.LabelEncoder()

これで、ラベルエンコーダを使用してデータを適合させる準備が整いました。

label_encoder.fit(species)

次のような出力が表示されます:

Label Encoding in ML

この出力が得られれば、データは正常に適合されています。しかし、問題は、各種にどのような値がどのような順序で割り当てられているかをどのようにして調べるかということです。

Label Encoder がデータに適合する順序は、classes_ 属性に保存されます。エンコードは 0 から data_length-1 まで始まります。

label_encoder.classes_

出力:

array(['setosa', 'versicolor', 'virginica'], dtype='<U10')

ラベルエンコーダーはデータを自動的にソートし、左側からエンコードを開始します。ここ:

setosa -> 0
versicolor -> 1
virginica -> 2

それでは、当てはめたデータをテストしてみましょう。アヤメの種 setosa を変身させます。

label_encoder.transform(['setosa'])

出力: array([0])

もう一度、正種の virginica を変換した場合です。

label_encoder.transform(['virginica'])

出力: array([2])

["setosa"、"virginica"] などの種のリストを入力することもできます

ラベルエンコーダーの Scikit Learn ドキュメント >>>

以上がML でのラベルエンコーディングの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

String Array if sort for select using class Attribute this transform input

声明：

この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

前の記事：Pandas での DataFrame の操作次の記事：Pandas での DataFrame の操作

続きを見る

ML でのラベル エンコーディング

コードを書いてみましょう

関連記事

ML でのラベルエンコーディング