Iris (多変量花データセット) は、最も有用な Python scikit-learn データセットの 1 つです。これは、それぞれ 50 個のインスタンスからなる 3 つのカテゴリに分類されており、3 種のアイリス (アイリス マウンテナ、アイリス バージニア、およびアイリス 斑入り) のがく片と花弁部分の測定値が含まれています。これとは別に、アヤメのデータセットには 3 種それぞれのインスタンスが 50 個含まれており、がく片の長さ (cm)、がく片の幅 (cm)、花びらの長さ (cm)、花びらの幅 (cm) という 4 つの特徴で構成されています。
主成分分析 (PCA) を使用して、IRIS データセットを 2 つの特徴を持つ新しい特徴空間に変換できます。
###ステップ###- まず、scikit-learn から必要なパッケージをインポートします。データセットと分解パッケージをインポートする必要があります。
手順2 - IRIS データセットを読み込みます。
ステップ3 - データセットに関する詳細情報を出力します。
手順4 - 主成分分析 (PCA) を初期化し、fit() 関数を適用してデータを近似します。 p>ステップ
5 - データセットを新しいディメンション、2 特徴データセットに変換します。 ###例### 以下の例では、上記の手順を使用して、PCA を介して scikit-learn IRIS プラント データセットを 2 つのフィーチャに変換します。
リーリー ###出力###アヤメデータセットを 3 特徴データセットに変換するにはどうすればよいですか?
PCA の背後にある主なコンセプトは、データの「主要な」特徴を選択し、それらに基づいて特徴を構築することです。これにより、サイズは小さくなりますが、元のデータセットと同じ情報を持つ新しいデータセットが得られます。
###例###次の出力が生成されます -
ああああ以上がScikit-learn の IRIS データセットを Python の 2 つの特徴だけを持つデータセットに変換するにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。