ホームページ  >  記事  >  バックエンド開発  >  Scikit-learn の IRIS データセットを Python の 2 つの特徴だけを持つデータセットに変換するにはどうすればよいですか?

Scikit-learn の IRIS データセットを Python の 2 つの特徴だけを持つデータセットに変換するにはどうすればよいですか?

WBOY
WBOY転載
2023-08-30 21:49:061098ブラウズ

Scikit-learn の IRIS データセットを Python の 2 つの特徴だけを持つデータセットに変換するにはどうすればよいですか?

Iris (多変量花データセット) は、最も有用な Python scikit-learn データセットの 1 つです。これは、それぞれ 50 個のインスタンスからなる 3 つのカテゴリに分類されており、3 種のアイリス (アイリス マウンテナ、アイリス バージニア、およびアイリス 斑入り) のがく片と花弁部分の測定値が含まれています。これとは別に、アヤメのデータセットには 3 種それぞれのインスタンスが 50 個含まれており、がく片の長さ (cm)、がく片の幅 (cm)、花びらの長さ (cm)、花びらの幅 (cm) という 4 つの特徴で構成されています。

主成分分析 (PCA) を使用して、IRIS データセットを 2 つの特徴を持つ新しい特徴空間に変換できます。

###ステップ###

以下の手順に従って、Python で PCA を使用して IRIS データセットを 2 特徴データセットに変換できます -

ステップ 1

- まず、scikit-learn から必要なパッケージをインポートします。データセットと分解パッケージをインポートする必要があります。

手順

2 - IRIS データセットを読み込みます。

ステップ

3 - データセットに関する詳細情報を出力します。

手順

4 - 主成分分析 (PCA) を初期化し、fit() 関数を適用してデータを近似します。 p>ステップ

5 - データセットを新しいディメンション、2 特徴データセットに変換します。 ###例### 以下の例では、上記の手順を使用して、PCA を介して scikit-learn IRIS プラント データセットを 2 つのフィーチャに変換します。

リーリー ###出力###

次の出力が生成されます -

リーリー

アヤメデータセットを 3 特徴データセットに変換するにはどうすればよいですか?

主成分分析 (PCA) と呼ばれる統計手法を使用して、Iris データセットを 3 つの特徴を持つ新しい特徴空間に変換できます。 PCA は基本的に、元のデータ セットの特徴を分析することによって、データを新しい特徴空間に線形に投影します。

PCA の背後にある主なコンセプトは、データの「主要な」特徴を選択し、それらに基づいて特徴を構築することです。これにより、サイズは小さくなりますが、元のデータセットと同じ情報を持つ新しいデータセットが得られます。

###例###

以下の例では、PCA を使用して scikit-learn アヤメ植物データセット (3 つのコンポーネントで初期化) を変換します。

リーリー ###出力###

次の出力が生成されます -

ああああ

以上がScikit-learn の IRIS データセットを Python の 2 つの特徴だけを持つデータセットに変換するにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事はtutorialspoint.comで複製されています。侵害がある場合は、admin@php.cn までご連絡ください。