ホームページ >バックエンド開発 >Python チュートリアル >Pandas でカテゴリデータを数値インデックスに効率的に変換するにはどうすればよいですか?

Pandas でカテゴリデータを数値インデックスに効率的に変換するにはどうすればよいですか?

Mary-Kate Olsen
Mary-Kate Olsenオリジナル
2024-10-29 04:43:02503ブラウズ

How to efficiently convert categorical data to numerical indices in Pandas?

Pandas: カテゴリの数値インデックスへの変換

Pandas データフレーム内のカテゴリを数値インデックスに変換するには、提供されている効率的な方法に従うことができます。ユーザーによる:

ステップ 1: 列の分類
まず、ターゲット列 (この場合は cc) をカテゴリ型に変換します:

<code class="python">df.cc = pd.Categorical(df.cc)</code>

ステップ 2: カテゴリ コードを取得する
カテゴリ コードを保存するための code という名前の新しい列を作成します:

<code class="python">df['code'] = df.cc.codes</code>

結果:

データフレームには、カテゴリに対応するインデックスを持つコード列が含まれるようになりました:

cc temp code
US 37.0 2
CA 12.0 1
US 35.0 2
AU 20.0 0

追加オプション:

  • コードを変更せずにコードを取得するにはDataFrame:
<code class="python">df.cc.astype('category').codes</code>
  • カテゴリ列をインデックスとして使用するには:
<code class="python">df2 = pd.DataFrame(df.temp)
df2.index = pd.CategoricalIndex(df.cc)</code>

以上がPandas でカテゴリデータを数値インデックスに効率的に変換するにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。