Pandasでデータ列から統計情報を効率的に実装します
データ分析では、データの柔軟な再編成と統計分析がしばしば必要です。たとえば、日付とタイプを含むデータセットを、1日あたりのさまざまなカウントの統計テーブルに変換します。この記事では、Pandas Libraryを使用してこれを効率的に行う方法を示します。
「日付」(日付)と「タイプ」(タイプ)の2つの列を含むデータフレーム(データフレーム)があり、データの例が次のとおりです。
<code>date type 2024-01-01 1 2024-01-01 2 2024-01-01 1 2024-01-02 3 2024-01-02 2 2024-01-02 3 2024-01-02 1 2024-01-02 1 2024-01-03 1 2024-01-03 4 2024-01-03 2 2024-01-03 5 ...</code>
目標は、データを次の形式に変換し、各タイプのカウントを毎日に表示することです。
<code>date type1 type2 type3 type4 type5 2024-01-01 2 1 0 0 0 2024-01-02 2 1 2 0 0 2024-01-03 1 1 0 1 1 ...</code>
Pandasのpd.get_dummies()
およびgroupby()
機能を使用して、これを達成できます。これがPythonコードです:
PDとしてパンダをインポートします #サンプルデータ= { 「日付」:['2024-01-01'、 '2024-01-01'、 '2024-01-01'、 '2024-01-02'、 '2024-01-02'、 '2024-01-02'、 '2024-01-02'、 '2024-01-02'、 '2024-02'、 '2024-02'、 '2024-01-03'、 '2024-01-03'、 '2024-01-03']、 「タイプ」:[1、2、1、3、2、3、1、1、1、4、2、5] } df = pd.dataframe(data) #df_encoded = pd.get_dummies(df、columns = ['type']、prefix = 'type')にdf_encoded = pd.get_dummiesにget_dummies()を使用します。 #グループ統計にgroupby()とsum()を使用してresult = df_encoded.groupby( 'date')。sum() #プリント結果印刷(df_encoded) print( " - " * 60) 印刷(結果)
コードは最初にpd.get_dummies()
を使用して「タイプ」列をダミー変数に変換し、次にgroupby('date').sum()
使用して日付をグループ化して各タイプをグループ化してターゲット統計テーブルを取得します。
出力の結果は次のとおりです。
<code> date type_1 type_2 type_3 type_4 type_5 0 2024-01-01 1 0 0 0 0 1 2024-01-01 0 1 0 0 0 2 2024-01-01 1 0 0 0 0 3 2024-01-02 0 0 1 0 0 4 2024-01-02 0 1 0 0 0 5 2024-01-02 0 0 1 0 0 6 2024-01-02 1 0 0 0 0 7 2024-01-02 1 0 0 0 0 8 2024-01-03 1 0 0 0 0 9 2024-01-03 0 0 0 1 0 10 2024-01-03 0 1 0 0 0 11 2024-01-03 0 0 0 0 1 ------------------------------------------------------------ type_1 type_2 type_3 type_4 type_5 date 2024-01-01 2 1 0 0 0 2024-01-02 2 1 2 0 0 2024-01-03 1 1 0 1 1</code>
この簡潔なコードを通じて、Pandas Data Column Conversion Statisticsを簡単に完了して、データ分析の効率を改善できます。
以上がパンダを使用してデータの列間統計を実装する方法は?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

Pythonは解釈された言語ですが、コンパイルプロセスも含まれています。 1)Pythonコードは最初にBytecodeにコンパイルされます。 2)ByteCodeは、Python Virtual Machineによって解釈および実行されます。 3)このハイブリッドメカニズムにより、Pythonは柔軟で効率的になりますが、完全にコンパイルされた言語ほど高速ではありません。

useaforloopwhenteratingoverasequenceor foraspificnumberoftimes; useawhileloopwhentinuninguntinuntilaConditionismet.forloopsareidealforknownownownownownownoptinuptinuptinuptinuptinutionsituations whileoopsuitsituations withinterminedationations。

pythonloopscanleadtoErrorslikeinfiniteloops、ModifiningListsDuringiteration、Off-Oneerrors、Zero-dexingissues、およびNestededLoopinefficiencies.toavoidhese:1)use'i

forloopsareadvastountousforknowterations and sequences、offeringsimplicityandeadability;

pythonusesahybridmodelofcompilation andtertation:1)thepythoninterpretercompilessourcodeodeplatform-indopent bytecode.2)thepythonvirtualmachine(pvm)thenexecuteTesthisbytecode、balancingeaseoputhswithporformance。

pythonisbothintersedand compiled.1)it'scompiledtobytecode forportabalityacrossplatforms.2)bytecodeisthenは解釈され、開発を許可します。

loopsareideal whenyouwhenyouknumberofiterationsinadvance、foreleloopsarebetterforsituationsは、loopsaremoreedilaConditionismetを使用します

henthenumber ofiterationsisknown advanceの場合、dopendonacondition.1)forloopsareideal foriterating over for -for -for -saredaverseversives likelistorarrays.2)whileopsaresupasiable forsaresutable forscenarioswheretheloopcontinupcontinuspificcond


ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

Video Face Swap
完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

人気の記事

ホットツール

ZendStudio 13.5.1 Mac
強力な PHP 統合開発環境

SecLists
SecLists は、セキュリティ テスターの究極の相棒です。これは、セキュリティ評価中に頻繁に使用されるさまざまな種類のリストを 1 か所にまとめたものです。 SecLists は、セキュリティ テスターが必要とする可能性のあるすべてのリストを便利に提供することで、セキュリティ テストをより効率的かつ生産的にするのに役立ちます。リストの種類には、ユーザー名、パスワード、URL、ファジング ペイロード、機密データ パターン、Web シェルなどが含まれます。テスターはこのリポジトリを新しいテスト マシンにプルするだけで、必要なあらゆる種類のリストにアクセスできるようになります。

Dreamweaver Mac版
ビジュアル Web 開発ツール

ドリームウィーバー CS6
ビジュアル Web 開発ツール

SublimeText3 中国語版
中国語版、とても使いやすい
