日付に基づいて Pandas DataFrame をフィルタリングすることは、データ分析の一般的なタスクです。この記事では、DataFrame をフィルタリングして、指定した範囲内の日付、具体的には現在の日付から今後 2 か月の行のみを保持するための 2 つのアプローチを検討します。
ラベルまたは位置インデックスによるフィルタリング
「日付」列が DataFrame のインデックスとして構成されている場合、ラベルベースのインデックス作成に .loc 属性を使用できます。 .iloc 位置インデックス用。たとえば、対象の日付範囲が 2014 年 1 月 1 日から 2014 年 2 月 1 日までの場合、次のコードを使用できます:
df.loc['2014-01-01':'2014-02-01']
論理条件によるフィルタリング
「日付」列がインデックスではない場合、2 つのオプションがあります。まず、一時的または永続的にインデックスとして設定できます。次に、ブール演算子を使用して論理条件を適用できます。これは、次のコードを使用して実現できます:
df[(df['date'] > '2013-01-01') & (df['date'] < '2013-02-01')]
この例では、「date」列が 2 つの日付「2013-01-01」と「2013-02-01」と比較されています。結果のデータフレームには、日付が指定された範囲内にある行のみが含まれます。
注: 適切な日付形式を使用し、「日付」列の値が次のとおりであることを確認することが重要です。有効な日付形式で。さらに、.ix は非推奨となっているため、使用しないでください。
以上が日付範囲に基づいて Pandas DataFrame をフィルタリングする方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。