ホームページ >バックエンド開発 >Python チュートリアル >Python による時系列分類の完全な入門

Python による時系列分類の完全な入門

Barbara Streisand
Barbara Streisandオリジナル
2025-01-15 06:57:43581ブラウズ

時系列データは多くの業界にわたって遍在していますが、時系列予測はかなりの注目を集めていますが、時系列分類は見落とされがちです。この記事では、時系列分類の包括的な概要を提供し、その実際のアプリケーションを調査し、さまざまな方法を確認し、Python ベースの分類プロジェクトでこれらの手法のいくつかを実証します。始めましょう!

時系列分類を理解する

時系列分類は、時間の経過とともに測定された 1 つ以上の特徴を使用してカテゴリを割り当てる教師あり機械学習手法です。 目的は、将来の値を予測するのではなく、時系列にラベルを付けることです。

時系列分類の現実世界への応用

時系列分類は、特にセンサー データで広く使用されています。 主なアプリケーションには以下が含まれます:

  • 予知保全: 潜在的な障害を予測するための機器の監視。
  • ヘルスケア: 心電図 (ECG) データを分析して患者の健康状態を評価します。
  • 音声認識: 音波パターンから話し言葉と話者を識別します。
  • 食品分光法: 分光法データからアルコール含有量を測定したり、食品成分を特定したりします。
  • サイバーセキュリティ: 詐欺や侵害を示す異常なアクティビティを検出します。

これらの多様なアプリケーションは、さまざまな分野における時系列分類の重要性を強調しています。

時系列分類モデルの概要

時系列分類には多数のアプローチが存在します。 このセクションでは、それぞれの概要を簡単に説明します。さらに詳細な説明は、この専用ガイド [利用可能な場合はガイドへのリンク] で参照できます。

1.距離ベースのモデル: これらのモデルは、距離メトリック (ユークリッド距離など) を利用してサンプルを分類します。ダイナミック タイム ワーピング (DTW) は、より堅牢なアプローチを提供し、一連のさまざまな長さに対応し、わずかに位相がずれたパターンを処理します。 例には、K 最近傍 (KNN) や ShapeDTW などがあります。

The Complete Introduction to Time Series Classification in Python

2.辞書ベースのモデル: これらのモデルは、シンボルを使用して系列パターンをエンコードし、分類にシンボルの頻度を活用します。 例としては、BOSS、WEASEL、TDE、MUSE などがあります。

3.アンサンブル メソッド: これらはモデル自体ではなく、予測を改善するために複数の基本推定量を組み合わせたフレームワークです。 主な利点は、単変量モデル (バギングなど) を使用して多変量データを処理できることです。 例には、バギング、加重アンサンブル、時系列フォレストなどがあります。

4.特徴ベースのメソッド: これらのメソッドは、時系列 (要約統計量、Catch22、マトリックス プロファイル、TSFresh など) から特徴を抽出し、分類器のトレーニングに使用されます。

5.区間ベースのモデル: これらは、時系列から複数の区間を抽出し、上記の方法を使用して特徴を計算し、分類器をトレーニングします。例には、RISE、CIF、DrCIF などがあります。

6.カーネルベースのモデル: これらのモデルは、カーネル関数を使用して時系列を高次元空間にマッピングし、分類を容易にします。例には、サポート ベクター分類子 (SVC)、Rocket、Arsenal (Rocket のアンサンブル) などがあります。

7.シェイプレット分類子: この分類子は、距離比較に基づく分類にシェイプレット (識別サブシーケンス) を識別して利用します。

8.メタ分類子: これらは、堅牢な分類パフォーマンスを実現するためにさまざまな方法を組み合わせています。 TDE、Shapelet、DrCIF、Arsenal を組み合わせた HIVE-COTE は一例ですが、計算コストが高くなります。

方法の選択は、データの特性、計算リソース、必要な精度などの要因によって異なります。

実践的な時系列分類プロジェクト (Python)

このセクションでは、前述のテクニックの一部を BasicMotions データセット [データセットへのリンク] に適用します。このデータセットは、さまざまなアクティビティ (立位、歩行、ランニング、バドミントン) を実行する個人からの加速度計とジャイロスコープのデータで構成されます。

セットアップ:

<code class="language-python">import pandas as pd
import numpy as np
import matplotlib.pyplot as plt

from sktime.datasets import load_basic_motions
from sklearn.model_selection import GridSearchCV, KFold</code>

データの読み込み:

<code class="language-python">X_train, y_train = load_basic_motions(split='train', return_type='numpy3D')
X_test, y_test = load_basic_motions(split='test', return_type='numpy3D')</code>

データの視覚化 (ウォーキングとバドミントンの比較例):

<code class="language-python"># ... (Visualization code as provided in the original article) ...</code>

KNN 分類:

<code class="language-python"># ... (KNN code as provided in the original article) ...</code>

WEASEL で袋詰め:

<code class="language-python"># ... (Bagging with WEASEL code as provided in the original article) ...</code>

評価:

<code class="language-python"># ... (Evaluation code as provided in the original article) ...</code>

The Complete Introduction to Time Series Classification in Python The Complete Introduction to Time Series Classification in Python The Complete Introduction to Time Series Classification in Python

結論

この記事では、時系列分類の概要を説明し、その応用とさまざまな方法について説明しました。 実践的なプロジェクトでは、KNN の適用と WEASEL による袋詰めを実証しました。 この分野のさらなる探究が奨励されています。

次のステップ

学習を続けるには、時系列分類方法に関するガイドやこの主題に関するコースなど、元の記事で言及されているリソースを探索することを検討してください。

参考文献

  • BasicMotions データセット — [データセットへのリンク]
  • SKTIME — [SKTIME へのリンク]

以上がPython による時系列分類の完全な入門の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。