Maison >développement back-end >Tutoriel Python >L'introduction complète à la classification des séries chronologiques en Python

L'introduction complète à la classification des séries chronologiques en Python

Barbara Streisand
Barbara Streisandoriginal
2025-01-15 06:57:43631parcourir

Les données de séries chronologiques sont omniprésentes dans de nombreux secteurs, mais si les prévisions de séries chronologiques reçoivent une attention considérable, la classification des séries chronologiques est souvent négligée. Cet article fournit une introduction complète à la classification des séries chronologiques, explorant ses applications réelles, passant en revue diverses méthodes et démontrant certaines de ces techniques dans un projet de classification basé sur Python. Commençons !

Comprendre la classification des séries chronologiques

La classification des séries temporelles est une technique d'apprentissage automatique supervisé dans laquelle une ou plusieurs caractéristiques, mesurées au fil du temps, sont utilisées pour attribuer une catégorie. L'objectif est d'étiqueter les séries chronologiques plutôt que de prédire les valeurs futures.

Applications réelles de la classification des séries chronologiques

La classification des séries chronologiques est largement utilisée, en particulier avec les données de capteurs. Les applications clés incluent :

  • Maintenance Prédictive : Surveillance des équipements pour anticiper les pannes potentielles.
  • Soins de santé : Analyse des données d'électrocardiogramme (ECG) pour évaluer la santé des patients.
  • Reconnaissance vocale :Identification des mots prononcés et des locuteurs à partir de modèles d'ondes sonores.
  • Spectroscopie alimentaire : Détermination de la teneur en alcool ou identification des composants alimentaires à partir des données de spectroscopie.
  • Cybersécurité : Détection d'activités anormales révélatrices de fraudes ou de violations.

Ces diverses applications soulignent l'importance de la classification des séries chronologiques dans divers domaines.

Aperçu des modèles de classification des séries chronologiques

De nombreuses approches existent pour la classification des séries chronologiques. Cette section propose un bref aperçu de chacun, avec des explications plus détaillées disponibles dans ce guide dédié [lien vers le guide, si disponible].

1. Modèles basés sur la distance : Ces modèles utilisent des mesures de distance (par exemple, la distance euclidienne) pour classer les échantillons. Dynamic Time Warping (DTW) offre une approche plus robuste, s'adaptant à des séries de longueurs variables et gérant des modèles légèrement déphasés. Les exemples incluent les K-voisins les plus proches (KNN) et ShapeDTW.

The Complete Introduction to Time Series Classification in Python

2. Modèles basés sur un dictionnaire : Ces modèles codent des modèles de séries à l'aide de symboles et exploitent la fréquence des symboles pour la classification. Les exemples incluent BOSS, WEASEL, TDE et MUSE.

3. Méthodes d'ensemble : Ce ne sont pas des modèles eux-mêmes mais plutôt des cadres combinant plusieurs estimateurs de base pour une prédiction améliorée. Un avantage clé réside dans leur capacité à gérer des données multivariées à l’aide de modèles univariés (par exemple, l’ensachage). Les exemples incluent l'ensachage, l'ensemble pondéré et la forêt de séries chronologiques.

4. Méthodes basées sur les fonctionnalités : Ces méthodes extraient des fonctionnalités de séries chronologiques (par exemple, statistiques récapitulatives, Catch22, profil matriciel, TSFresh) qui sont ensuite utilisées pour former un classificateur.

5. Modèles basés sur des intervalles : Ceux-ci extraient plusieurs intervalles de séries chronologiques, calculent les caractéristiques à l'aide des méthodes mentionnées ci-dessus, puis entraînent un classificateur. Les exemples incluent RISE, CIF et DrCIF.

6. Modèles basés sur le noyau : Ces modèles utilisent des fonctions de noyau pour mapper les séries chronologiques à un espace de dimension supérieure afin de faciliter la classification. Les exemples incluent Support Vector Classifier (SVC), Rocket et Arsenal (un ensemble de Rocket).

7. Classificateur Shapelet : Ce classificateur identifie et utilise des shapelets (sous-séquences discriminantes) pour une classification basée sur des comparaisons de distance.

8. Méta classificateurs : Ceux-ci combinent diverses méthodes pour des performances de classification robustes. HIVE-COTE, combinant TDE, Shapelet, DrCIF et Arsenal, en est un exemple, même si cela coûte cher en termes de calcul.

Le choix de la méthode dépend de facteurs tels que les caractéristiques des données, les ressources informatiques et la précision souhaitée.

Projet pratique de classification de séries chronologiques (Python)

Cette section applique certaines des techniques susmentionnées à l'ensemble de données BasicMotions [lien vers l'ensemble de données], comprenant des données d'accéléromètre et de gyroscope d'individus effectuant diverses activités (debout, marche, course, badminton).

Configuration :

<code class="language-python">import pandas as pd
import numpy as np
import matplotlib.pyplot as plt

from sktime.datasets import load_basic_motions
from sklearn.model_selection import GridSearchCV, KFold</code>

Chargement des données :

<code class="language-python">X_train, y_train = load_basic_motions(split='train', return_type='numpy3D')
X_test, y_test = load_basic_motions(split='test', return_type='numpy3D')</code>

Visualisation des données (exemple comparant la marche et le badminton) :

<code class="language-python"># ... (Visualization code as provided in the original article) ...</code>

Classification KNN :

<code class="language-python"># ... (KNN code as provided in the original article) ...</code>

Ensachage avec WEASEL :

<code class="language-python"># ... (Bagging with WEASEL code as provided in the original article) ...</code>

Évaluation :

<code class="language-python"># ... (Evaluation code as provided in the original article) ...</code>

The Complete Introduction to Time Series Classification in Python The Complete Introduction to Time Series Classification in Python The Complete Introduction to Time Series Classification in Python

Conclusion

Cet article fournit une introduction à la classification des séries chronologiques, couvrant ses applications et ses diverses méthodes. Le projet pratique a démontré l'application du KNN et de l'ensachage avec WEASEL. Une exploration plus approfondie de ce domaine est encouragée.

Prochaines étapes

Pour continuer à apprendre, pensez à explorer les ressources mentionnées dans l'article original, notamment un guide sur les méthodes de classification des séries temporelles et un cours sur le sujet.

Références

  • Ensemble de données BasicMotions — [lien vers l'ensemble de données]
  • Sktime — [lien vers sktime]

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn