ホームページ  >  記事  >  バックエンド開発  >  2022 年の時系列分析に推奨される 10 の Python ライブラリ

2022 年の時系列分析に推奨される 10 の Python ライブラリ

WBOY
WBOY転載
2023-04-13 08:22:111964ブラウズ

時系列は一連のデータ ポイントであり、通常は一定期間にわたって取得された連続した測定値で構成されます。時系列分析は、時系列データから意味のある情報を抽出して予測を行うために、統計的手法を使用して時系列データをモデル化および分析するプロセスです。

2022 年の時系列分析に推奨される 10 の Python ライブラリ

#時系列分析は、データから貴重な情報を抽出し、将来のイベントを予測するために使用できる強力なツールです。これを使用して、傾向、季節パターン、変数間のその他の関係を特定できます。時系列分析は、販売、需要、価格の変化などの将来のイベントを予測するためにも使用できます。

Python を使用して時系列データを処理している場合は、さまざまなライブラリから選択できます。そこでこの記事では、Python で時系列を操作するための最も人気のあるライブラリを整理します。

Sktime

Sktime は、時系列データを処理するための Python ライブラリです。データの処理、視覚化、分析のためのツールなど、時系列データを操作するための一連のツールが提供されます。 SKtime は使いやすく拡張可能であるように設計されているため、新しい時系列アルゴリズムを簡単に実装および統合できます。

Sktime は、その名前が示すように、scikit-learn API をサポートしており、時系列回帰、予測、分類に関連する問題を効果的に解決するために必要なすべてのメソッドとツールが含まれています。このライブラリには、他のライブラリでは提供されていない特殊な機械学習アルゴリズムや独自の時系列変換方法が含まれており、非常に優れた基本ライブラリとして使用できます。

sktime のドキュメントによると、「私たちの目標は、時系列分析エコシステム全体をより相互運用可能で使いやすいものにすることです。sktime は、異なるが関連する時系列学習タスクに統合されたインターフェイスを提供します。特殊な時系列アルゴリズムを備えています。パイプライン パイプライン、統合、チューニング、簡素化などの組み合わせモデル構築用のツールを備えており、これにより、ユーザーはあるタスクから別のタスクにアルゴリズムを適用できます。 、tsfresh、PyOD、[fbprophet] など。」

次はコード サンプルです

from sktime.datasets import load_airline
 from sktime.forecasting.model_selection import temporal_train_test_split
 
 # from sktime.utils.plotting.forecasting import plot_ys
 
 y = load_airline()
 y_train, y_test = temporal_train_test_split(y)
 plt.title('Airline Data with Train and Test')
 y_train.plot(label = 'train')
 y_test.plot(label = 'test')
 plt.legend()

pmdarima

pmdarima は時系列データの統計分析用の Python ライブラリです。これは ARIMA モデルに基づいており、時系列データを分析、予測、視覚化するためのさまざまなツールを提供します。 Pmdarima は、季節性テストや季節分解ツールなど、季節データを操作するためのさまざまなツールも提供します。

時系列分析でよく使用される予測モデルの 1 つが ARIMA (自己回帰統合移動平均) です。 ARIMA は、時系列の過去の値からの情報に基づいて将来の値を予測する予測アルゴリズムです。

pmdarima は ARIMA モデルのラッパーであり、ARIMA モデルに最適なハイパーパラメータ (p、d、q) を自動的に見つけることができる自動ハイパーパラメータ検索機能が付いています。このライブラリには、次の主な機能点が含まれています。

定常性と季節性に関する一連の統計テスト
  • 差分や逆差分などの時系列ユーティリティ
  • 多数Box-Cox 変換やフーリエ変換を含む内生および外生の変換と特性評価
  • 季節時系列分解
  • 相互検証ツール
  • 組み込みの豊富な時系列コレクションプロトタイプとサンプルに利用可能なデータセット
  • AutoTS

名前が示すように、これは自動時系列分析のための Python ライブラリです。 AutoTS を使用すると、1 行のコードで複数の時系列モデルをトレーニングできるため、最適なモデルを選択できます。

このライブラリは autoML の一部であり、その目標は初心者向けの自動化ライブラリを提供することです。

TSFresh

tsfresh は、時系列から特徴を自動的に抽出できる Python パッケージです。これは、時系列の情報を一連の意味のある特徴に分解できるという事実に基づいています。 tsfresh は、こ​​れらの特徴を手動で抽出するという面倒なタスクを処理し、特徴の自動選択と分類のためのツールを提供します。これは pandas DataFrame で使用でき、次のような時系列データを処理するための幅広い関数を提供します。

時系列からの自動特徴抽出
  • 自動特徴選択
  • 時系列分解
  • 次元削減
  • 異常値検出
  • 複数の時系列形式のサポート
  • 欠損値のサポート
  • 複数の言語のサポート

2022 年の時系列分析に推奨される 10 の Python ライブラリProphet

Prophet は、Facebook のコア データ サイエンス チームによってリリースされたオープン ソース ソフトウェアです。これは、非線形傾向が年、週、日の季節性と休日の影響に適合する相加的モデルに基づいています。強い季節的影響のある時系列や複数の季節にわたる履歴データに最適です。 Prophet はデータの欠落や傾向の変化に対して非常に堅牢であり、通常は外れ値を適切に処理します。

根据官方文档,fbprophet在处理具有显著季节性影响的时间序列数据和几个季节价值的之前数据时工作得非常好。此外fbprophet能够抵抗缺失数据,并能够有效地管理异常值。

2022 年の時系列分析に推奨される 10 の Python ライブラリ

Statsforecast

Statsforecast提供了一组广泛使用的单变量时间序列预测模型,包括自动ARIMA和ETS建模并使用numba优化。它还包括大量的基准测试模型。根据官网的介绍:

  • Python和R中最快最准确的AutoARIMA。
  • Python和R中最快最准确的ETS。
  • 兼容sklearn接口。
  • ARIMA的外生变量和预测区间的包含。
  • 比pmdarima快20倍,比Prophet快500倍,比NeuralProphet快100倍,比statmodels快4倍。
  • 通过numba编译为高性能机器代码。
  • 开箱即用的实现ADIDA, HistoricAverage, CrostonClassic, CrostonSBA, CrostonOptimized, seasonalwindowaaverage, SeasonalNaive, IMAPA Naive, RandomWalkWithDrift, windowaaverage, SeasonalExponentialSmoothing, TSB, AutoARIMA和ETS。

kats

Kats 是 Facebook 研究团队最近开发的另一个专门处理时间序列数据的库。该框架的目标是为解决时间序列问题提供一个完整的解决方案。使用此库,我们可以执行以下操作:

  • 时间序列分析
  • 模式检测,包括季节性、异常值、趋势变化
  • 产生65个特征的特征工程模块
  • 对时间序列数据建立预测模型,包括Prophet、ARIMA、Holt Winters等。

Darts

Darts 是由 Unit8.co 开发的用于预测时间序列,并且对scikit-learn 友好 的Python 包。它包含大量模型,从 ARIMA 到深度神经网络,用于处理与日期和时间相关的数据。

该库的好处在于它还支持用于处理神经网络的多维类。

它还允许用户结合来自多个模型和外部回归模型的预测,从而更容易地对模型进行回测。

Pyflux

Pyflux 是一个为 Python 构建的开源时间序列库。Pyflux选择了更多的概率方法来解决时间序列问题。这种方法对于需要更完整的不确定性的预测这样的任务特别有利。

用户可以建立一个概率模型,其中通过联合概率将数据和潜在变量视为随机变量。

PyCaret

PyCaret是一个基于Python的开源、低代码的机器学习库,它是一个端到端机器学习和模型管理工具,可以成倍地加快实验周期,让工作效率更高。

与其他开源机器学习库相比,PyCaret是一个可替代的低代码库,可以只用几行代码替换数百行代码。这使得实验的速度和效率呈指数级增长。PyCaret本质上是scikit-learn、XGBoost、LightGBM、CatBoost、spacacy、Optuna、Hyperopt、Ray等几个机器学习库和框架的Python包装。

虽然PyCaret不是一个专门的时间序列预测库,但它有一个专门用于时间序列预测的新模块。它仍然处于预发布状态,但是安装时需要使用以下代码进行安装才能使用新的模块

pip install --pre pycaret

PyCaret时间序列模块与现有的API一致,并且可以使用完整的功能,例如:统计测试、模型训练和选择(30+算法模型)、模型分析、自动超参数调优、实验日志、云部署等。所有这些都只用了几行代码就完成了。

2022 年の時系列分析に推奨される 10 の Python ライブラリ

总结

Python中有许多可用的时间序列预测库(比我们在这里介绍的更多)。每个库都有自己的优缺点,因此根据自己的需要选择合适的是很重要的。如果你有什么更好的推荐,请留言告诉我们。


以上が2022 年の時系列分析に推奨される 10 の Python ライブラリの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事は51cto.comで複製されています。侵害がある場合は、admin@php.cn までご連絡ください。