ホームページ  >  記事  >  テクノロジー周辺機器  >  タイミング解析で一般的に使用されるアルゴリズムはすべてここにあります

タイミング解析で一般的に使用されるアルゴリズムはすべてここにあります

PHPz
PHPz転載
2023-12-15 14:17:541239ブラウズ

時系列分析とは、過去の期間のイベントの特徴を使用して、将来の期間のイベントの特徴を予測することです。これは、回帰分析モデルの予測とは異なる、比較的複雑な予測モデリングの問題です。時系列モデルはイベントが発生する順序に依存します。順序が変更されると、同じサイズの値でも異なる結果が生成されます。 # タイミングの問題をすべて見る これは回帰問題ですが、回帰手法 (線形回帰、ツリー モデル、深層学習など) には特定の違いがあります。

タイミング解析で一般的に使用されるアルゴリズムはすべてここにありますタイミング解析には、静的タイミング解析 (STA) と動的タイミング解析が含まれます。

次に、いくつかの一般的なタイミング解析アルゴリズムを示します。

1 深層学習タイミング解析

RNN (リカレント ニューラル ネットワーク)

リカレント ニューラル ネットワークとは、時間の経過とともに繰り返し発生する構造を指します。自然言語処理 (NLP)、音声画像、その他の分野で非常に幅広い用途があります。 RNN ネットワークと他のネットワークの最大の違いは、RNN が特定の「記憶機能」を実現でき、時系列分析に最適であることです。人間が自分の過去の記憶を通して世界をよりよく理解できるのと同じです。また、RNN は人間の脳と同様のメカニズムを実装しており、処理された情報のメモリを保持できない他の種類のニューラル ネットワークとは異なり、処理された情報の一定量のメモリを保持します。

利点:

この方法は時間を記憶できるため、時系列の間隔が短い問題を解くのに適しています

欠点:

長期ステップ データは、勾配消失や勾配爆発の問題を起こしやすいです。

LSTM (Long Short-Term Memory Network)

LSTM (Long Short-Term Memory Network) メモリ ネットワーク (Long Short-Term Memory) は、従来のリカレント ニューラル ネットワーク (RNN) に存在する長期依存問題を解決するために設計された時間的リカレント ニューラル ネットワークです。すべての RNN は、一連の繰り返されるニューラル ネットワーク モジュールで構成されています。

強み:

非常に長い間隔と時系列の遅延を持つ重要なイベントの処理と予測に適しています。

欠点:

モデル パラメーターが多すぎると過学習の問題が発生します

2 従来の時系列分析モデル

自動回帰 (AR)

移動平均 (MA)
  • 自己回帰移動平均 (ARMA)
  • 自己回帰統合移動平均 (ARIMA)
  • 季節自己回帰統合移動平均 (SARIMA)
  • 季節自己回帰統合外生回帰分析を使用した移動平均 (季節自己回帰統合移動平均と外生回帰分析、SARIMAX)
  • 自己回帰モデル AR
  • 自己回帰モデル (略して AR モデル)時系列分析手法の 1 つで、時系列変数とその過去の値との関係を記述するために使用されます。 AR モデルは、現在の観測と過去の観測の間に線形関係があると仮定し、過去の観測を使用して将来の観測を予測します。
強み:

シンプルさ: AR モデルは、理解と実装が簡単な線形モデルです。過去の観測値のみを独立変数として使用し、他の複雑な要素を考慮する必要はありません。

モデリング機能: AR モデルは、時系列データの自己相関構造、つまり現在の観測と過去の観測の関係をキャプチャできます。将来の観測結果を予測し、データの傾向とパターンを明らかにします。
  • 欠点:
    • 定常系列にのみ適用可能: AR モデルでは、時系列が定常であること、つまり、平均、分散、および自己相関が時間とともに変化しないことが必要です。系列が非定常である場合、非定常性を処理するために微分演算を実行するか、他のモデルを使用する必要がある場合があります。
    • 過去の観測に敏感: AR モデルの予測結果は過去の観測の影響を受けるため、長期予測を扱う場合には誤差の蓄積の問題が発生する可能性があります。次数が大きいとモデルの過学習につながる可能性があり、次数が小さいと時系列の複雑なダイナミクスを捉えられない可能性があります。
    • 季節データを処理できない: AR モデルは、明らかな季節性のある時系列を直接処理できません。季節パターンのあるデータの場合、季節 AR モデル (SAR) または ARIMA モデルをモデリングに使用できます。

    移動平均法 (MA)

    移動平均法 (MA): この方法はデータの平均に基づいており、将来の値を仮定します。過去の値の間には一定の安定性があります。

    強み:

    時系列データの移動平均関係を捉えることができます。 MA モデルは、過去のタイム ステップからのホワイト ノイズ誤差項の線形結合を利用して現在の観測を予測するため、データの移動平均の性質を捉えます。

    比較的シンプルで直感的です。 MA モデルのパラメーターは、過去のタイム ステップでのホワイト ノイズ誤差項の重みを表し、これらの重みを推定することでモデルをフィッティングできます。

    欠点:

    • は移動平均関係のみを取得できますが、自己回帰関係は取得できません。 MA モデルは過去の時間ステップの観測を無視するため、データ内の自己相関を捕捉できない可能性があります。
    • 一部の時系列データでは、データを適切に適合させるために MA モデルでより高い次数が必要になる場合があり、その結果、モデルの複雑さが増加します。

    自己回帰移動平均モデル

    自己回帰移動平均モデル (ARMA モデル、自動回帰および移動平均モデル) は、時系列を研究するための重要な方法です。自己回帰モデル(ARモデル)と移動平均モデル(MAモデル)を「混合」したもので、適用範囲が広く、予測誤差が小さいという特徴があります。

    自己回帰統合移動平均 (ARIMA)

    ARIMA モデルは、自己回帰差分移動平均モデルの略称で、正式名称は自己回帰統合移動平均モデルです。このモデルは主に、自己回帰モデル (AR)、差分プロセス (I)、移動平均モデル (MA) の 3 つの部分で構成されます。

    ARIMA の基本的な考え方モデルはデータを使用することです。独自の履歴情報を使用して将来を予測します。ある時点のタグ値は、過去の期間のタグ値と過去の期間の偶発的イベントの両方の影響を受けます。つまり、ARIMA モデルでは、タグ値が時間の一般的な傾向に沿って変動すると仮定しています。トレンドは過去のラベルに影響され、変動は期間内の偶然の出来事に影響され、全体的なトレンド自体は必ずしも安定しているわけではありません

    ARIMA モデルは、時系列分析手法の抜粋です。データの自己相関と差異をモデル化することでデータに隠された時系列パターンを解析し、将来のデータを予測します

    • AR 部分 時間の自己回帰部分の処理に使用されます。過去の期間の観測値が現在の値に与える影響を考慮したシリーズ。
    • パート I は非定常時系列を定常化するもので、一次または二次差分処理により時系列の傾向や季節要因を除去します。
    • MA 部分は、時系列の移動平均部分を処理するために使用され、現在の値に対する過去の予測誤差の影響が考慮されます。

    これら 3 つの部分を組み合わせることで、ARIMA モデルはデータのトレンド変化を捉えるだけでなく、一時的な突然の変化や大きなノイズを含むデータを処理することもできます。したがって、ARIMA モデルは、多くの時系列予測問題で良好なパフォーマンスを発揮します。

    強み:

    モデルの構築は非常にシンプルで、他の外生変数に頼ることなく内生変数のみを使用します。いわゆる内生変数は、他の変数のサポートを必要とする回帰モデルとは異なり、データ自体にのみ依存する変数を指します。

    欠点:

    時系列データは安定している、または差分処理後に安定する

    本質的には、線形関係のみを捕捉できますが、非線形関係は捕捉できません。

    季節自己回帰統合移動平均モデル SARIMA

    SARIMA は、季節データに関する ARIMA モデルを拡張した、一般的に使用される時系列分析手法です。 SARIMA モデルを使用すると、年間売上高や週ごとの Web サイト訪問数などの季節時系列データを予測できます。 SARIMA モデルの長所と短所は次のとおりです。

    長所:

    • SARIMA モデルは時間を考慮しているため、季節データを適切に処理できます。シリーズデータの季節要因。
    • SARIMA モデルは、データの傾向と周期的な変化を捉えることができるため、時系列データに対して長期予測を行うことができます。
    • SARIMA モデルは、複数の変数間の関係を同時に考慮できるため、多変数時系列データに使用できます。

    欠点:

    • SARIMA モデルはトレーニングに大量の履歴データを必要とするため、データ量が多すぎる場合には適さない可能性があります。小さいです。
    • SARIMA モデルは外れ値の影響を受けやすいため、外れ値を処理する必要があります。
    • SARIMA モデルは計算の複雑さが高く、多くの計算と最適化が必要です。

    外因性回帰変数を使用した季節的自己回帰統合移動平均モデル SARIMAX

    季節的自己回帰統合移動平均モデル (SARIMAX) は、差分モデルに基づくモデルです。移動自己回帰モデル (ARIMA) と外因性回帰変数。これは、明らかな周期的および季節的特性を持つ時系列データに適しています

    3 他の時系列モデル

    このタイプの方法は、lightgbm および xgboost で表されます。系列の問題は教師あり学習に変換され、特徴量エンジニアリングと機械学習の手法によって予測されます。このモデルは、複雑な時系列予測モデルの大部分を解決できます。複雑なデータ モデリング、多変数協調回帰、非線形問題をサポートします。

    特徴量エンジニアリングの重要性は自明のことであり、機械学習の成功において重要な役割を果たします。ただし、特徴量エンジニアリングは単純な作業ではなく、複雑な手動処理と独自の専門知識が必要です。多くの場合、特徴量エンジニアリングのレベルによって機械学習の上限が決まり、機械学習アルゴリズムは可能な限りこの上限に近づきます。 特徴エンジニアリングが完了すると、ツリー モデル アルゴリズム (lightgbm および xgboost) を直接適用できます。これら 2 つのモデルは非常に一般的で効率的なモデリング方法です。さらに、次のような特徴もあります:

    • 高速な計算速度と高いモデル精度;
    • 欠損値は発生しません。必須ではありません 処理がより便利です;
    • はカテゴリ変数をサポートします;
    • は機能のクロスオーバーをサポートします。

    #具体的な方法は、データの性質、問題の特性、ご自身の経験や能力などを考慮して総合的に検討する必要があります。

    特定のデータ特性、問題要件、およびユーザー自身の能力に基づいて、適切な時系列予測方法を選択する必要があります。場合によっては、複数の方法を組み合わせることで、予測の精度と安定性が向上することがあります。同時に、より適切にモデルを選択し、予測結果を評価するには、データの視覚的な分析とモデルの診断を実行することも重要です。

以上がタイミング解析で一般的に使用されるアルゴリズムはすべてここにありますの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事は51cto.comで複製されています。侵害がある場合は、admin@php.cn までご連絡ください。