時系列に基づく異常検出問題-AI-php.cn

ホームページ

テクノロジー周辺機器

時系列に基づく異常検出問題

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Oct 09, 2023 pm 04:33 PM

順次異常検出に基づく

時系列に基づく異常検出問題

時系列に基づく異常検出の問題には、特定のコード例が必要です

時系列データとは、株価、気温の変化、時間の経過とともに特定の順序で記録されるデータです。交通の流れなど実際のアプリケーションでは、時系列データの異常検出は非常に重要です。外れ値は、通常のデータ、ノイズ、誤ったデータ、または特定の状況における予期せぬイベントと一致しない極端な値である可能性があります。異常検出は、これらの異常を発見し、適切な措置を講じるのに役立ちます。

時系列での異常検出には、統計的手法、機械学習手法、深層学習手法など、一般的に使用される手法が多数あります。この記事では、統計的手法と機械学習手法に基づく 2 つの時系列異常検出アルゴリズムを紹介し、対応するコード例を示します。

1. 統計的手法に基づく異常検出アルゴリズム

1.1 平均分散法

平均分散法は、最も単純な異常検出手法の 1 つです。基本的な考え方は、時系列データの平均と分散に基づいて異常の有無を判断することです。平均からのデータポイントの偏差が特定のしきい値 (たとえば、標準偏差の 3 倍) より大きい場合、異常であると判断されます。

次は、Python を使用して時系列異常検出の平均分散法を実装するコード例です:

import numpy as np

def detect_outliers_mean_std(data, threshold=3):
    mean = np.mean(data)
    std = np.std(data)
    outliers = []
    
    for i in range(len(data)):
        if abs(data[i] - mean) > threshold * std:
            outliers.append(i)
    
    return outliers

# 示例数据
data = [1, 2, 3, 4, 5, 20, 6, 7, 8, 9]

# 检测异常值
outliers = detect_outliers_mean_std(data)
print("异常数据索引：", outliers)

実行結果:

異常データインデックス: [5 ]

1.2 箱ひげ図法

箱ひげ図法は、よく使用されるもう 1 つの異常検出方法です。データの四分位数 (上位四分位数と下位四分位数、中央値) に基づいて外れ値を決定します。中央値 (Q2) と上下四分位数 (Q1、Q3) に基づいて上限と下限を計算し、データポイントがこの境界を超えた場合に異常と判断します。

次は、Python を使用して時系列異常検出のための箱ひげ図メソッドを実装するコード例です:

import numpy as np
import seaborn as sns

def detect_outliers_boxplot(data):
    q1 = np.percentile(data, 25)
    q3 = np.percentile(data, 75)
    iqr = q3 - q1
    outliers = []
    
    for i in range(len(data)):
        if data[i] < q1 - 1.5 * iqr or data[i] > q3 + 1.5 * iqr:
            outliers.append(i)
    
    return outliers

# 示例数据
data = [1, 2, 3, 4, 5, 20, 6, 7, 8, 9]

# 绘制箱型图
sns.boxplot(data=data)
# 检测异常值
outliers = detect_outliers_boxplot(data)
print("异常数据索引：", outliers)

実行結果:

異常データインデックス: [5]

2. 機械学習手法に基づく異常検出アルゴリズム

2.1 孤立フォレストアルゴリズム

孤立フォレストアルゴリズムは、教師なし学習に基づく異常検出手法です。決定木のセグメント化手法を使用して、データポイントの異常を判断します。分離フォレストアルゴリズムでは、外れ値の特徴空間上の密度が低いと想定しているため、デシジョンツリーを構築する際、外れ値のパス長は短くなります。

以下は、Python を使用して時系列異常検出のための分離フォレストアルゴリズムを実装するコード例です:

from sklearn.ensemble import IsolationForest

def detect_outliers_isolation_forest(data):
    model = IsolationForest(contamination=0.1, random_state=0)
    model.fit(data.reshape(-1, 1))
    outliers = model.predict(data.reshape(-1, 1))
    
    return np.where(outliers == -1)[0]

# 示例数据
data = [1, 2, 3, 4, 5, 20, 6, 7, 8, 9]

# 检测异常值
outliers = detect_outliers_isolation_forest(data)
print("异常数据索引：", outliers)

実行結果:

異常なデータインデックス: [5]

2.2 時系列分解法

時系列分解法は、時系列データを傾向、季節性、残差の 3 つの部分に分解し、分析することで、従来の統計手法に基づいた異常検出手法です。残差を測定して異常点を特定します。

次は、Python を使用して時系列異常検出のための時系列分解メソッドを実装するコード例です:

import statsmodels.api as sm

def detect_outliers_time_series(data):
    decomposition = sm.tsa.seasonal_decompose(data, model='additive')
    residuals = decomposition.resid
    outliers = []
    
    for i in range(len(residuals)):
        if abs(residuals[i]) > 2 * np.std(residuals):
            outliers.append(i)
    
    return outliers

# 示例数据
data = [1, 7, 3, 4, 5, 20, 6, 7, 8, 9]

# 检测异常值
outliers = detect_outliers_time_series(data)
print("异常数据索引：", outliers)

実行結果:

異常なデータインデックス: [1, 5]

結論

時系列に基づく異常検出の問題は、非常に重要かつ現実的な問題です。この記事では、統計的手法に基づく平均分散法と箱ひげ図法、および機械学習手法に基づく分離フォレストアルゴリズムと時系列分解法という、一般的に使用される 2 つの異常検出手法を紹介します。上記のコード例を通じて、読者は Python を使用してこれらのアルゴリズムを実装し、異常検出のために実際の時系列データに適用する方法を理解できます。この記事が時系列異常検出に関して読者の役に立てば幸いです。

以上が時系列に基づく異常検出問題の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明

この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

Microsoft Work Trend Index 2025は、職場の容量の緊張を示していますApr 24, 2025 am 11:19 AM

AIの急速な統合により悪化した職場での急成長能力の危機は、増分調整を超えて戦略的な変化を要求します。これは、WTIの調査結果によって強調されています。従業員の68％がワークロードに苦労しており、BURにつながります

AIは理解できますか？中国の部屋の議論はノーと言っていますが、それは正しいですか？Apr 24, 2025 am 11:18 AM

ジョン・サールの中国の部屋の議論：AIの理解への挑戦 Searleの思考実験は、人工知能が真に言語を理解できるのか、それとも真の意識を持っているのかを直接疑問に思っています。チャインを無知な人を想像してください

中国の「スマート」AIアシスタントは、マイクロソフトのリコールのプライバシーの欠陥をエコーしますApr 24, 2025 am 11:17 AM

中国のハイテク大手は、西部のカウンターパートと比較して、AI開発の別のコースを図っています。技術的なベンチマークとAPI統合のみに焦点を当てるのではなく、「スクリーン認識」AIアシスタントを優先しています。

Dockerは、おなじみのコンテナワークフローをAIモデルとMCPツールにもたらしますApr 24, 2025 am 11:16 AM

MCP：AIシステムに外部ツールにアクセスできるようになりますモデルコンテキストプロトコル（MCP）により、AIアプリケーションは標準化されたインターフェイスを介して外部ツールとデータソースと対話できます。人類によって開発され、主要なAIプロバイダーによってサポートされているMCPは、言語モデルとエージェントが利用可能なツールを発見し、適切なパラメーターでそれらを呼び出すことができます。ただし、環境紛争、セキュリティの脆弱性、一貫性のないクロスプラットフォーム動作など、MCPサーバーの実装にはいくつかの課題があります。 Forbesの記事「人類のモデルコンテキストプロトコルは、AIエージェントの開発における大きなステップです」著者：Janakiram MSVDockerは、コンテナ化を通じてこれらの問題を解決します。 Docker Hubインフラストラクチャに基づいて構築されたドキュメント

6億ドルのスタートアップを構築するために6つのAIストリートスマート戦略を使用するApr 24, 2025 am 11:15 AM

最先端のテクノロジーと巧妙なビジネスの洞察力を活用して、コントロールを維持しながら非常に収益性の高いスケーラブルな企業を作成する先見の明のある起業家によって採用された6つの戦略。このガイドは、建設を目指している起業家向けのためのものです

Googleフォトの更新は、すべての写真の見事なウルトラHDRのロックを解除しますApr 24, 2025 am 11:14 AM

Google Photosの新しいウルトラHDRツール：画像強化のゲームチェンジャー Google Photosは、強力なウルトラHDR変換ツールを導入し、標準的な写真を活気のある高ダイナミックレンジ画像に変換しました。この強化は写真家に利益をもたらします

Descopeは、AIエージェント統合の認証フレームワークを構築しますApr 24, 2025 am 11:13 AM

技術アーキテクチャは、新たな認証の課題を解決しますエージェントアイデンティティハブは、AIエージェントの実装を開始した後にのみ多くの組織が発見した問題に取り組んでいます。

Google Cloud Next2025と現代の仕事の接続された未来Apr 24, 2025 am 11:12 AM

（注：Googleは私の会社であるMoor Insights＆Strategyのアドバイザリークライアントです。） AI：実験からエンタープライズ財団まで Google Cloud Next 2025は、実験機能からエンタープライズテクノロジーのコアコンポーネント、ストリームへのAIの進化を紹介しました

See all articles

ホットAIツール

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

脱衣画像を無料で

Clothoff.io

AI衣類リムーバー

Video Face Swap

完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

ホットツール

VSCode Windows 64 ビットのダウンロード

Microsoft によって発売された無料で強力な IDE エディター

ZendStudio 13.5.1 Mac

強力な PHP 統合開発環境

MantisBT

Mantis は、製品の欠陥追跡を支援するために設計された、導入が簡単な Web ベースの欠陥追跡ツールです。 PHP、MySQL、Web サーバーが必要です。デモおよびホスティングサービスをチェックしてください。

メモ帳++7.3.1

使いやすく無料のコードエディター

mPDF

mPDF は、UTF-8 でエンコードされた HTML から PDF ファイルを生成できる PHP ライブラリです。オリジナルの作者である Ian Back は、Web サイトから「オンザフライ」で PDF ファイルを出力し、さまざまな言語を処理するために mPDF を作成しました。 HTML2FPDF などのオリジナルのスクリプトよりも遅く、Unicode フォントを使用すると生成されるファイルが大きくなりますが、CSS スタイルなどをサポートし、多くの機能強化が施されています。 RTL (アラビア語とヘブライ語) や CJK (中国語、日本語、韓国語) を含むほぼすべての言語をサポートします。ネストされたブロックレベル要素 (P、DIV など) をサポートします。