suchen
HeimBackend-EntwicklungPython-TutorialSo führen Sie ein Resampling von Zeitreihendaten in Python durch

So führen Sie ein Resampling von Zeitreihendaten in Python durch

Aug 29, 2023 pm 08:13 PM
python时间序列重采样

So führen Sie ein Resampling von Zeitreihendaten in Python durch

Zeitreihendaten sind eine Folge von Beobachtungen, die in festen Zeitintervallen erfasst werden. Die Daten können aus allen Bereichen stammen, beispielsweise aus den Bereichen Finanzen, Wirtschaft, Gesundheit und Umweltwissenschaften. Die von uns erfassten Zeitreihendaten können manchmal unterschiedliche Frequenzen oder Auflösungen aufweisen, die für unsere Analyse- und Datenmodellierungsprozesse möglicherweise nicht geeignet sind. In diesem Fall können wir die Zeitreihendaten durch Upsampling oder Downsampling erneut abtasten und so die Häufigkeit oder Auflösung der Zeitreihe ändern. In diesem Artikel werden verschiedene Methoden zum Upsampling oder Downsampling von Zeitreihendaten vorgestellt.

Upsampling

Upsampling bedeutet, die Häufigkeit der Zeitreihendaten zu erhöhen. Dies wird normalerweise durchgeführt, wenn wir eine höhere Auflösung oder häufigere Beobachtungen benötigen. Python bietet verschiedene Methoden zum Upsampling von Zeitreihendaten, einschließlich linearer Interpolation, Interpolation des nächsten Nachbarn und Polynominterpolation.

Syntax

DataFrame.resample(rule, *args, **kwargs)
DataFrame.asfreq(freq, method=None)
DataFrame.interpolate(method='linear', axis=0, limit=None, inplace=False, limit_direction='forward', limit_area=None)

hier,

  • Die resample-Funktion ist eine von der Pandas-Bibliothek bereitgestellte Methode zum erneuten Abtasten von Zeitreihendaten. Sie wird auf einen DataFrame angewendet und verwendet den Regelparameter, der die gewünschte Häufigkeit für das erneute Abtasten (*args) und Schlüsselwortargumente angibt (**kwargs) können bereitgestellt werden, um das Resampling-Verhalten anzupassen, z. B. um die Aggregationsmethode anzugeben oder fehlende Werte zu behandeln.

  • Die Methode asfreq wird in Verbindung mit der Resample-Funktion verwendet, um die Häufigkeit der Zeitreihendaten zu konvertieren. Sie verwendet den Parameter „freq“, der die gewünschte Häufigkeitszeichenfolge für die Ausgabe angibt alle fehlenden Werte, die während des Resampling-Prozesses eingeführt wurden, wie z. B. Vorwärtsfüllung, Rückwärtsfüllung oder Interpolation.

  • Die Interpolationsmethode wird verwendet, um fehlende Werte oder Lücken in Zeitreihendaten zu füllen. Es interpoliert gemäß der angegebenen Methode (z. B. „linear“, „nearest“, „spline“), um Werte zwischen vorhandenen Beobachtungen zu schätzen. Zusätzliche Parameter können die Interpolationsachse, die Auffüllgrenze für aufeinanderfolgende NaN-Werte und ob der DataFrame an Ort und Stelle geändert oder ein neuer DataFrame zurückgegeben werden soll, steuern.

Lineare Interpolation

Lineare Interpolation wird zum Upsampling von Zeitreihendaten verwendet. Es füllt Lücken, indem es gerade Linien zwischen Datenpunkten zeichnet. Die lineare Interpolation kann mithilfe der Resample-Funktion in der Pandas-Bibliothek implementiert werden.

Die chinesische Übersetzung von

Beispiel

lautet:

Beispiel

Im folgenden Beispiel haben wir einen Zeitreihen-DataFrame mit drei Beobachtungen zu nicht aufeinanderfolgenden Daten. Wir konvertieren die Spalte „Datum“ in ein Datum/Uhrzeit-Format und legen sie als Index fest. Die Resample-Funktion wird verwendet, um die Daten auf a hochzurechnen tägliche Häufigkeit ('D') mit der asfreq-Methode. Schließlich füllt die Interpolationsmethode mit der Option 'linear' die Lücken zwischen den Datenpunkten mithilfe linearer Interpolation. Der DataFrame, df_upsampled, enthält die hochgetasteten Zeitreihendaten mit interpolierten Werten

import pandas as pd

# Create a sample time series DataFrame
data = {'Date': ['2023-06-01', '2023-06-03', '2023-06-06'],
        'Value': [10, 20, 30]}
df = pd.DataFrame(data)
df['Date'] = pd.to_datetime(df['Date'])
df.set_index('Date', inplace=True)

# Upsample the data using linear interpolation
df_upsampled = df.resample('D').asfreq().interpolate(method='linear')

# Print the upsampled DataFrame
print(df_upsampled)

Ausgabe

                Value
Date                 
2023-06-01  10.000000
2023-06-02  15.000000
2023-06-03  20.000000
2023-06-04  23.333333
2023-06-05  26.666667
2023-06-06  30.000000

Interpolation des nächsten Nachbarn

Nearest Neighbor Interpolation ist eine einfache Methode, die die Lücken zwischen Datenpunkten mit der nächstgelegenen verfügbaren Beobachtung füllt. Diese Methode kann nützlich sein, wenn die Zeitreihe abrupte Änderungen aufweist oder wenn die Reihenfolge der Beobachtungen wichtig ist die Option „Nächster“, um die Interpolation des nächsten Nachbarn durchzuführen

Die chinesische Übersetzung von

Beispiel

lautet:

Beispiel

Im obigen Beispiel verwenden wir den gleichen ursprünglichen DataFrame wie zuvor. Nach dem Resampling mit der Frequenz „D“ füllt die Interpolationsmethode mit der Option „Nearest“ die Lücken, indem sie den resultierenden DataFrame, df_upsampled, kopiert hat eine tägliche Häufigkeit mit der Interpolation des nächsten Nachbarn.

import pandas as pd

# Create a sample time series DataFrame
data = {'Date': ['2023-06-01', '2023-06-03', '2023-06-06'],
        'Value': [10, 20, 30]}
df = pd.DataFrame(data)
df['Date'] = pd.to_datetime(df['Date'])
df.set_index('Date', inplace=True)

# Upsample the data using nearest neighbor interpolation
df_upsampled = df.resample('D').asfreq().interpolate(method='nearest')

# Print the upsampled DataFrame
print(df_upsampled)

Ausgabe

            Value
Date             
2023-06-01   10.0
2023-06-02   10.0
2023-06-03   20.0
2023-06-04   20.0
2023-06-05   30.0
2023-06-06   30.0

Downsampling

Downsampling wird verwendet, um die Häufigkeit von Zeitreihendaten zu reduzieren, oft um einen umfassenderen Überblick über die Daten zu erhalten oder die Analyse zu vereinfachen. Python bietet verschiedene Downsampling-Techniken wie Mittelung, Summierung oder Maximierung von Werten über ein bestimmtes Zeitintervall.

Syntax

DataFrame.mean(axis=None, skipna=None, level=None, numeric_only=None, **kwargs)

Hier wird nach dem Resampling eine Aggregationsmethode wie

Mittelwert, Summe oder Maximum angewendet, um einen einzelnen Wert zu berechnen, der die gruppierten Beobachtungen innerhalb jedes Resampling-Intervalls darstellt. Diese Methoden werden typischerweise beim Downsampling von Daten verwendet. Sie können direkt auf einen erneut abgetasteten DataFrame angewendet werden oder in Verbindung mit einer Resampling-Funktion verwendet werden, um die Daten auf der Grundlage einer bestimmten Häufigkeit (z. B. wöchentlich oder monatlich) durch Angabe geeigneter Regeln zu aggregieren. Die chinesische Übersetzung von

Mean Downsampling

lautet:

Average Downsampling

Durch das mittlere Downsampling wird der Durchschnitt der Datenpunkte innerhalb jedes Intervalls berechnet. Diese Methode ist nützlich, wenn Hochfrequenzdaten verarbeitet und repräsentative Werte für jedes Intervall erhalten werden. Sie können die Resampling-Funktion in Verbindung mit der Mean-Methode verwenden, um eine Mittelwert-Downsampling durchzuführen.

Example

的中文翻译为:

示例

In the below example, we start with a daily time series DataFrame spanning the entire month of June 2023. The resample function with the 'W' frequency downsamples the data to weekly intervals. By applying the mean method, we obtain the average value within each week. The resulting DataFrame, df_downsampled, contains the mean-downsampled time series data.

import pandas as pd

# Create a sample time series DataFrame with daily frequency
data = {'Date': pd.date_range(start='2023-06-01', end='2023-06-30', freq='D'),
        'Value': range(30)}
df = pd.DataFrame(data)
df.set_index('Date', inplace=True)

# Downsampling using mean
df_downsampled = df.resample('W').mean()

# Print the downsampled DataFrame
print(df_downsampled)

输出

            Value
Date             
2023-06-04    1.5
2023-06-11    7.0
2023-06-18   14.0
2023-06-25   21.0
2023-07-02   27.0

Maximum Downsampling

最大降采样计算并设置每个间隔内的最高值。此方法适用于识别时间序列中的峰值或极端事件。在前面的示例中使用max而不是mean或sum允许我们执行最大降采样。

Example

的中文翻译为:

示例

In the below example, we start with a daily time series DataFrame spanning the entire month of June 2023. The resample function with the 'W' frequency downsamples the data to weekly intervals. By applying the max method, we obtain the Maximum value within each week. The resulting DataFrame, df_downsampled, contains the maximum-downsampled time series data.

import pandas as pd
# Create a sample time series DataFrame with daily frequency
data = {'Date': pd.date_range(start='2023-06-01', end='2023-06-30', freq='D'),
        'Value': range(30)}
df = pd.DataFrame(data)
df.set_index('Date', inplace=True)

# Downsampling using mean
df_downsampled = df.resample('W').max()

# Print the downsampled DataFrame
print(df_downsampled)

输出

            Value
Date             
2023-06-04      3
2023-06-11     10
2023-06-18     17
2023-06-25     24
2023-07-02     29

结论

在本文中,我们讨论了如何使用Python对时间序列数据进行重新采样。Python提供了各种上采样和下采样技术。我们探讨了线性和最近邻插值用于上采样,以及均值和最大值插值用于下采样。您可以根据手头的问题使用任何一种上采样或下采样技术。

Das obige ist der detaillierte Inhalt vonSo führen Sie ein Resampling von Zeitreihendaten in Python durch. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme
Dieser Artikel ist reproduziert unter:tutorialspoint. Bei Verstößen wenden Sie sich bitte an admin@php.cn löschen
Python vs. C: Verständnis der wichtigsten UnterschiedePython vs. C: Verständnis der wichtigsten UnterschiedeApr 21, 2025 am 12:18 AM

Python und C haben jeweils ihre eigenen Vorteile, und die Wahl sollte auf Projektanforderungen beruhen. 1) Python ist aufgrund seiner prägnanten Syntax und der dynamischen Typisierung für die schnelle Entwicklung und Datenverarbeitung geeignet. 2) C ist aufgrund seiner statischen Tipp- und manuellen Speicherverwaltung für hohe Leistung und Systemprogrammierung geeignet.

Python vs. C: Welche Sprache für Ihr Projekt zu wählen?Python vs. C: Welche Sprache für Ihr Projekt zu wählen?Apr 21, 2025 am 12:17 AM

Die Auswahl von Python oder C hängt von den Projektanforderungen ab: 1) Wenn Sie eine schnelle Entwicklung, Datenverarbeitung und Prototypdesign benötigen, wählen Sie Python. 2) Wenn Sie eine hohe Leistung, eine geringe Latenz und eine schließende Hardwarekontrolle benötigen, wählen Sie C.

Erreichen Sie Ihre Python -Ziele: Die Kraft von 2 Stunden täglichErreichen Sie Ihre Python -Ziele: Die Kraft von 2 Stunden täglichApr 20, 2025 am 12:21 AM

Indem Sie täglich 2 Stunden Python -Lernen investieren, können Sie Ihre Programmierkenntnisse effektiv verbessern. 1. Lernen Sie neues Wissen: Lesen Sie Dokumente oder sehen Sie sich Tutorials an. 2. Üben: Schreiben Sie Code und vollständige Übungen. 3. Überprüfung: Konsolidieren Sie den Inhalt, den Sie gelernt haben. 4. Projektpraxis: Wenden Sie an, was Sie in den tatsächlichen Projekten gelernt haben. Ein solcher strukturierter Lernplan kann Ihnen helfen, Python systematisch zu meistern und Karriereziele zu erreichen.

Maximieren 2 Stunden: Effektive Strategien für Python -LernstrategienMaximieren 2 Stunden: Effektive Strategien für Python -LernstrategienApr 20, 2025 am 12:20 AM

Zu den Methoden zum effizienten Erlernen von Python innerhalb von zwei Stunden gehören: 1. Überprüfen Sie das Grundkenntnis und stellen Sie sicher, dass Sie mit der Python -Installation und der grundlegenden Syntax vertraut sind. 2. Verstehen Sie die Kernkonzepte von Python wie Variablen, Listen, Funktionen usw.; 3.. Master Basic und Advanced Nutzung unter Verwendung von Beispielen; 4.. Lernen Sie gemeinsame Fehler und Debugging -Techniken; 5. Wenden Sie Leistungsoptimierung und Best Practices an, z. B. die Verwendung von Listenfunktionen und dem Befolgen des Pep8 -Stilhandbuchs.

Wählen Sie zwischen Python und C: Die richtige Sprache für SieWählen Sie zwischen Python und C: Die richtige Sprache für SieApr 20, 2025 am 12:20 AM

Python ist für Anfänger und Datenwissenschaften geeignet und C für Systemprogramme und Spieleentwicklung geeignet. 1. Python ist einfach und einfach zu bedienen, geeignet für Datenwissenschaft und Webentwicklung. 2.C bietet eine hohe Leistung und Kontrolle, geeignet für Spieleentwicklung und Systemprogrammierung. Die Wahl sollte auf Projektbedürfnissen und persönlichen Interessen beruhen.

Python vs. C: Eine vergleichende Analyse von ProgrammiersprachenPython vs. C: Eine vergleichende Analyse von ProgrammiersprachenApr 20, 2025 am 12:14 AM

Python eignet sich besser für Datenwissenschaft und schnelle Entwicklung, während C besser für Hochleistungen und Systemprogramme geeignet ist. 1. Python -Syntax ist prägnant und leicht zu lernen, geeignet für die Datenverarbeitung und wissenschaftliches Computer. 2.C hat eine komplexe Syntax, aber eine hervorragende Leistung und wird häufig in der Spieleentwicklung und der Systemprogrammierung verwendet.

2 Stunden am Tag: Das Potenzial des Python -Lernens2 Stunden am Tag: Das Potenzial des Python -LernensApr 20, 2025 am 12:14 AM

Es ist machbar, zwei Stunden am Tag zu investieren, um Python zu lernen. 1. Lernen Sie neues Wissen: Lernen Sie in einer Stunde neue Konzepte wie Listen und Wörterbücher. 2. Praxis und Übung: Verwenden Sie eine Stunde, um Programmierübungen durchzuführen, z. B. kleine Programme. Durch vernünftige Planung und Ausdauer können Sie die Kernkonzepte von Python in kurzer Zeit beherrschen.

Python vs. C: Lernkurven und BenutzerfreundlichkeitPython vs. C: Lernkurven und BenutzerfreundlichkeitApr 19, 2025 am 12:20 AM

Python ist leichter zu lernen und zu verwenden, während C leistungsfähiger, aber komplexer ist. 1. Python -Syntax ist prägnant und für Anfänger geeignet. Durch die dynamische Tippen und die automatische Speicherverwaltung können Sie die Verwendung einfach zu verwenden, kann jedoch zur Laufzeitfehler führen. 2.C bietet Steuerung und erweiterte Funktionen auf niedrigem Niveau, geeignet für Hochleistungsanwendungen, hat jedoch einen hohen Lernschwellenwert und erfordert manuellem Speicher und Typensicherheitsmanagement.

See all articles

Heiße KI -Werkzeuge

Undresser.AI Undress

Undresser.AI Undress

KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover

AI Clothes Remover

Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Undress AI Tool

Undress AI Tool

Ausziehbilder kostenlos

Clothoff.io

Clothoff.io

KI-Kleiderentferner

Video Face Swap

Video Face Swap

Tauschen Sie Gesichter in jedem Video mühelos mit unserem völlig kostenlosen KI-Gesichtstausch-Tool aus!

Heiße Werkzeuge

MantisBT

MantisBT

Mantis ist ein einfach zu implementierendes webbasiertes Tool zur Fehlerverfolgung, das die Fehlerverfolgung von Produkten unterstützen soll. Es erfordert PHP, MySQL und einen Webserver. Schauen Sie sich unsere Demo- und Hosting-Services an.

PHPStorm Mac-Version

PHPStorm Mac-Version

Das neueste (2018.2.1) professionelle, integrierte PHP-Entwicklungstool

MinGW – Minimalistisches GNU für Windows

MinGW – Minimalistisches GNU für Windows

Dieses Projekt wird derzeit auf osdn.net/projects/mingw migriert. Sie können uns dort weiterhin folgen. MinGW: Eine native Windows-Portierung der GNU Compiler Collection (GCC), frei verteilbare Importbibliotheken und Header-Dateien zum Erstellen nativer Windows-Anwendungen, einschließlich Erweiterungen der MSVC-Laufzeit zur Unterstützung der C99-Funktionalität. Die gesamte MinGW-Software kann auf 64-Bit-Windows-Plattformen ausgeführt werden.

mPDF

mPDF

mPDF ist eine PHP-Bibliothek, die PDF-Dateien aus UTF-8-codiertem HTML generieren kann. Der ursprüngliche Autor, Ian Back, hat mPDF geschrieben, um PDF-Dateien „on the fly“ von seiner Website auszugeben und verschiedene Sprachen zu verarbeiten. Es ist langsamer und erzeugt bei der Verwendung von Unicode-Schriftarten größere Dateien als Originalskripte wie HTML2FPDF, unterstützt aber CSS-Stile usw. und verfügt über viele Verbesserungen. Unterstützt fast alle Sprachen, einschließlich RTL (Arabisch und Hebräisch) und CJK (Chinesisch, Japanisch und Koreanisch). Unterstützt verschachtelte Elemente auf Blockebene (wie P, DIV),

ZendStudio 13.5.1 Mac

ZendStudio 13.5.1 Mac

Leistungsstarke integrierte PHP-Entwicklungsumgebung