


So führen Sie ein Resampling von Zeitreihendaten in Python durch
Zeitreihendaten sind eine Folge von Beobachtungen, die in festen Zeitintervallen erfasst werden. Die Daten können aus allen Bereichen stammen, beispielsweise aus den Bereichen Finanzen, Wirtschaft, Gesundheit und Umweltwissenschaften. Die von uns erfassten Zeitreihendaten können manchmal unterschiedliche Frequenzen oder Auflösungen aufweisen, die für unsere Analyse- und Datenmodellierungsprozesse möglicherweise nicht geeignet sind. In diesem Fall können wir die Zeitreihendaten durch Upsampling oder Downsampling erneut abtasten und so die Häufigkeit oder Auflösung der Zeitreihe ändern. In diesem Artikel werden verschiedene Methoden zum Upsampling oder Downsampling von Zeitreihendaten vorgestellt.
Upsampling
Upsampling bedeutet, die Häufigkeit der Zeitreihendaten zu erhöhen. Dies wird normalerweise durchgeführt, wenn wir eine höhere Auflösung oder häufigere Beobachtungen benötigen. Python bietet verschiedene Methoden zum Upsampling von Zeitreihendaten, einschließlich linearer Interpolation, Interpolation des nächsten Nachbarn und Polynominterpolation.
Syntax
DataFrame.resample(rule, *args, **kwargs) DataFrame.asfreq(freq, method=None) DataFrame.interpolate(method='linear', axis=0, limit=None, inplace=False, limit_direction='forward', limit_area=None)
hier,
Die resample-Funktion ist eine von der Pandas-Bibliothek bereitgestellte Methode zum erneuten Abtasten von Zeitreihendaten. Sie wird auf einen DataFrame angewendet und verwendet den Regelparameter, der die gewünschte Häufigkeit für das erneute Abtasten (*args) und Schlüsselwortargumente angibt (**kwargs) können bereitgestellt werden, um das Resampling-Verhalten anzupassen, z. B. um die Aggregationsmethode anzugeben oder fehlende Werte zu behandeln.
Die Methode asfreq wird in Verbindung mit der Resample-Funktion verwendet, um die Häufigkeit der Zeitreihendaten zu konvertieren. Sie verwendet den Parameter „freq“, der die gewünschte Häufigkeitszeichenfolge für die Ausgabe angibt alle fehlenden Werte, die während des Resampling-Prozesses eingeführt wurden, wie z. B. Vorwärtsfüllung, Rückwärtsfüllung oder Interpolation.
Die Interpolationsmethode wird verwendet, um fehlende Werte oder Lücken in Zeitreihendaten zu füllen. Es interpoliert gemäß der angegebenen Methode (z. B. „linear“, „nearest“, „spline“), um Werte zwischen vorhandenen Beobachtungen zu schätzen. Zusätzliche Parameter können die Interpolationsachse, die Auffüllgrenze für aufeinanderfolgende NaN-Werte und ob der DataFrame an Ort und Stelle geändert oder ein neuer DataFrame zurückgegeben werden soll, steuern.
Lineare Interpolation
Lineare Interpolation wird zum Upsampling von Zeitreihendaten verwendet. Es füllt Lücken, indem es gerade Linien zwischen Datenpunkten zeichnet. Die lineare Interpolation kann mithilfe der Resample-Funktion in der Pandas-Bibliothek implementiert werden.
Die chinesische Übersetzung vonBeispiel
lautet:Beispiel
Im folgenden Beispiel haben wir einen Zeitreihen-DataFrame mit drei Beobachtungen zu nicht aufeinanderfolgenden Daten. Wir konvertieren die Spalte „Datum“ in ein Datum/Uhrzeit-Format und legen sie als Index fest. Die Resample-Funktion wird verwendet, um die Daten auf a hochzurechnen tägliche Häufigkeit ('D') mit der asfreq-Methode. Schließlich füllt die Interpolationsmethode mit der Option 'linear' die Lücken zwischen den Datenpunkten mithilfe linearer Interpolation. Der DataFrame, df_upsampled, enthält die hochgetasteten Zeitreihendaten mit interpolierten Werten
import pandas as pd # Create a sample time series DataFrame data = {'Date': ['2023-06-01', '2023-06-03', '2023-06-06'], 'Value': [10, 20, 30]} df = pd.DataFrame(data) df['Date'] = pd.to_datetime(df['Date']) df.set_index('Date', inplace=True) # Upsample the data using linear interpolation df_upsampled = df.resample('D').asfreq().interpolate(method='linear') # Print the upsampled DataFrame print(df_upsampled)Ausgabe
Value
Date
2023-06-01 10.000000
2023-06-02 15.000000
2023-06-03 20.000000
2023-06-04 23.333333
2023-06-05 26.666667
2023-06-06 30.000000
Interpolation des nächsten NachbarnNearest Neighbor Interpolation ist eine einfache Methode, die die Lücken zwischen Datenpunkten mit der nächstgelegenen verfügbaren Beobachtung füllt. Diese Methode kann nützlich sein, wenn die Zeitreihe abrupte Änderungen aufweist oder wenn die Reihenfolge der Beobachtungen wichtig ist die Option „Nächster“, um die Interpolation des nächsten Nachbarn durchzuführen
Die chinesische Übersetzung von
Beispiellautet:
BeispielIm obigen Beispiel verwenden wir den gleichen ursprünglichen DataFrame wie zuvor. Nach dem Resampling mit der Frequenz „D“ füllt die Interpolationsmethode mit der Option „Nearest“ die Lücken, indem sie den resultierenden DataFrame, df_upsampled, kopiert hat eine tägliche Häufigkeit mit der Interpolation des nächsten Nachbarn.
import pandas as pd # Create a sample time series DataFrame data = {'Date': ['2023-06-01', '2023-06-03', '2023-06-06'], 'Value': [10, 20, 30]} df = pd.DataFrame(data) df['Date'] = pd.to_datetime(df['Date']) df.set_index('Date', inplace=True) # Upsample the data using nearest neighbor interpolation df_upsampled = df.resample('D').asfreq().interpolate(method='nearest') # Print the upsampled DataFrame print(df_upsampled)Ausgabe
Value
Date
2023-06-01 10.0
2023-06-02 10.0
2023-06-03 20.0
2023-06-04 20.0
2023-06-05 30.0
2023-06-06 30.0
DownsamplingDownsampling wird verwendet, um die Häufigkeit von Zeitreihendaten zu reduzieren, oft um einen umfassenderen Überblick über die Daten zu erhalten oder die Analyse zu vereinfachen. Python bietet verschiedene Downsampling-Techniken wie Mittelung, Summierung oder Maximierung von Werten über ein bestimmtes Zeitintervall.
Syntax
DataFrame.mean(axis=None, skipna=None, level=None, numeric_only=None, **kwargs)
Hier wird nach dem Resampling eine Aggregationsmethode wie Mittelwert, Summe oder Maximum angewendet, um einen einzelnen Wert zu berechnen, der die gruppierten Beobachtungen innerhalb jedes Resampling-Intervalls darstellt. Diese Methoden werden typischerweise beim Downsampling von Daten verwendet. Sie können direkt auf einen erneut abgetasteten DataFrame angewendet werden oder in Verbindung mit einer Resampling-Funktion verwendet werden, um die Daten auf der Grundlage einer bestimmten Häufigkeit (z. B. wöchentlich oder monatlich) durch Angabe geeigneter Regeln zu aggregieren. Die chinesische Übersetzung von
Mean Downsamplinglautet:
Average DownsamplingDurch das mittlere Downsampling wird der Durchschnitt der Datenpunkte innerhalb jedes Intervalls berechnet. Diese Methode ist nützlich, wenn Hochfrequenzdaten verarbeitet und repräsentative Werte für jedes Intervall erhalten werden. Sie können die Resampling-Funktion in Verbindung mit der Mean-Methode verwenden, um eine Mittelwert-Downsampling durchzuführen.
Example
的中文翻译为:示例
In the below example, we start with a daily time series DataFrame spanning the entire month of June 2023. The resample function with the 'W' frequency downsamples the data to weekly intervals. By applying the mean method, we obtain the average value within each week. The resulting DataFrame, df_downsampled, contains the mean-downsampled time series data.
import pandas as pd # Create a sample time series DataFrame with daily frequency data = {'Date': pd.date_range(start='2023-06-01', end='2023-06-30', freq='D'), 'Value': range(30)} df = pd.DataFrame(data) df.set_index('Date', inplace=True) # Downsampling using mean df_downsampled = df.resample('W').mean() # Print the downsampled DataFrame print(df_downsampled)
输出
Value Date 2023-06-04 1.5 2023-06-11 7.0 2023-06-18 14.0 2023-06-25 21.0 2023-07-02 27.0
Maximum Downsampling
最大降采样计算并设置每个间隔内的最高值。此方法适用于识别时间序列中的峰值或极端事件。在前面的示例中使用max而不是mean或sum允许我们执行最大降采样。
Example
的中文翻译为:示例
In the below example, we start with a daily time series DataFrame spanning the entire month of June 2023. The resample function with the 'W' frequency downsamples the data to weekly intervals. By applying the max method, we obtain the Maximum value within each week. The resulting DataFrame, df_downsampled, contains the maximum-downsampled time series data.
import pandas as pd # Create a sample time series DataFrame with daily frequency data = {'Date': pd.date_range(start='2023-06-01', end='2023-06-30', freq='D'), 'Value': range(30)} df = pd.DataFrame(data) df.set_index('Date', inplace=True) # Downsampling using mean df_downsampled = df.resample('W').max() # Print the downsampled DataFrame print(df_downsampled)
输出
Value Date 2023-06-04 3 2023-06-11 10 2023-06-18 17 2023-06-25 24 2023-07-02 29
结论
在本文中,我们讨论了如何使用Python对时间序列数据进行重新采样。Python提供了各种上采样和下采样技术。我们探讨了线性和最近邻插值用于上采样,以及均值和最大值插值用于下采样。您可以根据手头的问题使用任何一种上采样或下采样技术。
Das obige ist der detaillierte Inhalt vonSo führen Sie ein Resampling von Zeitreihendaten in Python durch. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Python und C haben jeweils ihre eigenen Vorteile, und die Wahl sollte auf Projektanforderungen beruhen. 1) Python ist aufgrund seiner prägnanten Syntax und der dynamischen Typisierung für die schnelle Entwicklung und Datenverarbeitung geeignet. 2) C ist aufgrund seiner statischen Tipp- und manuellen Speicherverwaltung für hohe Leistung und Systemprogrammierung geeignet.

Die Auswahl von Python oder C hängt von den Projektanforderungen ab: 1) Wenn Sie eine schnelle Entwicklung, Datenverarbeitung und Prototypdesign benötigen, wählen Sie Python. 2) Wenn Sie eine hohe Leistung, eine geringe Latenz und eine schließende Hardwarekontrolle benötigen, wählen Sie C.

Indem Sie täglich 2 Stunden Python -Lernen investieren, können Sie Ihre Programmierkenntnisse effektiv verbessern. 1. Lernen Sie neues Wissen: Lesen Sie Dokumente oder sehen Sie sich Tutorials an. 2. Üben: Schreiben Sie Code und vollständige Übungen. 3. Überprüfung: Konsolidieren Sie den Inhalt, den Sie gelernt haben. 4. Projektpraxis: Wenden Sie an, was Sie in den tatsächlichen Projekten gelernt haben. Ein solcher strukturierter Lernplan kann Ihnen helfen, Python systematisch zu meistern und Karriereziele zu erreichen.

Zu den Methoden zum effizienten Erlernen von Python innerhalb von zwei Stunden gehören: 1. Überprüfen Sie das Grundkenntnis und stellen Sie sicher, dass Sie mit der Python -Installation und der grundlegenden Syntax vertraut sind. 2. Verstehen Sie die Kernkonzepte von Python wie Variablen, Listen, Funktionen usw.; 3.. Master Basic und Advanced Nutzung unter Verwendung von Beispielen; 4.. Lernen Sie gemeinsame Fehler und Debugging -Techniken; 5. Wenden Sie Leistungsoptimierung und Best Practices an, z. B. die Verwendung von Listenfunktionen und dem Befolgen des Pep8 -Stilhandbuchs.

Python ist für Anfänger und Datenwissenschaften geeignet und C für Systemprogramme und Spieleentwicklung geeignet. 1. Python ist einfach und einfach zu bedienen, geeignet für Datenwissenschaft und Webentwicklung. 2.C bietet eine hohe Leistung und Kontrolle, geeignet für Spieleentwicklung und Systemprogrammierung. Die Wahl sollte auf Projektbedürfnissen und persönlichen Interessen beruhen.

Python eignet sich besser für Datenwissenschaft und schnelle Entwicklung, während C besser für Hochleistungen und Systemprogramme geeignet ist. 1. Python -Syntax ist prägnant und leicht zu lernen, geeignet für die Datenverarbeitung und wissenschaftliches Computer. 2.C hat eine komplexe Syntax, aber eine hervorragende Leistung und wird häufig in der Spieleentwicklung und der Systemprogrammierung verwendet.

Es ist machbar, zwei Stunden am Tag zu investieren, um Python zu lernen. 1. Lernen Sie neues Wissen: Lernen Sie in einer Stunde neue Konzepte wie Listen und Wörterbücher. 2. Praxis und Übung: Verwenden Sie eine Stunde, um Programmierübungen durchzuführen, z. B. kleine Programme. Durch vernünftige Planung und Ausdauer können Sie die Kernkonzepte von Python in kurzer Zeit beherrschen.

Python ist leichter zu lernen und zu verwenden, während C leistungsfähiger, aber komplexer ist. 1. Python -Syntax ist prägnant und für Anfänger geeignet. Durch die dynamische Tippen und die automatische Speicherverwaltung können Sie die Verwendung einfach zu verwenden, kann jedoch zur Laufzeitfehler führen. 2.C bietet Steuerung und erweiterte Funktionen auf niedrigem Niveau, geeignet für Hochleistungsanwendungen, hat jedoch einen hohen Lernschwellenwert und erfordert manuellem Speicher und Typensicherheitsmanagement.


Heiße KI -Werkzeuge

Undresser.AI Undress
KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover
Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Undress AI Tool
Ausziehbilder kostenlos

Clothoff.io
KI-Kleiderentferner

Video Face Swap
Tauschen Sie Gesichter in jedem Video mühelos mit unserem völlig kostenlosen KI-Gesichtstausch-Tool aus!

Heißer Artikel

Heiße Werkzeuge

MantisBT
Mantis ist ein einfach zu implementierendes webbasiertes Tool zur Fehlerverfolgung, das die Fehlerverfolgung von Produkten unterstützen soll. Es erfordert PHP, MySQL und einen Webserver. Schauen Sie sich unsere Demo- und Hosting-Services an.

PHPStorm Mac-Version
Das neueste (2018.2.1) professionelle, integrierte PHP-Entwicklungstool

MinGW – Minimalistisches GNU für Windows
Dieses Projekt wird derzeit auf osdn.net/projects/mingw migriert. Sie können uns dort weiterhin folgen. MinGW: Eine native Windows-Portierung der GNU Compiler Collection (GCC), frei verteilbare Importbibliotheken und Header-Dateien zum Erstellen nativer Windows-Anwendungen, einschließlich Erweiterungen der MSVC-Laufzeit zur Unterstützung der C99-Funktionalität. Die gesamte MinGW-Software kann auf 64-Bit-Windows-Plattformen ausgeführt werden.

mPDF
mPDF ist eine PHP-Bibliothek, die PDF-Dateien aus UTF-8-codiertem HTML generieren kann. Der ursprüngliche Autor, Ian Back, hat mPDF geschrieben, um PDF-Dateien „on the fly“ von seiner Website auszugeben und verschiedene Sprachen zu verarbeiten. Es ist langsamer und erzeugt bei der Verwendung von Unicode-Schriftarten größere Dateien als Originalskripte wie HTML2FPDF, unterstützt aber CSS-Stile usw. und verfügt über viele Verbesserungen. Unterstützt fast alle Sprachen, einschließlich RTL (Arabisch und Hebräisch) und CJK (Chinesisch, Japanisch und Koreanisch). Unterstützt verschachtelte Elemente auf Blockebene (wie P, DIV),

ZendStudio 13.5.1 Mac
Leistungsstarke integrierte PHP-Entwicklungsumgebung