cari
Rumahpembangunan bahagian belakangTutorial PythonBagaimana untuk mengambil semula data siri masa dalam Python

Bagaimana untuk mengambil semula data siri masa dalam Python

Aug 29, 2023 pm 08:13 PM
pythonsiri masaPensampelan semula

Bagaimana untuk mengambil semula data siri masa dalam Python

Data siri masa ialah urutan pemerhatian yang dikumpul pada selang masa tetap. Data boleh datang dari mana-mana bidang, seperti kewangan, ekonomi, kesihatan dan sains alam sekitar. Data siri masa yang kami kumpul kadangkala mungkin mempunyai frekuensi atau resolusi yang berbeza, yang mungkin tidak sesuai untuk analisis dan proses pemodelan data kami. Dalam kes ini, kita boleh sampel semula data siri masa dengan pensampelan naik atau turun, sekali gus menukar kekerapan atau resolusi siri masa. Artikel ini akan memperkenalkan kaedah yang berbeza untuk upsample atau downsample data siri masa.

Upsampling

Upsampling bermaksud meningkatkan kekerapan data siri masa Ini biasanya dilakukan apabila kita memerlukan resolusi yang lebih tinggi atau pemerhatian yang lebih kerap Python menyediakan beberapa kaedah untuk meningkatkan data siri masa, termasuk interpolasi linear, jiran terdekat. interpolasi, dan interpolasi polinomial.

Sintaks

DataFrame.resample(rule, *args, **kwargs)
DataFrame.asfreq(freq, method=None)
DataFrame.interpolate(method='linear', axis=0, limit=None, inplace=False, limit_direction='forward', limit_area=None)

Di sini,

  • Fungsi resample ialah kaedah yang disediakan oleh pustaka panda untuk sampel semula data siri masa Ia digunakan pada DataFrame dan mengambil parameter peraturan, yang menentukan kekerapan yang dikehendaki untuk pensampelan semula. Argumen tambahan (*args) dan argumen kata kunci (**kwargs) boleh disediakan untuk menyesuaikan gelagat pensampelan semula, seperti menentukan kaedah pengagregatan atau mengendalikan nilai yang tiada.

  • Kaedah asfreq digunakan bersama-sama dengan fungsi sampel semula untuk menukar frekuensi data siri masa Ia mengambil parameter freq, yang menentukan rentetan frekuensi yang dikehendaki output. Parameter kaedah pilihan membenarkan menentukan cara mengendalikan sebarang nilai yang hilang yang diperkenalkan semasa proses pensampelan semula, seperti pengisian ke hadapan, pengisian ke belakang atau interpolasi.

  • Kaedah interpolasi digunakan untuk mengisi nilai yang hilang atau jurang dalam data siri masa. Ia interpolasi mengikut kaedah yang ditentukan (cth. 'linear', 'terhampir', 'spline') untuk menganggar nilai antara cerapan sedia ada. Parameter tambahan boleh mengawal paksi interpolasi, had padding untuk nilai NaN berturut-turut dan sama ada untuk mengubah suai DataFrame di tempat atau mengembalikan DataFrame baharu.

interpolasi linear

Interpolasi linear digunakan untuk meningkatkan data siri masa. Ia mengisi jurang dengan melukis garis lurus antara titik data. Interpolasi linear boleh dilaksanakan menggunakan fungsi resample dalam perpustakaan panda.

Terjemahan bahasa Cina bagi

Contoh

ialah:

Contoh

Dalam contoh di bawah, kami mempunyai DataFrame siri masa dengan tiga pemerhatian pada tarikh bukan berturut-turut Kami menukar lajur 'Tarikh' kepada format masa tarikh dan menetapkannya sebagai indeks Fungsi sampel semula data kepada frekuensi harian ('D') menggunakan kaedah asfreq Akhir sekali, kaedah interpolasi dengan pilihan 'linear' mengisi jurang antara titik data menggunakan interpolasi linear, df_upsampled, mengandungi data siri masa yang telah ditambah nilai.

import pandas as pd

# Create a sample time series DataFrame
data = {'Date': ['2023-06-01', '2023-06-03', '2023-06-06'],
        'Value': [10, 20, 30]}
df = pd.DataFrame(data)
df['Date'] = pd.to_datetime(df['Date'])
df.set_index('Date', inplace=True)

# Upsample the data using linear interpolation
df_upsampled = df.resample('D').asfreq().interpolate(method='linear')

# Print the upsampled DataFrame
print(df_upsampled)

Output

                Value
Date                 
2023-06-01  10.000000
2023-06-02  15.000000
2023-06-03  20.000000
2023-06-04  23.333333
2023-06-05  26.666667
2023-06-06  30.000000

Interpolasi jiran terdekat

Interpolasi jiran terdekat ialah kaedah mudah yang mengisi kekosongan antara titik data dengan pemerhatian terdekat yang tersedia. Kaedah ini boleh berguna apabila siri masa menunjukkan perubahan mendadak atau apabila susunan pemerhatian penting digunakan dengan pilihan 'terdekat' untuk melakukan interpolasi jiran terdekat

. Terjemahan bahasa Cina bagi

Contoh

ialah:

Contoh

Dalam contoh di atas, kami menggunakan DataFrame asal yang sama seperti sebelum ini Selepas pensampelan semula dengan frekuensi 'D', kaedah interpolasi dengan pilihan 'terhampir' mengisi jurang dengan menyalin dataFrame yang terhasil. df_upsampled, kini mempunyai kekerapan harian dengan interpolasi jiran terdekat.

import pandas as pd

# Create a sample time series DataFrame
data = {'Date': ['2023-06-01', '2023-06-03', '2023-06-06'],
        'Value': [10, 20, 30]}
df = pd.DataFrame(data)
df['Date'] = pd.to_datetime(df['Date'])
df.set_index('Date', inplace=True)

# Upsample the data using nearest neighbor interpolation
df_upsampled = df.resample('D').asfreq().interpolate(method='nearest')

# Print the upsampled DataFrame
print(df_upsampled)

Output

            Value
Date             
2023-06-01   10.0
2023-06-02   10.0
2023-06-03   20.0
2023-06-04   20.0
2023-06-05   30.0
2023-06-06   30.0

Downsampling

Downsampling digunakan untuk mengurangkan kekerapan data siri masa, biasanya untuk mendapatkan paparan data yang lebih luas atau untuk memudahkan analisis. Python menawarkan teknik pensampelan turun yang berbeza, seperti purata, menjumlahkan atau memaksimumkan nilai dalam selang masa tertentu.

Sintaks

DataFrame.mean(axis=None, skipna=None, level=None, numeric_only=None, **kwargs)

Di sini, kaedah pengagregatan, seperti min, jumlah atau maksimum , digunakan selepas pensampelan semula untuk mengira nilai tunggal yang mewakili pemerhatian berkumpulan dalam setiap selang pensampelan semula. Kaedah ini biasanya digunakan semasa menurunkan sampel data. Ia boleh digunakan secara langsung pada DataFrame sampel semula, atau ia boleh digunakan bersama dengan fungsi pensampelan semula untuk mengagregat data berdasarkan kekerapan tertentu (seperti mingguan atau bulanan) dengan menyatakan peraturan yang sesuai.

Terjemahan bahasa Cina bagi

Min Pensampelan Rendah

ialah:

min Pensampelan Penurunan

Min pensampelan rendah mengira purata titik data dalam setiap selang. Kaedah ini berguna apabila memproses data frekuensi tinggi dan mendapatkan nilai perwakilan untuk setiap selang. Anda boleh menggunakan fungsi sampel semula bersama-sama dengan kaedah min untuk melaksanakan pensampelan turun min.

Example

的中文翻译为:

示例

In the below example, we start with a daily time series DataFrame spanning the entire month of June 2023. The resample function with the 'W' frequency downsamples the data to weekly intervals. By applying the mean method, we obtain the average value within each week. The resulting DataFrame, df_downsampled, contains the mean-downsampled time series data.

import pandas as pd

# Create a sample time series DataFrame with daily frequency
data = {'Date': pd.date_range(start='2023-06-01', end='2023-06-30', freq='D'),
        'Value': range(30)}
df = pd.DataFrame(data)
df.set_index('Date', inplace=True)

# Downsampling using mean
df_downsampled = df.resample('W').mean()

# Print the downsampled DataFrame
print(df_downsampled)

输出

            Value
Date             
2023-06-04    1.5
2023-06-11    7.0
2023-06-18   14.0
2023-06-25   21.0
2023-07-02   27.0

Maximum Downsampling

最大降采样计算并设置每个间隔内的最高值。此方法适用于识别时间序列中的峰值或极端事件。在前面的示例中使用max而不是mean或sum允许我们执行最大降采样。

Example

的中文翻译为:

示例

In the below example, we start with a daily time series DataFrame spanning the entire month of June 2023. The resample function with the 'W' frequency downsamples the data to weekly intervals. By applying the max method, we obtain the Maximum value within each week. The resulting DataFrame, df_downsampled, contains the maximum-downsampled time series data.

import pandas as pd
# Create a sample time series DataFrame with daily frequency
data = {'Date': pd.date_range(start='2023-06-01', end='2023-06-30', freq='D'),
        'Value': range(30)}
df = pd.DataFrame(data)
df.set_index('Date', inplace=True)

# Downsampling using mean
df_downsampled = df.resample('W').max()

# Print the downsampled DataFrame
print(df_downsampled)

输出

            Value
Date             
2023-06-04      3
2023-06-11     10
2023-06-18     17
2023-06-25     24
2023-07-02     29

结论

在本文中,我们讨论了如何使用Python对时间序列数据进行重新采样。Python提供了各种上采样和下采样技术。我们探讨了线性和最近邻插值用于上采样,以及均值和最大值插值用于下采样。您可以根据手头的问题使用任何一种上采样或下采样技术。

Atas ialah kandungan terperinci Bagaimana untuk mengambil semula data siri masa dalam Python. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan
Artikel ini dikembalikan pada:tutorialspoint. Jika ada pelanggaran, sila hubungi admin@php.cn Padam
Python vs C: Memahami perbezaan utamaPython vs C: Memahami perbezaan utamaApr 21, 2025 am 12:18 AM

Python dan C masing -masing mempunyai kelebihan sendiri, dan pilihannya harus berdasarkan keperluan projek. 1) Python sesuai untuk pembangunan pesat dan pemprosesan data kerana sintaks ringkas dan menaip dinamik. 2) C sesuai untuk prestasi tinggi dan pengaturcaraan sistem kerana menaip statik dan pengurusan memori manual.

Python vs C: Bahasa mana yang harus dipilih untuk projek anda?Python vs C: Bahasa mana yang harus dipilih untuk projek anda?Apr 21, 2025 am 12:17 AM

Memilih Python atau C bergantung kepada keperluan projek: 1) Jika anda memerlukan pembangunan pesat, pemprosesan data dan reka bentuk prototaip, pilih Python; 2) Jika anda memerlukan prestasi tinggi, latensi rendah dan kawalan perkakasan yang rapat, pilih C.

Mencapai matlamat python anda: kekuatan 2 jam sehariMencapai matlamat python anda: kekuatan 2 jam sehariApr 20, 2025 am 12:21 AM

Dengan melabur 2 jam pembelajaran python setiap hari, anda dapat meningkatkan kemahiran pengaturcaraan anda dengan berkesan. 1. Ketahui Pengetahuan Baru: Baca dokumen atau tutorial menonton. 2. Amalan: Tulis kod dan latihan lengkap. 3. Kajian: Menyatukan kandungan yang telah anda pelajari. 4. Amalan Projek: Sapukan apa yang telah anda pelajari dalam projek sebenar. Pelan pembelajaran berstruktur seperti ini dapat membantu anda menguasai Python secara sistematik dan mencapai matlamat kerjaya.

Memaksimumkan 2 Jam: Strategi Pembelajaran Python BerkesanMemaksimumkan 2 Jam: Strategi Pembelajaran Python BerkesanApr 20, 2025 am 12:20 AM

Kaedah untuk belajar python dengan cekap dalam masa dua jam termasuk: 1. Semak pengetahuan asas dan pastikan anda sudah biasa dengan pemasangan Python dan sintaks asas; 2. Memahami konsep teras python, seperti pembolehubah, senarai, fungsi, dan lain -lain; 3. Menguasai penggunaan asas dan lanjutan dengan menggunakan contoh; 4. Belajar kesilapan biasa dan teknik debugging; 5. Memohon pengoptimuman prestasi dan amalan terbaik, seperti menggunakan komprehensif senarai dan mengikuti panduan gaya PEP8.

Memilih antara python dan c: bahasa yang sesuai untuk andaMemilih antara python dan c: bahasa yang sesuai untuk andaApr 20, 2025 am 12:20 AM

Python sesuai untuk pemula dan sains data, dan C sesuai untuk pengaturcaraan sistem dan pembangunan permainan. 1. Python adalah mudah dan mudah digunakan, sesuai untuk sains data dan pembangunan web. 2.C menyediakan prestasi dan kawalan yang tinggi, sesuai untuk pembangunan permainan dan pengaturcaraan sistem. Pilihan harus berdasarkan keperluan projek dan kepentingan peribadi.

Python vs C: Analisis perbandingan bahasa pengaturcaraanPython vs C: Analisis perbandingan bahasa pengaturcaraanApr 20, 2025 am 12:14 AM

Python lebih sesuai untuk sains data dan perkembangan pesat, manakala C lebih sesuai untuk prestasi tinggi dan pengaturcaraan sistem. 1. Sintaks Python adalah ringkas dan mudah dipelajari, sesuai untuk pemprosesan data dan pengkomputeran saintifik. 2.C mempunyai sintaks kompleks tetapi prestasi yang sangat baik dan sering digunakan dalam pembangunan permainan dan pengaturcaraan sistem.

2 jam sehari: potensi pembelajaran python2 jam sehari: potensi pembelajaran pythonApr 20, 2025 am 12:14 AM

Adalah mungkin untuk melabur dua jam sehari untuk belajar Python. 1. Belajar Pengetahuan Baru: Ketahui konsep baru dalam satu jam, seperti senarai dan kamus. 2. Amalan dan Amalan: Gunakan satu jam untuk melakukan latihan pengaturcaraan, seperti menulis program kecil. Melalui perancangan dan ketekunan yang munasabah, anda boleh menguasai konsep teras Python dalam masa yang singkat.

Python vs C: Lengkung pembelajaran dan kemudahan penggunaanPython vs C: Lengkung pembelajaran dan kemudahan penggunaanApr 19, 2025 am 12:20 AM

Python lebih mudah dipelajari dan digunakan, manakala C lebih kuat tetapi kompleks. 1. Sintaks Python adalah ringkas dan sesuai untuk pemula. Penaipan dinamik dan pengurusan memori automatik menjadikannya mudah digunakan, tetapi boleh menyebabkan kesilapan runtime. 2.C menyediakan kawalan peringkat rendah dan ciri-ciri canggih, sesuai untuk aplikasi berprestasi tinggi, tetapi mempunyai ambang pembelajaran yang tinggi dan memerlukan memori manual dan pengurusan keselamatan jenis.

See all articles

Alat AI Hot

Undresser.AI Undress

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Clothoff.io

Penyingkiran pakaian AI

Video Face Swap

Video Face Swap

Tukar muka dalam mana-mana video dengan mudah menggunakan alat tukar muka AI percuma kami!

Alat panas

SublimeText3 versi Cina

SublimeText3 versi Cina

Versi Cina, sangat mudah digunakan

mPDF

mPDF

mPDF ialah perpustakaan PHP yang boleh menjana fail PDF daripada HTML yang dikodkan UTF-8. Pengarang asal, Ian Back, menulis mPDF untuk mengeluarkan fail PDF "dengan cepat" dari tapak webnya dan mengendalikan bahasa yang berbeza. Ia lebih perlahan dan menghasilkan fail yang lebih besar apabila menggunakan fon Unicode daripada skrip asal seperti HTML2FPDF, tetapi menyokong gaya CSS dsb. dan mempunyai banyak peningkatan. Menyokong hampir semua bahasa, termasuk RTL (Arab dan Ibrani) dan CJK (Cina, Jepun dan Korea). Menyokong elemen peringkat blok bersarang (seperti P, DIV),

Pelayar Peperiksaan Selamat

Pelayar Peperiksaan Selamat

Pelayar Peperiksaan Selamat ialah persekitaran pelayar selamat untuk mengambil peperiksaan dalam talian dengan selamat. Perisian ini menukar mana-mana komputer menjadi stesen kerja yang selamat. Ia mengawal akses kepada mana-mana utiliti dan menghalang pelajar daripada menggunakan sumber yang tidak dibenarkan.

PhpStorm versi Mac

PhpStorm versi Mac

Alat pembangunan bersepadu PHP profesional terkini (2018.2.1).

Notepad++7.3.1

Notepad++7.3.1

Editor kod yang mudah digunakan dan percuma