Rumah >pembangunan bahagian belakang >Tutorial Python >Bagaimana untuk Menormalkan Lajur dalam Bingkai Data untuk Perbandingan dan Analisis?

Bagaimana untuk Menormalkan Lajur dalam Bingkai Data untuk Perbandingan dan Analisis?

Mary-Kate Olsen
Mary-Kate Olsenasal
2024-10-18 16:58:29889semak imbas

How to Normalize Columns in a Dataframe for Comparison and Analysis?

Menormalkan Lajur Bingkai Data

Dalam set data, lajur yang berbeza mempunyai julat nilai yang berbeza-beza. Ini boleh menyukarkan untuk membandingkan dan menganalisis data. Menormalkan lajur menskalakannya kepada julat biasa, biasanya antara 0 dan 1, membolehkan perbandingan dan analisis yang lebih mudah.

Satu kaedah untuk menormalkan lajur dalam Pandas, perpustakaan analisis data yang popular, ialah penormalan min. Ia melibatkan penolakan min daripada setiap nilai dan membahagikan hasilnya dengan sisihan piawai. Ini menterjemahkan nilai kepada min 0 dan sisihan piawai 1, seperti yang dilihat dalam formula:

normalized_df = (df - df.mean()) / df.std()

Sebagai alternatif, penormalan min-maks boleh digunakan. Kaedah ini menskalakan nilai berdasarkan nilai minimum dan maksimum dalam lajur. Formula untuk penormalan min-maks ialah:

normalized_df = (df - df.min()) / (df.max() - df.min())

Untuk menggunakan mana-mana kaedah, hanya gunakan formula yang disediakan pada bingkai data. Panda secara automatik menggunakan fungsi mengikut lajur, memastikan penormalan untuk setiap lajur secara bebas.

Atas ialah kandungan terperinci Bagaimana untuk Menormalkan Lajur dalam Bingkai Data untuk Perbandingan dan Analisis?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn