Rumah  >  Artikel  >  pembangunan bahagian belakang  >  Apakah perbezaan antara bingkai data dan matriks dalam Python Pandas?

Apakah perbezaan antara bingkai data dan matriks dalam Python Pandas?

WBOY
WBOYke hadapan
2023-09-14 19:53:021175semak imbas

在Python Pandas中,数据帧(data frames)和矩阵(matrices)之间的区别是什么?

Dalam artikel ini kami akan menunjukkan kepada anda perbezaan antara bingkai data dan matriks dalam python panda.

Bingkai dan matriks data ialah kedua-dua struktur data dua dimensi. Secara umumnya, bingkai data boleh mengandungi berbilang jenis data (nombor, aksara, faktor, dll.), manakala matriks hanya boleh menyimpan satu jenis data.

Bingkai data dalam Python

Dalam Python, DataFrame ialah struktur data dua dimensi, jadual, boleh ubah yang boleh menyimpan data jadual yang mengandungi objek pelbagai jenis data. DataFrame mempunyai paksi yang dilabelkan dalam baris dan lajur. DataFrames ialah alat yang berguna dalam prapemprosesan data kerana ia menyediakan kaedah manipulasi data yang berharga. DataFrame juga boleh digunakan untuk mencipta jadual pangsi dan plot data menggunakan Matplotlib.

Aplikasi bingkai data

  • Bingkai data boleh melakukan pelbagai tugas seperti memasukkan formula statistik.

  • Pemprosesan data (Matriks tidak mungkin, mesti ditukar kepada bingkai data dahulu)

  • Tukar baris kepada lajur dan sebaliknya, sangat berguna dalam sains data.

Buat contoh bingkai data

Algoritma (langkah)

Berikut adalah algoritma/langkah yang perlu diikuti untuk melaksanakan tugas yang diperlukan -

  • Gunakan kata kunci import untuk mengimport modul panda, numpy dengan alias.

  • Gunakan fungsi DataFrame() modul panda untuk mencipta bingkai data.

  • Cetak bingkai data input.

Contoh

Atur cara berikut menggunakan fungsi DataFrame() untuk mengembalikan bingkai data -

# importing pandas, numpy modules with alias names
import pandas as pd
import numpy as np

# creating a dataframe
inputDataframe = pd.DataFrame({'Name': ['Virat', 'Rohit', 'Meera', 'Nick', 'Sana'], 'Jobrole': ['Developer', 'Analyst', 'Help Desk', 'Database Developer', 'Finance accountant'], 'Age': [25, 30, 28, 25, 40]})

# displaying the dataframe
print(inputDataframe)

Output

Apabila dilaksanakan, program di atas akan menjana output berikut -

   Name             Jobrole      Age
0  Virat            Developer    25
1  Rohit            Analyst      30
2  Meera            Help Desk    28
3  Nick  Database   Developer    25
4  Sana  Finance    accountant   40

Matriks dalam Python

Matriks ialah koleksi set data homogen yang disusun dalam grid segi empat tepat dua dimensi. Ia ialah tatasusunan m*n dengan jenis data yang sama. Ia dicipta dengan input vektor. Terdapat bilangan baris dan lajur yang tetap. Python menyokong pelbagai operasi aritmetik seperti penambahan, penolakan, pendaraban dan pembahagian pada Matriks.

Aplikasi matriks

  • Ia sangat berguna dalam ekonomi untuk mengira statistik seperti KDNK (Keluaran Dalam Negara Kasar) atau PI (Pendapatan Harga per Kapita).

  • Ia juga berguna untuk mengkaji litar elektrik dan elektronik.

  • Cetak bingkai data input.

  • Matriks digunakan untuk penyelidikan, seperti melukis graf.

  • Ini berguna dalam kebarangkalian dan statistik.

Pendaraban matriks dengan menukar matriks kepada bingkai data

Algoritma (langkah)

Berikut adalah algoritma/langkah yang perlu diikuti untuk melaksanakan tugas yang diperlukan -

  • Gunakan kata kunci import untuk mengimport modul pandas dengan alias.

  • Buat dua pembolehubah untuk menyimpan dua matriks input masing-masing.

  • Buat bingkai data untuk matriks pertama dan kedua menggunakan fungsi DataFrame() (Buat DataFrame) modul panda dan simpannya dalam pembolehubah berasingan. Data ini dimuatkan ke dalam DataFrames panda.

  • Cetak bingkai data matriks input 1.

  • Cetak dimensi (bentuk) matriks input 1 dengan menggunakan atribut shape.

  • Cetak bingkai data matriks input 2.

  • Cetak dimensi (bentuk) matriks input 2 dengan menggunakan atribut shape.

  • Gunakan fungsi dot() untuk mendarab matriks inputMatrix_1 dan inputMatrix_2 dan buat pembolehubah untuk menyimpannya.

  • Cetak matriks hasil pendaraban matriks inputMatrix_1 dan inputMatrix_2.

  • Cetak dimensi (bentuk) matriks yang terhasil dengan menggunakan atribut bentuk.

Contoh

Atur cara berikut menggunakan fungsi DataFrame() untuk mengembalikan bingkai data -

# importing pandas module
import pandas as pd

# input matrix 1
inputMatrix_1 = [[1, 2, 2],
   [1,  2, 0],
   [1,  0, 2]]

# input matrix 2
inputMatrix_2 = [[1, 0, 1],
   [2, 1, 1],
   [2, 1, 2]]

# creating a dataframe of first matrix
#(here data is loaded into a pandas DataFrames)
df_1 = pd.DataFrame(data=inputMatrix_1)

# creating a dataframe of second matrix
df_2 = pd.DataFrame(data=inputMatrix_2)

# printing the dataframe of input matrix 1
print("inputMatrix_1:")
print(df_1)

# printing the dimensions(shape) of input matrix 1
print("The dimensions(shape) of input matrix 1:")
print(df_1.shape)
print()

# printing the dataframe of input matrix 2
print("inputMatrix_2:")
print(df_2)

# printing the dimensions(shape) of input matrix 1
print("The dimensions(shape) of input matrix 2:")
print(df_2.shape)
print()

# multiplying both the matrices inputMatrix_1 and inputMatrix_2
result_mult = df_1.dot(df_2)

# Printing the resultant of matrix multiplication of inputMatrix_1 and inputMatrix_2
print("Resultant Matrix after Matrix multiplication:")
print(result_mult)

# printing the dimensions(shape) of resultant Matrix
print("The dimensions(shape) of Resultant Matrix:")
print(result_mult.shape)

Output

inputMatrix_1:
0 1 2
0 1 2 2
1 1 2 0
2 1 0 2
The dimensions(shape) of input matrix 1:
(3, 3)

inputMatrix_2:
0 1 2
0 1 0 1
1 2 1 1
2 2 1 2
The dimensions(shape) of input matrix 2:
(3, 3)

Resultant Matrix after Matrix multiplication:
0 1 2
0 9 4 7
1 5 2 3
2 5 2 5
The dimensions(shape) of Resultant Matrix:
(3, 3)

Di bawah adalah jadual perbezaan antara matriks dan bingkai data.

Matriks dan Bingkai Data

Matriks Bingkai Data
Ia adalah koleksi set data yang disusun dalam organisasi segi empat tepat dua dimensi Ia menyimpan jadual data dengan berbilang jenis data dalam berbilang lajur yang dipanggil medan.
Matriks ialah tatasusunan m*n dengan jenis data yang sama Bingkai data ialah senarai vektor yang sama panjang. Bingkai data ialah bentuk umum bagi matriks.
Matriks mempunyai bilangan baris dan lajur yang tetap. Bilangan baris dan lajur Bingkai Data adalah berubah-ubah.
Homogen Heterogen

Kesimpulan

Kami belajar tentang perbezaan antara matriks dan bingkai data dalam Python dalam aplikasi ini. Kami juga mempelajari cara membuat bingkai data dan cara menukar matriks kepada bingkai data.

Atas ialah kandungan terperinci Apakah perbezaan antara bingkai data dan matriks dalam Python Pandas?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Artikel ini dikembalikan pada:tutorialspoint.com. Jika ada pelanggaran, sila hubungi admin@php.cn Padam