首頁 >後端開發 >Python教學 >Python利用Pandas進行資料分析的方法詳解

Python利用Pandas進行資料分析的方法詳解

WBOY
WBOY轉載
2022-09-06 17:30:013811瀏覽

【相關推薦:Python3影片教學

Pandas是最受歡迎的用於資料分析的Python 庫。它提供高度最佳化的效能,後端原始碼完全用CPython編寫。

我們可以透過以下方式分析pandas 中的資料:

  • #1.Series

  • 2.資料幀

Series

Series 是pandas 中定義的一維(1-D)數組,可用來儲存任何資料類型。

程式碼#1

建立Series

# 创建 Series 的程序

# 导入 Panda 库
import pandas as pd

# 使用数据和索引创建 Series
a = pd.Series(Data, index = Index)

在這裡,資料可以是:

  • 一個標量值,可以是integerValue、字串
  • 可以是鍵值對的Python 字典
  • 一個Ndarray

注意:預設情況下,索引從0、1、2、...(n-1) 開始,其中n 是資料長度。

程式碼#2

當Data 包含標量值時

# 使用标量值创建 Series 的程序

# 数值数据
Data =[1, 3, 4, 5, 6, 2, 9]

# 使用默认索引值创建系列
s = pd.Series(Data)	

# 预定义的索引值
Index =['a', 'b', 'c', 'd', 'e', 'f', 'g']

# 创建具有预定义索引值的系列
si = pd.Series(Data, Index)

輸出

具有預設索引的標量資料

有索引的標量資料

代碼#3

#當資料包含字典時

# 创建词典 Series 程序
dictionary ={'a':1, 'b':2, 'c':3, 'd':4, 'e':5}

# 创建字典类型 Series
sd = pd.Series(dictionary)

輸出

字典類型資料

程式碼#4

當Data 包含Ndarray

# 创建 ndarray series 的程序

# 定义二维数组
Data =[[2, 3, 4], [5, 6, 7]]

# 创建一系列二维数组
snd = pd.Series(Data)

#輸出

##資料作為Ndarray

資料框

DataFrames是pandas 中定義的二維(2-D)資料結構,由行和列組成。

程式碼#1

建立DataFrame

# 创建 DataFrame 的程序

# 导入库
import pandas as pd

# 使用数据创建 DataFrame
a = pd.DataFrame(Data)

在這裡,資料可以是:

    一本或多本
  • 字典
  • 一個或多個
  • Series
  • #2D-numpy Ndarray
程式碼#2

當資料是字典時

# 使用两个字典创建数据框的程序

# 定义字典 1
dict1 ={'a':1, 'b':2, 'c':3, 'd':4}

# 定义字典 2
dict2 ={'a':5, 'b':6, 'c':7, 'd':8, 'e':9}

# 用 dict1 和 dict2 定义数据
Data = {'first':dict1, 'second':dict2}

# 创建数据框
df = pd.DataFrame(Data)

#輸出

##帶有兩個字典的DataFrame

程式碼#3

當資料是Series時

# 创建三个系列的Dataframe的程序
import pandas as pd

# 定义 series 1
s1 = pd.Series([1, 3, 4, 5, 6, 2, 9])

# 定义 series 2
s2 = pd.Series([1.1, 3.5, 4.7, 5.8, 2.9, 9.3])

# 定义 series 3
s3 = pd.Series(['a', 'b', 'c', 'd', 'e'])	

# 定义 Data
Data ={'first':s1, 'second':s2, 'third':s3}

# 创建 DataFrame
dfseries = pd.DataFrame(Data)
##輸出

三個Series 的DataFrame

程式碼#4

當Data 為2D-numpy ndarray

注意:在建立2D 陣列的DataFrame 時必須保持一個約束- 2D 陣列的維度必須相同。

# 从二维数组创建 DataFrame 的程序

# 导入库
import pandas as pd

# 定义 2d 数组 1
d1 =[[2, 3, 4], [5, 6, 7]]

# 定义 2d 数组 2
d2 =[[2, 4, 8], [1, 3, 9]]

# 定义 Data
Data ={'first': d1, 'second': d2}

# 创建 DataFrame
df2d = pd.DataFrame(Data)
輸出

#帶有2d ndarray 的DataFrame

【相關推薦:

Python3影片教學

以上是Python利用Pandas進行資料分析的方法詳解的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文轉載於:jb51.net。如有侵權,請聯絡admin@php.cn刪除