首頁  >  文章  >  後端開發  >  Python中的資料規整技巧

Python中的資料規整技巧

PHPz
PHPz原創
2023-06-10 18:28:381183瀏覽

Python是一門廣泛應用於資料科學領域的高階程式語言,在資料收集、清洗、分析和視覺化方面都有廣泛應用。資料規整是資料處理的核心技能,本文將介紹Python中一些常用的資料規整技巧,幫助讀者更好地處理和分析資料。

  1. 資料型別轉換

在資料規則的過程中,常需要將不同的資料型別轉換,常見的資料型別包括字串、整數、浮點數和布林值等。 Python中提供了強大的型別轉換函數,如int()、float()、str()、bool()等,可以將一個資料型別轉換為另一個資料型別,例如:

# 将字符串转换成整数
age_str = '18'
age_int = int(age_str)

# 将整数转换成字符串
age_int = 18
age_str = str(age_int)

# 将浮点数转换成整数
height_float = 1.75
height_int = int(height_float)

# 将整数转换成布尔值
num = 0
is_zero = bool(num)     # False
  1. 資料去重

當處理大量資料時,可能會出現重複資料的情況,需要使用資料去重技巧。 Python中使用set()函數可以快速地移除清單中的重複元素,例如:

# 去除列表中的重复元素
lst = [1, 2, 3, 2, 4, 1]
lst_unique = list(set(lst))
print(lst_unique)       # [1, 2, 3, 4]
  1. 資料填入

在資料規整的過程中,有時需要將缺失值進行填充,以便更好地進行後續處理。 Python中使用fillna()函數可以方便地進行資料填充,例如:

# 对缺失值进行填充
import pandas as pd

df = pd.DataFrame({'name': ['Alice', 'Bob', 'Charlie'],
                   'age': [18, None, 21],
                   'gender': ['F', 'M', None]})

df_fill = df.fillna(value={'age': df['age'].mean(),
                           'gender': 'U'})
print(df_fill)

輸出結果如下:

       name   age gender
0     Alice  18.0      F
1       Bob  19.5      M
2  Charlie  21.0      U
  1. 資料重塑
##在在資料規整的過程中,可能需要進行資料重塑,以便更好地進行後續處理。 Python中使用pivot()函數可以方便地進行資料重塑,例如:

# 数据重塑
import pandas as pd

df = pd.DataFrame({'name': ['Alice', 'Bob', 'Charlie'],
                   'gender': ['F', 'M', 'M'],
                   'subject': ['Math', 'Math', 'English'],
                   'score': [90, 87, 88]})

df_res = df.pivot(index='name', columns='subject', values='score')
print(df_res)

輸出結果如下:

subject  English  Math
name                  
Alice        NaN  90.0
Bob          NaN  87.0
Charlie     88.0   NaN

    資料合併
  1. ##在實際操作中,資料通常儲存在不同的表格中,需要進行資料合併。 Python中使用merge()函數可以方便地進行資料合併,例如:
# 数据合并
import pandas as pd

df1 = pd.DataFrame({'name': ['Alice', 'Bob', 'Charlie'],
                    'age': [18, 19, 21],
                    'gender': ['F', 'M', 'M']})
df2 = pd.DataFrame({'name': ['Alice', 'Bob'],
                    'score': [90, 87]})

df_merge = pd.merge(df1, df2, on='name')
print(df_merge)

輸出結果如下:

       name  age gender  score
0     Alice   18      F     90
1       Bob   19      M     87

綜上所述,Python中的資料規則技巧包含資料型別轉換、資料去重、資料填充、資料重塑和資料合併等。這些技巧可以幫助讀者更好地處理和分析數據,並提高數據處理的效率和精確度。

以上是Python中的資料規整技巧的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn