Rumah >pembangunan bahagian belakang >Tutorial Python >Bagaimanakah Saya Boleh Membahagikan Lajur Rentetan DataFrame Pandas kepada Berbilang Lajur?
Bagaimanakah untuk memisahkan lajur rentetan bingkai data kepada dua lajur?
Dalam bidang analisis data, menemui bingkai data dengan lajur rentetan yang perlu berpecah adalah perkara biasa. Untuk mencapai kejayaan ini, dua soalan penting timbul:
Penyelesaian terletak pada atribut str serba boleh Siri panda, khususnya antara muka pengindeksan:
df['AB'].str[0] # accesses the first element of each string df['AB'].str[1] # accesses the second element of each string
Dengan memanfaatkan antara muka pengindeksan dan pembongkaran tuple ini, kami boleh mencipta lajur baharu dengan elemen pisah:
df['A'], df['B'] = df['AB'].str.split('-').str
Sebagai alternatif, Pandas menyediakan kaedah terbina dalam yang mudah , str.split(), untuk membelah rentetan dan mengembalikan Siri secara automatik lists:
df['AB_split'] = df['AB'].str.split('-')
Untuk mengembangkan senarai ini ke dalam lajur yang berasingan, kami menggunakan parameter expand=True:
df[['A', 'B']] = df['AB'].str.split(' ', n=1, expand=True)
Untuk kes dengan panjang split yang berbeza-beza, expand=True mengendalikannya dengan anggun, memastikan panjang lajur yang konsisten:
df.join(df['AB'].str.split('-', expand=True).rename(columns={0:'A', 1:'B', 2:'C'}))
Melalui teknik ini, Panda memperkasakan anda untuk memisahkan rentetan dengan cekap lajur dan susun semula rangka data anda untuk memenuhi keperluan analisis khusus anda.
Atas ialah kandungan terperinci Bagaimanakah Saya Boleh Membahagikan Lajur Rentetan DataFrame Pandas kepada Berbilang Lajur?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!