Rumah > Artikel > Peranti teknologi > Gunakan lapan arahan ChatGPT ini untuk menyelesaikan tugasan Panda dengan cekap
Kita semua pernah mendengar tentang ChatGPT. Ia bukan sahaja mendapat perhatian daripada industri teknologi, tetapi juga menjadi tajuk utama dalam rangkaian media yang lebih luas.
Walaupun terdapat beberapa kritikan tentang prestasi dan kebolehpercayaannya pada tugasan yang lebih mudah, ChatGPT berprestasi baik dalam pelbagai tugas berbanding model bahasa besar (LLM) lain dan telah menjadi daya penggerak penting produktiviti.
Menggunakan ChatGPT untuk membersihkan dan menganalisis data Pandas boleh meningkatkan kecekapan kerja dengan ketara. Artikel ini memperkenalkan 8 contoh segera untuk mengajar anda cara menyelesaikan tugasan Pandas dengan bertanya kepada ChatGPT.
Petua pertama untuk menentukan peranannya:
Petua: Anda ialah Python yang mengajar saya menggunakan tutor perpustakaan Pandas. Saya tidak sabar-sabar untuk anda menerangkan kepada saya cara menggunakan Panda untuk melaksanakan tugas tertentu. Juga, sila tunjukkan saya kod dalam penjelasan anda.
Sebelum mula bertanya, saya memberikan struktur DataFrame, termasuk nama lajur dan jenis data.
Petua: Biar saya mula-mula memberitahu anda tentang DataFrame yang saya miliki. Kemudian saya akan mula bertanya soalan. Di bawah ialah nama lajur dan jenis data yang diberikan dalam bentuk kamus Python. Kekunci mewakili nama lajur dan nilai mewakili jenis data.
{'store': dtype('O'), 'product_group': dtype('O'), 'product_code': dtype('int64'), 'stock_qty': dtype(' int64'), 'kos': dtype('float64'), 'price': dtype('float64'), 'last_week_sales': dtype('int64'), 'last_month_sales': dtype('int64')}
Sampel set data yang disediakan daripada data simulasi digunakan di sini. Anda boleh memuat turunnya daripada repo repositori dataset (https://github.com/SonerYldrm/datasets). Fail itu bernama sales_data_with_stores.csv..
Berikut ialah DataFrame yang disediakan untuk anda sebagai rujukan anda:
5 baris pertama DataFrame
Sekarang kita boleh mulakan mengerjakan Misi Pandas tercapai.
Petunjuk: Beritahu saya cara mengira purata jualan minggu lepas untuk setiap kedai.
Walaupun ini hanyalah barisan kod yang mudah, bagi orang yang baru mula belajar Panda, mungkin mengambil sedikit masa untuk memahami. Berikut ialah jawapan yang diberikan oleh ChatGPT:
Coretan kod ujian yang diberikan oleh ChatGPT, salin dan tampal seperti yang ditunjukkan di bawah.
# 导入pandasimport pandas as pd# 假设'df'是你的DataFrameaverage_sales = df.groupby('store')['last_week_sales'].mean()
ChatGPT juga menyediakan penjelasan terperinci tentang cara kod dilaksanakan dan jenis output bersama kod.
Petunjuk: Beritahu saya cara mencari jumlah keuntungan bagi setiap kedai bulan lepas.
Untuk tugasan ini, ChatGPT perlu memikirkan cara mengira keuntungan terlebih dahulu. Mari lihat responsnya:
# 计算每个产品的利润df['last_month_profit'] = (df['price'] - df['cost']) * df['last_month_sales']# 计算每个商店的总利润total_profit = df.groupby('store')['last_month_profit'].sum()
Semasa berurusan dengan data dunia sebenar, kami sering menghadapi cabaran kehilangan nilai. Uji cara ChatGPT mengendalikan tugas yang kurang mudah.
Petua: Terdapat beberapa nilai yang tiada dalam lajur kuantiti inventori. Saya ingin menggantikan nilai yang hilang dengan purata kuantiti inventori untuk kedai itu. Beritahu saya bagaimana untuk menyelesaikan tugas ini.
# 计算每个商店的平均库存数量average_stock_qty_per_store = df.groupby('store')['stock_qty'].transform('mean')# 用该商店的平均库存数量替换'stock_qty'中的缺失值df['stock_qty'].fillna(average_stock_qty_per_store, inplace=True)
Terdapat banyak cara untuk menyelesaikan tugasan ini, dan menggunakan fungsi transformasi ialah salah satu cara yang lebih berkesan.
Fungsi transformasi adalah penting Sebab untuk menggunakan fungsi transformasi untuk menyelesaikan tugasan ini adalah seperti berikut:
Fungsi transformasi adalah serupa dengan fungsi guna, tetapi tidak seperti fungsi guna, fungsi transformasi boleh mengembalikan saiz yang sama seperti Siri input, yang menjadikannya berguna apabila melaksanakan operasi dan penyiaran vektor, terutamanya apabila digunakan dengan objek kumpulan.
Petunjuk: Beritahu saya cara mencari tiga produk teratas dengan volum jualan tertinggi untuk setiap kedai bulan lepas.
# 首先,按'store'和'last_month_sales'对DataFrame进行排序df_sorted = df.sort_values(['store', 'last_month_sales'], ascending=[True, False])# 然后,按'store'分组,并使用apply方法选择每个组的前3行top_3_products = df_sorted.groupby('store').head(3)
它首先对整个DataFrame进行排序。我们也可以在每个组内进行排序。让我们看看ChatGPT是否知道该如何做到这一点。
提示:是否有另一种方法可以在不先对DataFrame进行排序的情况下完成此任务?
def top_3_products(group):return group.nlargest(3, 'last_month_sales')top_3_df = df.groupby('store').apply(top_3_products)
更高效的方法可能是首先对整个DataFrame进行排序。此示例只是想观察ChatGPT是否能提供不同的解决方案。
提示:我想看到每个商店的上周表现与上月表现进行比较。
这是一个简单的任务,但提示并没有直接告诉ChatGPT如何完成。让我们看看它的表现如何。
# 计算上周和上个月每个店的总销售额total_sales_last_week = df.groupby('store')['last_week_sales'].sum()total_sales_last_month = df.groupby('store')['last_month_sales'].sum()# 创建一个新的DataFrame来存储这些信息performance_df = pd.DataFrame({'LastWeekSales': total_sales_last_week,'LastMonthSales': total_sales_last_month,})# 计算从上个月到上周销售额的变化performance_df['SalesChange'] = performance_df['LastWeekSales'] - (performance_df['LastMonthSales'] / 4)
作为对上周与上月的表现相比较的反应,它找到了上周销售额与上月销售额四分之一之间存在差异,这是非常合理的。
它创建的DataFrame如下所示:
提示:创建一个名为critical_stock的新列,如果stock_qty小于500,则取值为1,否则取值为0。
ChatGPT为这个任务给出了3个选项,以下是我更喜欢的两个:
# 第一种选项df['critical_stock'] = df['stock_qty'].apply(lambda x: 1 if x <h2>示例 8</h2><blockquote style="margin-top: 5px; margin-bottom: 5px; padding-left: 1em; margin-left: 0px; border-left: 3px solid rgb(238, 238, 238); opacity: 0.6;"><p>提示:以大小、缺失值、数据类型和列统计信息的形式创建一个DataFrame的摘要。</p></blockquote><p>虽然DataFrame的函数和方法总结起来很简单,但ChatGPT在整理它们时做得非常出色,呈现出整洁清晰的排版。</p><p>如下的是ChatGPT生成的代码:</p><pre class="brush:php;toolbar:false"># 导入必要的库import pandas as pd# DataFrame大小print("DataFrame Size:")print(df.shape)print("\n")# 缺失值print("Missing Values:")print(df.isnull().sum())print("\n")# 数据类型print("Data Types:")print(df.dtypes)print("\n")# 列统计信息print("Column Statistics:")print(df.describe(include='all'))
以上示例展示了ChatGPT如何在数据分析中,尤其是在Pandas中,革命性地改变了常见任务的完成方式。我们不仅提高了效率,还对可以在Pandas中完成的复杂操作有了更丰富的理解。
Atas ialah kandungan terperinci Gunakan lapan arahan ChatGPT ini untuk menyelesaikan tugasan Panda dengan cekap. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!