Maison >Périphériques technologiques >IA >Faites bon usage de ces huit instructions ChatGPT pour effectuer efficacement les tâches Pandas
Nous avons tous entendu parler de ChatGPT. Il a non seulement retenu l’attention de l’industrie technologique, mais a également fait la une des médias dans un plus large éventail de médias.
Malgré quelques critiques sur ses performances et sa fiabilité sur des tâches plus simples, ChatGPT fonctionne bien dans une variété de tâches par rapport à d'autres grands modèles de langage (LLM) et est devenu un moteur important de productivité.
L'application de ChatGPT pour nettoyer et analyser les données Pandas peut améliorer considérablement l'efficacité du travail. Cet article présente 8 exemples d'invites pour vous apprendre à effectuer des tâches Pandas en demandant à ChatGPT.
Premier conseil pour identifier son rôle :
Conseil : Vous êtes un tuteur The Python qui m'a appris à utiliser la bibliothèque Pandas. J'ai hâte que vous m'expliquiez comment utiliser Pandas pour effectuer une tâche spécifique. Veuillez également me montrer le code dans votre explication.
Avant de commencer à demander, j'ai donné la structure du DataFrame, y compris les noms de colonnes et les types de données.
Conseil : Laissez-moi d'abord vous parler du DataFrame que je possède. Ensuite, je commencerai à poser des questions. Vous trouverez ci-dessous les noms de colonnes et les types de données indiqués sous forme de dictionnaire Python. Les clés représentent les noms de colonnes et les valeurs représentent les types de données.
{'store' : dtype('O'), 'product_group' : dtype('O'), 'product_code' : dtype('int64'), 'stock_qty' : dtype('int64'), 'cost' : dtype('float64'), 'price' : dtype('float64'), 'last_week_sales' : dtype('int64'), 'last_month_sales' : dtype('int64') }
Un exemple d'ensemble de données préparé à partir de données simulées est utilisé ici. Vous pouvez le télécharger à partir du dépôt du référentiel des ensembles de données (https://github.com/SonerYldrm/datasets). Le fichier est nommé sales_data_with_stores.csv..
Voici le DataFrame qui vous est fourni pour votre référence :
Les 5 premières lignes du DataFrame#🎜🎜 ## 🎜🎜#Maintenant, nous pouvons commencer la tâche Pandas.
Exemple 1
Indice : Dites-moi comment calculer la moyenne des ventes de la semaine dernière pour chaque magasin.Bien qu'il ne s'agisse que d'une simple ligne de code, pour les personnes qui commencent tout juste à apprendre Pandas, la compréhension peut prendre un certain temps. Voici la réponse donnée par ChatGPT :
L'extrait de code de test donné par ChatGPT, copiez-collez comme indiqué ci-dessous.
# 导入pandasimport pandas as pd# 假设'df'是你的DataFrameaverage_sales = df.groupby('store')['last_week_sales'].mean()
ChatGPT fournit également une explication détaillée de la façon dont le code est exécuté et du type de sortie avec le code.
Exemple 2
Indice : Dites-moi comment trouver le bénéfice total de chaque magasin le mois dernier.Pour cette tâche, ChatGPT doit d'abord comprendre comment calculer les bénéfices. Voyons sa réponse :
# 计算每个产品的利润df['last_month_profit'] = (df['price'] - df['cost']) * df['last_month_sales']# 计算每个商店的总利润total_profit = df.groupby('store')['last_month_profit'].sum()Exemple 3
# 计算每个商店的平均库存数量average_stock_qty_per_store = df.groupby('store')['stock_qty'].transform('mean')# 用该商店的平均库存数量替换'stock_qty'中的缺失值df['stock_qty'].fillna(average_stock_qty_per_store, inplace=True)Il existe de nombreuses façons de résoudre cette tâche, et l'utilisation de la fonction de transformation est l'un des moyens les plus efficaces.
La fonction de transformation est très importante. Les raisons d'utiliser la fonction de transformation pour effectuer cette tâche sont les suivantes :
La fonction de transformation est similaire à la fonction d'application, mais différente. Avec la fonction apply, la fonction transform peut renvoyer des entrées d'une série de tailles égales, ce qui la rend utile lors de l'exécution d'opérations de vectorisation et de diffusion, en particulier lorsqu'elle est utilisée avec des objets groupby.
Exemple 4
Indice : Dites-moi comment trouver les trois produits ayant généré le volume de ventes le plus élevé pour chaque magasin le mois dernier.# 首先,按'store'和'last_month_sales'对DataFrame进行排序df_sorted = df.sort_values(['store', 'last_month_sales'], ascending=[True, False])# 然后,按'store'分组,并使用apply方法选择每个组的前3行top_3_products = df_sorted.groupby('store').head(3)
它首先对整个DataFrame进行排序。我们也可以在每个组内进行排序。让我们看看ChatGPT是否知道该如何做到这一点。
提示:是否有另一种方法可以在不先对DataFrame进行排序的情况下完成此任务?
def top_3_products(group):return group.nlargest(3, 'last_month_sales')top_3_df = df.groupby('store').apply(top_3_products)
更高效的方法可能是首先对整个DataFrame进行排序。此示例只是想观察ChatGPT是否能提供不同的解决方案。
提示:我想看到每个商店的上周表现与上月表现进行比较。
这是一个简单的任务,但提示并没有直接告诉ChatGPT如何完成。让我们看看它的表现如何。
# 计算上周和上个月每个店的总销售额total_sales_last_week = df.groupby('store')['last_week_sales'].sum()total_sales_last_month = df.groupby('store')['last_month_sales'].sum()# 创建一个新的DataFrame来存储这些信息performance_df = pd.DataFrame({'LastWeekSales': total_sales_last_week,'LastMonthSales': total_sales_last_month,})# 计算从上个月到上周销售额的变化performance_df['SalesChange'] = performance_df['LastWeekSales'] - (performance_df['LastMonthSales'] / 4)
作为对上周与上月的表现相比较的反应,它找到了上周销售额与上月销售额四分之一之间存在差异,这是非常合理的。
它创建的DataFrame如下所示:
提示:创建一个名为critical_stock的新列,如果stock_qty小于500,则取值为1,否则取值为0。
ChatGPT为这个任务给出了3个选项,以下是我更喜欢的两个:
# 第一种选项df['critical_stock'] = df['stock_qty'].apply(lambda x: 1 if x <h2>示例 8</h2><blockquote style="margin-top: 5px; margin-bottom: 5px; padding-left: 1em; margin-left: 0px; border-left: 3px solid rgb(238, 238, 238); opacity: 0.6;"><p>提示:以大小、缺失值、数据类型和列统计信息的形式创建一个DataFrame的摘要。</p></blockquote><p>虽然DataFrame的函数和方法总结起来很简单,但ChatGPT在整理它们时做得非常出色,呈现出整洁清晰的排版。</p><p>如下的是ChatGPT生成的代码:</p><pre class="brush:php;toolbar:false"># 导入必要的库import pandas as pd# DataFrame大小print("DataFrame Size:")print(df.shape)print("\n")# 缺失值print("Missing Values:")print(df.isnull().sum())print("\n")# 数据类型print("Data Types:")print(df.dtypes)print("\n")# 列统计信息print("Column Statistics:")print(df.describe(include='all'))
以上示例展示了ChatGPT如何在数据分析中,尤其是在Pandas中,革命性地改变了常见任务的完成方式。我们不仅提高了效率,还对可以在Pandas中完成的复杂操作有了更丰富的理解。
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!