Maison > Article > développement back-end > Comment lire le fichier txt dans les pandas
Étapes pour que les pandas lisent les fichiers txt : 1. Installez la bibliothèque Pandas ; 2. Utilisez la fonction "read_csv" pour lire le fichier txt et spécifiez le chemin du fichier et le délimiteur de fichier ; 3. Pandas lit les données dans un objet DataFrame ; 4. Si la première ligne contient des noms de colonnes, vous pouvez le spécifier en définissant le paramètre d'en-tête sur 0, sinon, définissez-le sur Aucun. 5. Si le fichier txt contient des valeurs manquantes ou des valeurs vides, vous pouvez utiliser "na_values". " Précisez ces valeurs manquantes.
Le système d'exploitation de ce tutoriel : système Windows 10, ordinateur Dell G3.
Pandas est une puissante bibliothèque Python pour l'analyse et le traitement des données. Il fournit de nombreuses méthodes pratiques pour lire et traiter divers fichiers de données, y compris les fichiers txt. Dans cet article, je vais vous montrer comment utiliser Pandas pour lire des fichiers txt.
Tout d'abord, nous devons nous assurer que la bibliothèque Pandas est installée. Pandas peut être installé dans un environnement Python à l'aide de la commande suivante :
pip install pandas
Une fois l'installation terminée, nous pouvons commencer à utiliser Pandas pour lire les fichiers txt. Supposons que nous ayons un fichier txt nommé "data.txt" qui contient des données. Voici le contenu d'un exemple de fichier txt :
Name Age Gender John 25 Male Emily 28 Female
Pour lire ce fichier txt, nous pouvons utiliser la fonction read_csv de Pandas et spécifier le chemin du fichier et le délimiteur de fichier. Bien que notre fichier soit délimité par des espaces, la fonction read_csv utilise par défaut des virgules comme délimiteur. Par conséquent, nous devons définir le paramètre délimiteur sur " ", ce qui signifie utiliser des espaces comme délimiteur. Voici un exemple de code pour lire un fichier txt :
import pandas as pd # 读取txt文件 data = pd.read_csv('data.txt', sep=' ') # 打印数据 print(data)
Après avoir exécuté le code ci-dessus, les résultats suivants seront affichés :
Name Age Gender 0 John 25 Male 1 Emily 28 Female
Pandas lit les données en tant qu'objet nommé DataFrame. DataFrame est la structure de données la plus couramment utilisée dans Pandas, similaire aux tableaux dans Excel. Chaque colonne est analysée comme une colonne du DataFrame et chaque ligne est analysée comme un enregistrement du DataFrame.
Si la première ligne du fichier txt contient des noms de colonnes, cela peut être spécifié en définissant le paramètre d'en-tête sur 0. Si le fichier txt n'a aucun nom de colonne, vous pouvez définir le paramètre d'en-tête sur Aucun. Voici un exemple :
import pandas as pd # 读取txt文件,指定列名 data = pd.read_csv('data.txt', sep=' ', header=0) # 打印数据 print(data)
Si le fichier txt contient des valeurs manquantes ou nulles, vous pouvez utiliser le paramètre na_values pour spécifier ces valeurs manquantes. Voici un exemple qui montre comment identifier « NA » et « - » comme valeurs manquantes :
import pandas as pd # 读取txt文件,指定缺失值 data = pd.read_csv('data.txt', sep=' ', header=0, na_values=['NA', '-']) # 打印数据 print(data)
Ce qui précède est la méthode de base pour lire les fichiers txt à l'aide de Pandas. En plus des paramètres ci-dessus, la fonction read_csv fournit également de nombreux autres paramètres pour gérer différentes situations de données. Vous pouvez trouver plus de détails sur la fonction read_csv dans la documentation officielle de Pandas.
La lecture de fichiers txt à l'aide de Pandas est très simple. Utilisez simplement la fonction read_csv et spécifiez le chemin du fichier, le délimiteur et d'autres paramètres nécessaires pour lire le fichier txt dans un objet DataFrame afin de faciliter le traitement et l'analyse ultérieurs des données. J'espère que cet article pourra vous être utile !
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!