Maison > Article > développement back-end > Série utilisant l'analyse de données Pandas
1. Préparation de l'outil
Un bon outil pour l'analyse des données : anaconda Ce tutoriel consiste à utiliser l'outil jupyter anaconda3 dans le système win10, qui s'exécute dans le navigateur.
URL de téléchargement : https://www.anaconda.com/
Méthode de démarrage
Menu Démarrer, ouvrez la fenêtre de ligne de commande d'invite anaconda
Entrez le répertoire dans lequel se trouve le projet se trouve, le Définissez le répertoire vous-même
Utilisez la commande jupyter notebook pour ouvrir le navigateur
2. Type de série
Une fois l'index créé, les valeurs à l'intérieur ne peuvent pas être modifiées individuellement
1. Créer un objet série
Créer un objet via une liste ou un tableau
import pandas as pd import numpy as np users=['张三','李四','王老五'] series1=pd.Series(users) print(series1)
Le résultat du code ci-dessus :
0 张三 1 李四 2 王老五 dtype: object
Créer un objet série via un dictionnaire
users={'张三':20,'李四':25,'王五':21} series2=pd.Series(users) print(series2)
Ce qui précède résultat du code :
张三 20 李四 25 王五 21 dtype: int64
2. Obtenez la séquence de la série
print(series2.index)
Le résultat du code ci-dessus :
Index(['张三', '李四', '王五'], dtype='object')
3. Obtenez la valeur de la série
print(series2.values)
Le résultat du code ci-dessus :
.[20 25 21]
4. Obtenez une certaine valeur
print(series2.values) print(series2[1]) print(series2['王五'])
Le résultat du code ci-dessus :
25 21
Les deux ci-dessus La valeur de la série peut être obtenue par l'une des méthodes
5.
pd.date_range('2022-10-01',periods=4,freq='M')
périodes : divisées en plusieurs intervalles
freq : divisée par année, mois, jour, semaine, heure, etc.
6. Indice d'intervalle de temps
pd.TimedeltaIndex([10,12,14,16],unit="D")
Le résultat du code ci-dessus :
TimedeltaIndex(['10 days', '12 days', '14 days', '16 days'], dtype='timedelta64[ns]', freq=None)
La valeur de l'unité peut être remplacée par Y, W, H, etc.
7.索引取值
import numpy as np import pandas as pd pd=pd.DataFrame(np.random.randint(1,100,(4,5)),index=['A','B','C','D']) # pd['A':'C']#通过索引名称取值,结果包含最后一个 pd[0:3]#通过索引下标取值,结果不包含最后一个
8. 条件索引
conditon=series>50 series[conditon] 或 series[series>50]
以上代码结果:
0 1 2 3 4 A 84.0 63.0 76.0 72.0 77.0 B NaN 96.0 NaN 65.0 NaN C NaN NaN NaN 81.0 NaN D 74.0 89.0 NaN NaN 53.0
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!