Maison  >  Article  >  développement back-end  >  Série utilisant l'analyse de données Pandas

Série utilisant l'analyse de données Pandas

P粉469731340
P粉469731340original
2022-07-21 17:08:45152parcourir

1. Préparation de l'outil

Un bon outil pour l'analyse des données : anaconda Ce tutoriel consiste à utiliser l'outil jupyter anaconda3 dans le système win10, qui s'exécute dans le navigateur.

  1. URL de téléchargement : https://www.anaconda.com/

  2. Méthode de démarrage

  • Menu Démarrer, ouvrez la fenêtre de ligne de commande d'invite anaconda

  • Entrez le répertoire dans lequel se trouve le projet se trouve, le Définissez le répertoire vous-même

  • Utilisez la commande jupyter notebook pour ouvrir le navigateur

2. Type de série

Une fois l'index créé, les valeurs à l'intérieur ne peuvent pas être modifiées individuellement

1. Créer un objet série

  • Créer un objet via une liste ou un tableau

import pandas as pd
import numpy as np
users=['张三','李四','王老五']
series1=pd.Series(users)
print(series1)

Le résultat du code ci-dessus :

0     张三
1     李四
2    王老五
dtype: object
  • Créer un objet série via un dictionnaire

users={'张三':20,'李四':25,'王五':21}
series2=pd.Series(users)
print(series2)

Ce qui précède résultat du code :

张三    20
李四    25
王五    21
dtype: int64

2. Obtenez la séquence de la série

print(series2.index)

Le résultat du code ci-dessus :

Index(['张三', '李四', '王五'], dtype='object')

3. Obtenez la valeur de la série

print(series2.values)

Le résultat du code ci-dessus :

.
[20 25 21]

4. Obtenez une certaine valeur

print(series2.values)
print(series2[1])
print(series2['王五'])

Le résultat du code ci-dessus :

25
21

Les deux ci-dessus La valeur de la série peut être obtenue par l'une des méthodes

5.

pd.date_range('2022-10-01',periods=4,freq='M')
  • périodes : divisées en plusieurs intervalles

  • freq : divisée par année, mois, jour, semaine, heure, etc.

6. Indice d'intervalle de temps

pd.TimedeltaIndex([10,12,14,16],unit="D")

Le résultat du code ci-dessus :

TimedeltaIndex(['10 days', '12 days', '14 days', '16 days'], dtype='timedelta64[ns]', freq=None)
  • La valeur de l'unité peut être remplacée par Y, W, H, etc.

7.索引取值

import numpy as np
import pandas as pd
pd=pd.DataFrame(np.random.randint(1,100,(4,5)),index=['A','B','C','D'])
# pd['A':'C']#通过索引名称取值,结果包含最后一个
pd[0:3]#通过索引下标取值,结果不包含最后一个

8. 条件索引

conditon=series>50
series[conditon]
或
series[series>50]

以上代码结果:

	0	1	2	3	4
A	84.0	63.0	76.0	72.0	77.0
B	NaN	96.0	NaN	65.0	NaN
C	NaN	NaN	NaN	81.0	NaN
D	74.0	89.0	NaN	NaN	53.0

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn