Maison >développement back-end >Tutoriel Python >Que devez-vous apprendre sur l'exploration de données Python ?

Que devez-vous apprendre sur l'exploration de données Python ?

(*-*)浩
(*-*)浩original
2019-06-22 15:02:032941parcourir

Tant qu'il peut résoudre des problèmes pratiques, peu importe l'outil que vous utilisez pour apprendre l'exploration de données, Python est le premier choix ici.

Que devez-vous apprendre sur l'exploration de données Python ?

Quelles connaissances en Python devez-vous maîtriser ? (Apprentissage recommandé : Tutoriel vidéo Python)

1. Fonctionnement de la bibliothèque Pandas

Panda est une bibliothèque particulièrement importante pour l'analyse des données Nous devons maîtriser les trois points suivants :

· groupe pandas. calcul;

· indice pandas et index multiple;

L'index est difficile, mais il est très important

· opération multi-tables pandas et tableau croisé dynamique

2. Calcul numérique Numpy

La principale application du calcul de données numpy est l'exploration de données. Pour le futur apprentissage automatique et apprentissage profond, c'est aussi une bibliothèque qu'il faut maîtriser. maîtriser les contenus suivants :

· Compréhension des tableaux Numpy

· Opération d'index de tableau

· Calcul de tableau

· Diffusion (connaissance en algèbre linéaire ; )

3. Visualisation des données-matplotlib et seaborn

· Syntaxe Matplotib

L'outil de visualisation le plus basique de Python est matplotlib. À première vue, Matplotlib et matlib se ressemblent un peu. Vous devez comprendre la relation entre les deux, afin qu'elle soit plus facile à apprendre.

·Utiliser seaborn

seaborn est un très bel outil de visualisation.

· Fonction de dessin de pandas

Comme mentionné précédemment, pandas est utilisé pour l'analyse des données, mais il fournit également des API de dessin.

4. Introduction au data mining

Cette partie est la partie la plus difficile et la plus intéressante Vous devez maîtriser les parties suivantes :

· Machine. apprentissage La définition de

n'est pas différente de l'exploration de données ici

· La définition de la fonction de coût

· Train/Test/Valider

· La définition des méthodes de surajustement et d'évitement

5. Algorithmes de data mining

Avec le développement du data mining, il existe déjà de nombreux algorithmes Ci-dessous il vous suffit de maîtriser les plus simples, les plus fondamentaux et les plus importants. Algorithmes couramment utilisés :

· Algorithme des moindres carrés

· Descente de gradient

· Vectorisation

· Maximum de vraisemblance ; estimation ;

· Régression logistique

· Arbre de décision

· RandomForesr

· Combat pratique

Utilisation scikit-learn, la bibliothèque la plus connue en apprentissage automatique, pour comprendre le modèle.

Pour plus d'articles techniques liés à Python, veuillez visiter la colonne

Tutoriel Python

pour apprendre !

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn