Maison > Article > développement back-end > Est-il nécessaire d’apprendre à la fois le langage R et Python ?
R et Python sont actuellement les deux langages de programmation de haut niveau les plus populaires et sont largement utilisés dans le domaine de la science des données. Les deux sont open source et disposent de communautés très actives pour les soutenir. Alors voici la question : est-il nécessaire d'apprendre à la fois le langage R et Python ? Conçu en 1995 par Ross Ihaka et Robert Gentleman (appelé langage R car leurs deux noms commencent par la lettre « R »), il est maintenant développé par l'« équipe de développement R Core ».
Bien que R soit principalement utilisé pour l'analyse de données, les graphiques et l'exploration de données, certaines personnes l'utilisent également pour les calculs matriciels. Sa vitesse de calcul est comparable au logiciel open source GNU Octave et au logiciel commercial MATLAB dédié aux calculs matriciels.
Initialement, R était principalement utilisé dans la recherche universitaire, mais ces dernières années, il a également pris de l'importance dans le monde de l'entreprise, faisant de R l'un des langages statistiques à la croissance la plus rapide au monde, utilisé dans les entreprises. Pour les tâches de science des données, la syntaxe de R est plus intuitive et intuitivePour les tâches de traitement de données, la syntaxe de R est souvent plus simple. La dénomination des fonctions et des paramètres est également mieux conçue, ce qui les rend plus faciles à mémoriser et à utiliser.
Par exemple, nous utiliserons R et Python pour supprimer deux variables dans le bloc de données Iris (puisque R et Python ont tous deux le bloc de données Iris, nous utilisons ce bloc de données). Regardons leur syntaxe respective : Pythonimport seaborn as sns import pandas as pd iris = sns.load_dataset('iris') iris.drop(['sepal_length', 'species'], axis = 1)R
library(dplyr) select(iris, -sepal_length, -species)Pour supprimer des variables, la fonction drop est utilisée en Python, et en R La fonction de sélection est utilisée. Comparons la syntaxe de ces deux fonctions (toutes deux dans la dernière ligne de code). Parlons d'abord de Python. La fonction drop est bien nommée et facile à retenir. Mais la conception des paramètres est très compliquée. Le premier paramètre est une liste contenant les variables que vous souhaitez supprimer. En Python, les crochets [ ] sont utilisés pour représenter la liste. Vous devez utiliser des crochets ici et la variable doit être entre guillemets « », sinon le code ne s'exécutera pas correctement. En terme de visualisation de données, R est très bon La visualisation est un critère important pour choisir un logiciel d'analyse de données. En plus d'être bon en analyse de données, un autre point fort de R est sa capacité de dessin extrêmement forte, qui peut dessiner presque tous les types de graphiques. Si vous n'y croyez pas, vous pouvez le rechercher sur Google et saisir le mot-clé « Visualisation R ».
Avantages de Python
Pour les débutants en science des données, même si je recommande fortement d'apprendre R, ce n'est pas la seule option. Pour certaines personnes, Python peut être le meilleur choix. Parlons des situations dans lesquelles il est préférable de choisir Python. Si vous avez des bases en développement de logiciels ou en informatique, apprenez PythonSi vous avez de l'expérience en développement de logiciels ou si vous êtes spécialisé en informatique, je pense que Python vous conviendra mieux. Puisque vous avez déjà une expérience en programmation, vous serez plus à l’aise avec Python.
Si vous souhaitez développer des logiciels, apprenez Python
J'ai déjà dit que R est meilleur en science des données. Si vous souhaitez créer des systèmes logiciels, je pense que Python est plus adapté. Le point fort de Python est l’écriture de logiciels, qui sont très efficaces. Comme le disent certains experts, écrire du code Python revient à écrire du pseudocode. De plus, Python est un langage à usage général et peut pratiquement tout faire. Cependant, R est plus spécialisé et n’est bon qu’en analyse statistique et en visualisation. Je tiens à clarifier, ce n’est pas que R ne puisse pas écrire de logiciels. C'est juste que de plus en plus de gens aiment utiliser Python pour créer des logiciels de produits. Par conséquent, en tant que data scientist, si vous souhaitez créer un système logiciel, je pense que Python est plus adapté que R.Si vous souhaitez vous lancer dans l'apprentissage automatique, apprenez Python
Si vous souhaitez vous engager dans la recherche sur l'apprentissage automatique pendant une longue période, je vous recommande d'apprendre Python. En fait, R dispose également d’un écosystème d’apprentissage automatique. En particulier, le package caret de R est bien développé et a la capacité d'accomplir une variété de tâches d'apprentissage automatique. Par exemple : utilisez le package caret pour créer des modèles de régression, prendre en charge les machines vectorielles (SVM), les arbres de décision (y compris la régression et la classification) et effectuer une validation croisée, etc. Dans l’ensemble, l’écosystème d’apprentissage automatique de R se développe très bien. Cependant, la prise en charge de Python pour l’apprentissage automatique est apparue plus tôt. Pour implémenter diverses méthodes d'apprentissage automatique, la bibliothèque scikit-learn de Python fournit une syntaxe plus concise et lisible. La syntaxe du package caret dans R est parfois un peu maladroite. En particulier, le package caret n'est pas très compatible avec le package Tidyverse, et les résultats de sortie sont parfois difficiles à traiter. En revanche, la bibliothèque scikit-learn de Python s'intègre bien à l'écosystème Python.La plupart des implémentations d'algorithmes des livres sur l'apprentissage automatique disponibles sur le marché sont écrites en Python.
En conclusion, si vous souhaitez travailler sur le machine learning, je pense que Python sera meilleur.Si vous souhaitez vous lancer dans l'apprentissage profond, apprenez Python
L'apprentissage profond est l'une des technologies les plus populaires dans le domaine de l'intelligence artificielle, et Python est la plus langage populaire pour l'apprentissage en profondeur. La plupart des frameworks de deep learning ont des interfaces Python, telles que : TensorFlow, Keras, Pytorch, Theano, MXNET, etc. Python est très compatible avec divers frameworks et compte un grand nombre de contributeurs, de résultats de recherche, de livres connexes et d'articles académiques ; la plupart des projets d'apprentissage profond sur Github sont écrits en Python ; Si vous débutez dans le deep learning, utiliser Keras est un bon choix.En comparaison, R ne fonctionne pas bien en termes de compatibilité avec les frameworks de deep learning. Donc si vous souhaitez vous concentrer sur le deep learning, Python sera peut-être plus adapté.
Apprendre R ou Python ? Cela dépend principalement de votre parcours et de vos objectifs.
Si vous n'avez aucune expérience en programmation, il est recommandé d'apprendre d'abord R ; si vous souhaitez apprendre la visualisation de données, je pense que le package ggplot2 de R est le meilleur outil si vous souhaitez vous spécialiser dans les données ; analyse et exploration de données, R Performez mieux.
Si vous souhaitez devenir un expert en apprentissage automatique, la bibliothèque scikit-learn de Python peut être étudiée attentivement ; si vous souhaitez développer des systèmes logiciels, Python est plus adapté.
Comme le dit le proverbe, si vous avez trop de compétences, vous ne serez pas dépassé. Vous avez une troisième option : apprendre à la fois R et Python. En fait, de nombreux data scientists de haut niveau connaissent les deux langages. Mais pour les débutants, apprenez une leçon à la fois. Apprendre deux matières en même temps vous rendra confus, le cycle d'apprentissage sera allongé et vous obtiendrez le double du résultat avec la moitié de l'effort.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!