>  기사  >  백엔드 개발  >  r 언어와 Python을 모두 배워야 하나요?

r 언어와 Python을 모두 배워야 하나요?

anonymity
anonymity원래의
2019-06-12 14:33:447080검색

R과 Python은 현재 가장 널리 사용되는 두 가지 고급 프로그래밍 언어이며 데이터 과학 분야에서 널리 사용됩니다. 둘 다 오픈 소스이며 이를 지원하는 매우 활동적인 커뮤니티가 있습니다. 그렇다면 질문이 생깁니다: R 언어와 Python을 모두 배워야 할까요? 🎜#R 언어는 1995년 뉴질랜드 오클랜드 대학의 Ross Ihaka와 Robert Gentleman에 의해 설계되었습니다(둘 다 R 언어로 시작했기 때문에 R 언어로 명명됨). 문자 'R')이며 현재 "R 핵심 개발 팀"에 의해 개발되었습니다.

R은 주로 데이터 분석, 그래픽, 데이터 마이닝에 사용되지만 일부 사람들은 R을 행렬 계산에도 사용합니다. 계산 속도는 오픈 소스 소프트웨어 GNU Octave 및 행렬 계산 전용 상용 소프트웨어 MATLAB과 비슷합니다. r 언어와 Python을 모두 배워야 하나요?

처음에는 R이 주로 학술 연구에 사용되었지만 최근에는 기업 세계에서도 두각을 나타내면서 R은 기업에서 사용되는 세계에서 가장 빠르게 성장하는 통계 언어 중 하나가 되었습니다. 데이터 과학 작업의 경우 R의 구문이 더 직관적이고 직관적입니다

데이터 처리 작업의 경우 R의 구문이 더 간단한 경우가 많습니다. 기능과 매개변수의 이름 지정도 더 잘 설계되어 기억하고 사용하기 쉽습니다.

예를 들어 R과 Python을 사용하여 Iris 데이터 프레임에서 두 개의 변수를 삭제합니다(R과 Python 모두 Iris 데이터 프레임을 갖고 있으므로 이 데이터 프레임을 사용합니다).

해당 구문을 살펴보겠습니다.

Python

import seaborn as sns
import pandas as pd
iris = sns.load_dataset('iris')
iris.drop(['sepal_length', 'species'], axis = 1)

R

library(dplyr)
select(iris, -sepal_length, -species)

변수를 삭제하려면 , Python에서는 drop 함수를 사용하고, R에서는 select 함수를 사용합니다. 이 두 함수의 구문을 비교해 보겠습니다(둘 다 코드의 마지막 줄에서).

먼저 Python에 대해 이야기해 보겠습니다. drop 함수는 이름이 좋고 기억하기 쉽습니다. 그러나 매개변수 설계는 매우 복잡합니다.

첫 번째 매개변수는 삭제하려는 변수가 포함된 목록입니다. Python에서는 목록을 나타내기 위해 대괄호 [ ]를 사용합니다. 여기에는 대괄호를 사용해야 하며, 변수는 ' '로 묶어야 합니다. 그렇지 않으면 코드가 잘못 실행됩니다.

데이터 시각화 측면에서는 R이 매우 좋습니다

시각화는 데이터 분석 소프트웨어를 선택하는 중요한 기준입니다.

R의 또 다른 빛나는 점은 데이터 분석에 뛰어나 거의 모든 종류의 그래프를 그릴 수 있는 매우 강력한 그리기 능력입니다. 믿기지 않는다면 구글에 검색해서 'R 시각화' 키워드를 입력해 보시면 됩니다.

Python의 장점

데이터 과학 초보자에게는 R을 배우는 것을 적극 권장하지만 이것이 유일한 선택은 아닙니다.

어떤 사람들에게는 Python이 최선의 선택일 수 있습니다. Python을 선택하는 것이 더 나은 상황에 대해 이야기해 보겠습니다.

소프트웨어 개발이나 컴퓨터 과학에 기초가 있다면 Python을 배우세요

소프트웨어 개발 경험이 있거나 컴퓨터 과학 전공이라면 Python이 더 좋을 것 같아요 당신에게 적합합니다. 이미 프로그래밍 경험이 있으므로 Python을 사용하는 것이 더 편할 것입니다.

소프트웨어를 개발하고 싶다면 Python을 배우세요

데이터 과학에서는 R이 더 낫다고 이미 말씀드렸습니다. 소프트웨어 시스템을 구축하고 싶다면 Python이 더 적합하다고 생각합니다. Python의 가장 빛나는 점은 매우 효율적인 소프트웨어 작성입니다. 일부 전문가들이 말했듯이 Python 코드를 작성하는 것은 의사 코드를 작성하는 것과 같습니다.

게다가 Python은 범용 언어이므로 기본적으로 무엇이든 할 수 있습니다. 하지만 R은 좀 더 전문적이고 통계 분석과 시각화에만 능숙합니다.

명확히 하고 싶은 것은 R이 소프트웨어를 작성할 수 없다는 것이 아닙니다. 단지 더 많은 사람들이 Python을 사용하여 제품 소프트웨어를 구축하는 것을 좋아할 뿐입니다. 따라서 데이터 과학자로서 소프트웨어 시스템을 만들고 싶다면 R보다 Python이 더 적합하다고 생각합니다.

머신러닝을 하고 싶다면 파이썬을 배워보세요

오래오래 머신러닝 연구를 하고 싶다면 저는 Python을 배우라고 제안합니다.

사실 R에도 머신러닝 생태계가 있습니다. 특히 R의 캐럿 패키지는 잘 개발되어 있으며 다양한 기계 학습 작업을 수행할 수 있는 기능을 갖추고 있습니다. 예를 들어 캐럿 패키지를 사용하여 회귀 모델, SVM(지원 벡터 머신), 의사결정 트리(회귀 및 분류 포함)를 구축하고 교차 검증을 수행하는 등의 작업을 수행합니다. 전체적으로 R의 기계 학습 생태계는 매우 잘 성장하고 있습니다.

그러나 Python의 기계 학습 지원은 더 일찍 나타났습니다. 다양한 기계 학습 방법을 구현하기 위해 Python의 scikit-learn 라이브러리는 보다 간결하고 읽기 쉬운 구문을 제공합니다. R의 캐럿 패키지 구문은 때때로 약간 어색합니다. 특히 캐럿 패키지는 Tidyverse 패키지와 호환성이 별로 좋지 않아 출력 결과를 처리하기 어려울 때도 있다. 반면 Python의 scikit-learn 라이브러리는 Python 생태계와 잘 통합됩니다.

시중에 판매되는 머신러닝 관련 서적 중에는 알고리즘 구현이 Python으로 작성된 경우가 많습니다.

결론적으로 머신러닝 작업을 하고 싶다면 파이썬이 더 좋을 것 같아요.

딥러닝을 하고 싶다면 Python을 배우세요

딥러닝은 세계에서 가장 인기 있는 기술 중 하나라고 할 수 있습니다. 인공 지능 분야에서 Python은 가장 널리 사용되는 언어를 배우는 기술입니다.

대부분의 딥 러닝 프레임워크에는 TensorFlow, Keras, Pytorch, Theano, MXNET 등과 같은 Python 인터페이스가 있습니다.

Python은 다양한 프레임워크와 매우 호환되며 수많은 기여자, 검색 결과, 관련 서적 및 학술 기사가 있습니다. Github의 딥 러닝 프로젝트 대부분은 Python으로 작성되었습니다. 딥러닝이 처음이라면 Keras를 사용하는 것이 좋은 선택입니다.

이에 비해 R은 딥러닝 프레임워크와의 호환성 측면에서 좋은 성능을 발휘하지 못합니다. 따라서 딥러닝에 집중하고 싶다면 Python이 더 적합할 수 있습니다.

R이나 Python을 배우시나요? 주로 배경과 목표에 따라 다릅니다.

프로그래밍 경험이 없다면 R을 먼저 배우는 것이 좋습니다. 데이터 시각화를 배우고 싶다면 R의 ggplot2 패키지가 최고의 도구라고 생각합니다. 데이터 분석 및 데이터 마이닝에서는 R이 더 나은 성능을 발휘합니다.

머신러닝 전문가가 되고 싶다면 Python의 scikit-learn 라이브러리를 주의 깊게 공부하면 됩니다. 소프트웨어 시스템을 개발하고 싶다면 Python이 더 적합합니다.

속담처럼, 기술이 너무 많으면 압도당하지 않을 것입니다. 세 번째 옵션은 R과 Python을 모두 배우는 것입니다. 실제로 많은 최고의 데이터 과학자들은 두 언어를 모두 알고 있습니다. 그러나 초보자의 경우 한 번에 한 가지 교훈을 배우십시오. 두 과목을 동시에 배우면 혼란스러워지고 학습주기가 길어지며 절반의 노력으로 두 배의 결과를 얻을 수 있습니다.

위 내용은 r 언어와 Python을 모두 배워야 하나요?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.