>백엔드 개발 >파이썬 튜토리얼 >빅데이터를 배우기 위해 어떤 프로그래밍 언어를 사용해야 할까요?

빅데이터를 배우기 위해 어떤 프로그래밍 언어를 사용해야 할까요?

little bottle
little bottle원래의
2019-05-14 13:22:2215648검색

빅데이터 학습을 위해 Python 프로그래밍 언어를 선택할 수 있습니다. Python에는 빅데이터 처리에 특화된 라이브러리가 있습니다. 이를 xlrd 라이브러리와 결합하면 성능 테스트와 같은 빅데이터 처리에 대한 통계 작업을 수행하는 것이 매우 편리할 것입니다.

빅데이터를 배우기 위해 어떤 프로그래밍 언어를 사용해야 할까요?

빅데이터는 최근 몇 년간 비교적 대중화된 용어로 많은 사람들이 연구에 빠져들지 않을 수 없습니다. 빅데이터의. 그런데 빅데이터에 어떤 언어가 사용되는지 아시나요?

1. Python 언어

Python은 10년 넘게 학계, 특히 자연어 처리(NLP)와 같은 분야에서 인기를 끌었습니다. 따라서 NLP 처리가 필요한 프로젝트가 있는 경우 클래식 NTLK, GenSim을 사용한 주제 모델링 또는 매우 빠르고 정확한 spaCy를 포함하여 어지러울 정도로 많은 선택 사항에 직면하게 됩니다. 마찬가지로, 신경망의 경우 Python은 Theano와 Tensorflow를 포함하여 기계 학습을 위한 scikit-learn, 데이터 분석을 위한 NumPy 및 Pandas를 포함하여 동등하게 집에 있습니다.

And Juypter/iPython - 코드, 그래픽 및 거의 모든 개체를 공유 가능한 로그 형식으로 혼합할 수 있는 웹 기반 노트북 서버 프레임워크입니다. 이는 항상 Python의 킬러 기능 중 하나였지만 요즘에는 Scala 및 R을 포함하여 REPL(읽기-읽기-출력-루프) 개념을 추구하는 거의 모든 언어에 나타날 정도로 이 개념이 매우 유용하다는 것이 입증되었습니다.

Python은 빅 데이터 처리 프레임워크에서 지원되는 경우가 많지만 동시에 '일류 시민'이 아닌 경우도 많습니다. 예를 들어 Spark의 새로운 기능은 거의 항상 Scala/Java 바인딩에서 먼저 나타나며 PySpark에서 해당 업데이트의 여러 마이너 버전을 작성해야 할 수도 있습니다(특히 Spark Streaming/MLLib의 개발 도구에 해당됩니다).

R과 달리 Python은 전통적인 객체 지향 언어이므로 대부분의 개발자는 Python을 사용하는 데 꽤 익숙하지만 R이나 Scala를 처음 접하는 것은 어려울 수 있습니다. 작은 문제는 코드에 올바른 공백을 남겨 두어야 한다는 것입니다. 이것은 사람들을 두 가지 진영으로 나눕니다. "이것이 가독성을 보장하는 데 매우 도움이 된다"고 생각하는 사람들과 단지 코드 줄의 문자가 코드에 없다는 이유로 통역사에게 프로그램을 읽도록 강요할 필요는 없다고 생각하는 사람들입니다. 바로 일어나서 달려가세요.

2. R 언어

지난 몇 년 동안 R 언어는 데이터 과학의 사랑을 받았습니다. 데이터 과학은 이제 단순한 통계 그 이상입니다. 그의 가족 모두는 월스트리트 거래자, 생물학자, 실리콘밸리 개발자들에게 친숙한 이름이기도 합니다. Google, Facebook, Bank of America, New York Times 등 다양한 업계의 기업에서 모두 R을 사용하고 있으며, R은 상업적 용도로 계속 확산되고 확산되고 있습니다.

R 언어에는 단순하면서도 분명한 매력이 있습니다. R을 사용하면 단 몇 줄의 코드만으로 복잡한 데이터 세트를 살펴보고, 고급 모델링 기능으로 데이터를 처리하고, 숫자를 나타내는 평면 그래프를 만들 수 있습니다. 이는 Excel의 하이퍼액티브 버전과 비교되었습니다.

R 언어의 가장 큰 자산은 이를 중심으로 개발된 활발한 생태계입니다. R 언어 커뮤니티는 이미 풍부한 기능 세트에 항상 새로운 패키지와 기능을 추가하고 있습니다. 2백만 명 이상의 사람들이 R을 사용하는 것으로 추정되며, 최근 여론 조사에 따르면 R은 응답자의 61%가 사용하는 과학 데이터에 가장 널리 사용되는 언어인 것으로 나타났습니다(Python이 39%로 그 뒤를 이었습니다).

3, JAVA

Java 및 Java 기반 프레임워크가 실리콘 밸리 최대 하이테크 기업의 뼈대가 된 것으로 나타났습니다. Driscoll은 "Twitter, LinkedIn, Facebook을 살펴보면 Java는 모든 데이터 엔지니어링 인프라의 기본 언어입니다."라고 말했습니다.

Java는 R 및 Python과 동일한 시각화 품질을 제공하지 않으며 통계 모델링을 위한 최선의 선택이 아닙니다. 그러나 프로토타입 제작을 넘어 대규모 시스템을 구축해야 하는 경우에는 Java가 최선의 선택인 경우가 많습니다.

위 내용은 빅데이터를 배우기 위해 어떤 프로그래밍 언어를 사용해야 할까요?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.