ホームページ  >  記事  >  バックエンド開発  >  ビッグデータを学習するために使用するプログラミング言語

ビッグデータを学習するために使用するプログラミング言語

little bottle
little bottleオリジナル
2019-05-14 13:22:2215572ブラウズ

ビッグデータを学習するには、Python プログラミング言語を選択できます。 Pythonにはビッグデータ処理に特化したライブラリがあり、xlrdライブラリと組み合わせることで、パフォーマンステストなどビッグデータ処理に関する統計作業を行うのに非常に便利です。

ビッグデータを学習するために使用するプログラミング言語

ビッグデータは、近年比較的よく使われるようになった用語であり、多くの人がビッグデータの研究に興味を持たずにはいられません。しかし、ビッグデータにどのような言語が使用されているか知っていますか?

1. Python 言語

10 年以上にわたり、Python は学界、特に自然言語処理 (NLP) などの分野で非常に人気がありました。したがって、NLP 処理が必要なプロジェクトがある場合、従来の NTLK、GenSim を使用したトピック モデリング、超高速で正確な spaCy など、目まぐるしい数の選択肢に直面することになります。同様に、ニューラル ネットワークに関しては、Theano や Tensorflow などの Python が同様に馴染みがあり、次に機械学習用の scikit-learn、データ分析用の NumPy と Pandas が続きます。

Juypter/iPython もあります。これは、コード、グラフィックス、およびほぼすべてのオブジェクトを共有可能なログ形式で混合できる Web ベースのノートブック サーバー フレームワークです。これは常に Python のキラー機能の 1 つでしたが、最近では、この概念が非常に有用であることが証明されており、Scala や R を含む、読み取り-読み取り-出力-ループ (REPL) の概念を追求するほぼすべての言語で使用されています。

Python はビッグ データ処理フレームワークでサポートされることが多いですが、同時に「一級市民」ではないこともよくあります。たとえば、Spark の新機能は、ほとんどの場合、最初に Scala/Java バインディングに表示され、それらの更新のいくつかのマイナー バージョンを PySpark で記述する必要がある場合があります (これは、特に Spark Streaming/MLLib の開発ツールに当てはまります)。

R とは対照的に、Python は伝統的なオブジェクト指向言語であるため、ほとんどの開発者は非常に快適に使用できるでしょうが、R や Scala に初めて触れるのは怖いかもしれません。小さな問題は、コード内に正しい空白を残す必要があることです。これにより、人々は 2 つの陣営に分かれます。「これは可読性を確保するのに非常に役立つ」と考える人、もう 1 つは、コード行の文字がコード行に含まれていないからといって、インタプリタに強制的にプログラムを読み込ませる必要はないと考える人です。正しい場所で、立ち上がって実行してください。

2. R 言語

過去数年で、R 言語はデータ サイエンスの最愛の人になりました - データ サイエンスは今やオタクな統計学者の間で人気があるだけではなく、ウォール街でもよく知られています。トレーダー、生物学者、シリコンバレーの開発者。 Google、Facebook、Bank of America、New York Times など、さまざまな業界の企業がすべて R を使用しており、R は商用目的で普及し、増殖し続けています。

R 言語には、シンプルですが明らかな魅力があります。 R を使用すると、わずか数行のコードで、複雑なデータ セットを選別し、高度なモデリング機能でデータを処理し、数値を表す平面グラフを作成できます。 Excel のハイパーアクティブ バージョンと比較されています。

R 言語の最大の資産は、R 言語を中心に開発された活気に満ちたエコシステムです。R 言語コミュニティは、すでに豊富な機能セットに新しいパッケージや機能を常に追加しています。 200 万人以上が R を使用していると推定されており、最近の世論調査では、R が科学データ用の言語として断然最も人気があり、回答者の 61% が使用していることが示されました (Python が 39% で続きます)。

3、JAVA

Java、および Java ベースのフレームワークが、シリコン バレー最大のハイテク企業の骨格となっていることが判明しました。 「Twitter、LinkedIn、Facebook を見ると、Java はすべてのデータ エンジニアリング インフラストラクチャの基礎となる言語です」と Driscoll 氏は言います。

Java は、R や Python と同じ品質の視覚化を提供せず、統計モデリングには最適な選択肢ではありません。ただし、プロトタイピングを過ぎて大規模なシステムを構築する必要がある場合は、多くの場合 Java が最良の選択です。

以上がビッグデータを学習するために使用するプログラミング言語の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。