ホームページ >バックエンド開発 >Python チュートリアル >データサイエンスに役立つ Python ライブラリ
NumPy は Numerical Python の略です。 NumPy の最も強力な機能は n 次元配列です。このライブラリには、基本的な線形代数関数、フーリエ変換、高度な乱数機能、Fortran、C、C などの他の低レベル言語と統合するためのツールも含まれています
SciPy は、Scientific Python の略です。 SciPy は NumPy 上に構築されています。これは、離散フーリエ変換、線形代数、最適化、疎行列などのさまざまな高レベルの科学および工学モジュールにとって最も役立つライブラリの 1 つです。
Matplotlib は、ヒストグラムからライン プロット、ヒート プロットまで、多種多様なグラフをプロットするためのツールです。これらのプロット機能をインラインで使用するには、ipython ノートブックの Pylab 機能 (ipython Notebook –pylab = inline) を使用できます。 inline オプションを無視すると、pylab は ipython 環境を Matlab とよく似た環境に変換します。 Latex コマンドを使用してプロットに数学を追加することもできます。
構造化データの操作と操作のための Pandas。データの変更や準備に広く使用されています。パンダは比較的最近 Python に追加され、データ サイエンティスト コミュニティでの Python の使用を促進するのに役立ちました。
機械学習用の Scikit Learn。 NumPy、SciPy、matplotlib 上に構築されたこのライブラリには、分類、回帰、クラスタリング、次元削減などの機械学習と統計モデリングのための効率的なツールが多数含まれています。
統計モデリング用の Statsmodels。 Statsmodels は、ユーザーがデータを探索し、統計モデルを推定し、統計テストを実行できるようにする Python モジュールです。記述統計、統計検定、プロット関数、および結果統計の広範なリストが、さまざまなタイプのデータと各推定量に対して利用可能です。
Seaborn は統計データの視覚化に使用します。 Seaborn は、Python で魅力的で有益な統計グラフィックを作成するためのライブラリです。 matplotlib に基づいています。 Seaborn は、視覚化をデータの探索と理解の中心部分にすることを目指しています。
最新のウェブブラウザでインタラクティブなプロット、ダッシュボード、データ アプリケーションを作成するための Bokeh。 これにより、ユーザーは D3.js のスタイルでエレガントで簡潔なグラフィックを生成できるようになります。さらに、非常に大規模なデータセットまたはストリーミング データセットに対する高性能の対話機能も備えています。
Blaze は、Numpy と Pandas の機能を分散データセットとストリーミング データセットに拡張します。 これを使用して、Bcolz、MongoDB、SQLAlchemy、Apache Spark、PyTables などを含む多数のソースからデータにアクセスできます。Blaze は、Bokeh と組み合わせることで、膨大なデータの塊に対して効果的な視覚化やダッシュボードを作成するための非常に強力なツールとして機能します。
ウェブクローリング用の Scrapy 。これは、特定のパターンのデータを取得するための非常に便利なフレームワークです。 Web サイトのホーム URL から開始して、Web サイト内の Web ページを探索して情報を収集する機能があります。
シンボリック計算用の SymPy。基本的な記号算術から微積分、代数学、離散数学、量子物理学まで幅広い機能を備えています。もう 1 つの便利な機能は、計算結果を LaTeX コードとしてフォーマットする機能です。
ウェブへのアクセスのリクエスト。これは標準の Python ライブラリ urllib2 と同様に機能しますが、コーディングははるかに簡単です。 urllib2 とは微妙な違いがありますが、初心者にとっては Requests の方が便利かもしれません。
追加のライブラリが必要になる場合があります:
オペレーティング システムとファイル操作用の OS
グラフベースのデータ操作のための networkx と igraph
テキストデータ内のパターンを見つけるための正規表現
ウェブをスクラップするための BeautifulSoup 。一度の実行で単一の Web ページから情報を抽出するため、Scrapy よりも劣ります。
データ サイエンス リソース: https://t.me/DataScienceResourcesTP
以上がデータサイエンスに役立つ Python ライブラリの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。