ホームページ >バックエンド開発 >Python チュートリアル >Python を使用している場合でも Excel は必要ですか?
多くの開発者は、Python/Pandas の導入以来、Excel はあまり使用されていないと言っていますが、Excel を使用すると、テーブルの処理や視覚化が非常に高速になります。しかし、これにも大きな欠点があり、視覚的な操作ではないため、より高度なスキルが必要となります。最近、開発者は Grid Studio と呼ばれるオープン ソース プロジェクトを構築しました。これは、Python と Excel の利点を完全に組み合わせた Web ベースのスプレッドシート アプリケーションです。
はい、視覚的なテーブルとコードを 1 つのインターフェイス上に同時に表示し、同時にテーブルとコードを通じてデータを変更します。これは Python の組み合わせではありませんかそしてエクセルは?
プロジェクトアドレス: https://github.com/ricklamers/gridstudio
まずは Grid Studio の効果を見てみましょう。一般に、Python を介してデータをロードおよび処理することも、Excel を介してデータを操作することもできます。
Python でデータを処理する方がわかりやすいですが、テーブル上のデータを処理するのは Excel と非常に似ており、以下のように集計式を書きます。
テーブル上の一部のデータを変更した場合、それを NumPy 配列にインポートして、さらに操作を行うこともできます。
関連する推奨事項: 「Python ビデオ チュートリアル 」
このツールを作成する理由
著者は、主にデータ サイエンス プロジェクトにおける分散したワークフローの問題を解決するために Grid Studio を作成したと述べていますが、この種のプロジェクトでは、R Studio や Excel などの複数のツール間で作業する必要があります。交換してください。
CSV ファイルを何億回もエクスポートするときに、行数が多すぎるとアプリケーション ウィンドウがフリーズします。 JSON ファイルを読み取るという単純なことを行うだけでも、人を狂わせる可能性があります。既存のツールは、効率的に作業するために必要な環境と関連するワークフローを提供していないため、作成者はこのツールを構築することにしました。彼は、データ サイエンスのワークフローを統合できる使いやすいアプリケーションを作成したいと考えていました。
このツールのハイライトは何ですか?
Grid Studio は、Google Sheets や Microsoft Excel に似た Web ベースのアプリケーションです。ただし、そのキラー機能は Python 言語の統合です。
テーブルを使用してデータを表示および編集することは、コンピュータを使用したことのあるほぼすべての人にとって自然なことです。このシンプルな UI と Python のような成熟したプログラミング言語を組み合わせるのは、決して簡単ではありません。
Python でのスクリプトの作成は非常に簡単です。コードを数行書いて直接実行するだけです。
コア統合: 読み取りと書き込み
この Python 統合のコアは、スプレッドシートの読み取りおよび書き込みインターフェイスです。スプレッドシート内のデータと Python プロセス内のデータの間に高性能の接続を確立します。
次のメソッドを使用してテーブルにデータを書き込むことができます:
sheet("A1:A3", [1, 2, 3])
次のメソッドを使用します。メソッド テーブルからデータを読み取ります:
my_matrix =sheet("A1:A3")
このシンプルかつ効率的な方法で、テーブル内で直接データを読み書きできます。データ入力を自動化するには、抽出、可視化、その他のプロセス。
カスタマイズされたテーブル関数の作成
単純なインターフェイスを介して読み取りと書き込みを完了するのは非常に柔軟ですが、場合によっては、呼び出し可能なカスタマイズされた関数を作成することも重要です。直接。
AVERAGE、SUM、IF などのデフォルトの関数に加えて、他の関数も必要になる場合があるので、書き留めておいてください。
def UPPERCASE(a):
return str(a).uppercase()
このコード行を記述した後、次のようにテーブル内の関数を呼び出します。通常の関数を呼び出します。
Python エコシステムの使用
Python エコシステムのさまざまな強力なソフトウェア パッケージを活用することで、現時点で最高のデータ サイエンス ツールにすぐにアクセスできるため、線形回帰、サポート ベクター マシンなどの強力なモデルにアクセスします。
Grid Studio 自体は主に表形式のデータを処理するため、それらを特徴として使用すると、SVM などのモデルをすばやく呼び出して、これらのデータの背後に隠された特徴を探索できます。
データの視覚化
データ サイエンスでは、データに関する「事前知識」を得るためにデータを視覚化することが非常に一般的なタスクです。インタラクティブなプロット ライブラリ Plotly.js と Python 標準視覚化ライブラリ Matplotlib を統合することにより、Grid Studio には高度なプロット機能が組み込まれるようになりました。以下に示すように、ベクトル テーブル形式で高度な描画機能を使用できます。
Grid Studio の機能を使用してビジュアル アイコンを作成する方法をさらに説明するために、プロジェクト作成者は次の図も示しています。 2 Web ページをクローリングする場合とデータ分布を可視化する場合の 2 つのケースがありますが、ここでは主に 1 番目のケースを示します。
ケース: 正規分布の推定
次のケースは、Grid Studio の能力を示しています。Plotly.js を使用して正規分布をより忠実に視覚化します。見てみましょう。どのように正確に行うかインタラクティブマッピングが完了しました。
使用してインストールする
非常に多くの機能がこれまでに紹介されてきましたが、どのように使用すればよいでしょうか? Grid Studio はインストールと使用が非常に簡単で、単純なコマンド ラインで実行できます。
git clone https://github.com/ricklamers/gridstudio
cd Gridstudio && ./run.sh
上記と同様に、プロジェクトをダウンロードしてインストール スクリプトを実行します2 つのステップで、ブラウザでローカル ポートを開いて問題なく使用できるようになります。
以上がPython を使用している場合でも Excel は必要ですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。