大規模な組織や企業で一般的なスプレッドシートデータの処理とそれをWebアプリケーションにインポートすることは、多くの開発者にとって課題です。この記事では、XLSX、CSV、およびスプレッドシートの古いバージョンへの読み取りと書き込みなど、Pythonを使用してそのようなデータを処理および解析する方法を紹介します。
キーポイント:
- Pythonは、PandasやOpenPyXLなどのライブラリを組み合わせて、XLSXファイル、CSVファイル、レガシースプレッドシートの読み書きなど、スプレッドシートデータを簡単に解析します。これにより、これらの形式で保存されているデータを簡単に操作および分析できます。
- スプレッドシートの読み取りプロセスには、Pandasモジュールのインポート、スプレッドシートファイルの開き、特定のワークシートの選択、特定のデータセルの値の抽出が含まれます。 Pandasはスプレッドシートをテーブルとして読み取り、データフレームとして保存します。これにより、データフレームをクエリして特定のデータを抽出できます。
- スプレッドシートを作成するプロセスは、データフレームを作成してワークブックに保存し、ワークブックにワークシートを作成し、ワークブックのセルにデータを追加することに似ています。 PandasのExcelwriterクラスは、既存のスプレッドシートへのデータフレームや設定日と時刻の値など、データをスプレッドシートに保存するためのより多くのオプションを提供します。
- スプレッドシートの基本:
基本:
スプレッドシートファイルは複数のワークシートのコレクションであり、各ワークシートはテーブルと同様にグリッドに配置されたデータセルのコレクションです。ワークシートでは、データセルは行番号と列番号によって識別されます。
たとえば、
python環境設定:
Python 3を使用して、スプレッドシートに読み書きします。 XLSXファイルを読み書きするには、Pandasモジュールをインストールする必要があります。 PIPやEasy_InstallなどのPythonインストーラーを使用してインストールできます。 Pandasは、OpenPyXLモジュールを使用して新しいスプレッドシート(.XLSX)ファイルを読み取り、XLRDモジュールを使用して古いスプレッドシート(.XLSファイル)を読み取ります。 Pandasがインストールされると、両方のモジュール(OpenPyXLとXLRD)が依存関係としてインストールされます。CSVファイルを読み書きするには、PythonでプレインストールされているCSVモジュールが必要です。 CSVファイルは、Pandasを介して読み取ることもできます。
pip3 install pandasスプレッドシートをお読みください:
ファイル内のデータを解析する場合は、次の順序で次の操作を実行する必要があります。
Import Pandasモジュール
- スプレッドシートファイル(またはワークブック)を開きます
- ワークシートを選択
- を選択します 特定のデータセルの値を抽出します
- スプレッドシートファイルを開きます
pip3 install pandas
Pandasはスプレッドシートをテーブルとして読み取り、パンダのデータフレームとして保存します。
ファイルにASSASCII以外の文字が含まれている場合、Unicode形式で開く必要があります。
import pandas as pd workbook = pd.read_excel('sample-xlsx-file-for-testing.xlsx') workbook.head()スプレッドシートが非常に大きい場合は、特定の列のみをデータフレームにロードする
パラメーターを追加できます。たとえば、次のパラメーターでは、最初の5列のみを読み取ります。
use_cols
さらに、
import sys workbook = pd.read_excel('sample-xlsx-file-for-testing.xlsx', encoding=sys.getfilesystemencoding())
特定のワークシートを開きますnrows
skiprows
関数はファイルの最初のワークシートを解析します。ワークシートの名前は、文字列またはワークシートのインデックス(0から始まる)として提供できます:
sheet_name
リストをパラメーターに渡すことにより、PANDASデータフレームの辞書ストレージとして複数のワークシートを選択することもできます。
read_excel()
workbook = pd.read_excel('~/Desktop/import-export-data.xlsx', usecols = 'A:E') workbook.head()
データフレームにワークシートを選択した後、PANDASデータフレームを照会することにより、特定のデータセルの値を抽出できます。
sheet_name
# 读取名为'Sheet1'的工作表 worksheet = pd.read_excel('sample-xlsx-file-for-testing.xlsx', sheet_name = 'Sheet1') # 读取文件中的第一个工作表 worksheet = pd.read_excel('sample-xlsx-file-for-testing.xlsx', sheet_name = 0)メソッドは、インデックスの位置に基づいて値を検索するのに役立ちます。上記のコードでは、
0番目のインデックス位置の値を検索します。同様に、
メソッドを使用して、タグを使用して値を検索できます。たとえば、パラメーター0をメソッドに渡すと、インデックスでタグ0を検索します。
# 读取前两个工作表和名为'Sheet 3'的工作表 worksheets = pd.read_excel('~/Desktop/import-export-data.xlsx', sheet_name = [0, 1, 'Sheet 3'])データフレームにデータセットをロードした後、パンダの組み込み関数を使用してデータセットを照会できます。
.iloc()
.iloc()
スプレッドシートを作成します:.loc()
.loc()
import pandas as pd workbook = pd.read_excel('sample-xlsx-file-for-testing.xlsx') # 打印'Product'列的第一个值 print(workbook['Product'].iloc[0]) => Carretera
Import Pandasモジュール
データをワークブックに保存します
ワークブックにワークシートを作成しますワークブック内のセルにスタイルを追加します
- 新しいファイルを作成します
- 新しいファイルを作成するには、最初にデータフレームが必要です。記事の冒頭でデモテーブルを再作成しましょう:
- データフレームに 関数を呼び出して保存するファイル名を指定することにより、新しいスプレッドシートファイルを作成できます。
は
関数を使用して同じファイルを開くこともできます。ワークシートを追加
print(workbook['Product'].loc[0]) => Carretera
データフレームは、to_excel()
パラメーターを使用してワークブックの特定のワークシートとして保存できます。このパラメーターのデフォルト値はSHEIT1:
import pandas as pd name = ['John', 'Mary', 'Sherlock'] age = [11, 12, 13] df = pd.DataFrame({ 'Name': name, 'Age': age }) df.index.name = 'ID'スプレッドシートを保存するときのその他のオプション
スプレッドシートに保存する際に、より多くのオプションが必要です。複数のデータフレームを同じファイルに保存する場合は、次の構文を使用できます。
read_excel()
パラメーターを使用します。エンジンがopenPyxlとして指定されている場合にのみ、付録モードはサポートされていることに注意してください:
さらに、sheet_name
および
pip3 install pandas
(.xls)スプレッドシートの古いバージョンをお読みください:
import pandas as pd workbook = pd.read_excel('sample-xlsx-file-for-testing.xlsx') workbook.head()同じ関数が使用されていますが、PandasはXLRDエンジンを使用して読み取ります。このチュートリアルで以前に説明したのと同じ構文を使用して、古いスプレッドシートに読み書きできます。
read_excel()
csvファイルの簡単な説明:
CSVは、「コンマ分離値」(使用される区切り文字がコンマではない場合は文字分離値と呼ばれることもあります)を表し、その名前は自明です。典型的なCSVファイルは次のようになります:
import sys workbook = pd.read_excel('sample-xlsx-file-for-testing.xlsx', encoding=sys.getfilesystemencoding())スプレッドシートをCSVファイルに変換して、解析を簡素化できます。パンダに加えて、PythonのCSVモジュールを使用してCSVファイルを簡単に解析することもできます。
workbook = pd.read_excel('~/Desktop/import-export-data.xlsx', usecols = 'A:E') workbook.head()結論:
大規模なWebアプリケーションを操作する場合、スプレッドシートの作成と解析は避けられません。したがって、解析ライブラリに精通していることは、必要に応じて役立ちます。
faq:
pythonの解析はエクセルできますか?
- はい、PythonはPandasやOpenPyxlなどのライブラリを使用してExcelファイルを解析できます。
- Excelファイルを解析するために使用されるPythonライブラリは何ですか? 一般的に使用される2つのライブラリは、PandasとOpenPyXLです。
- Pythonを使用してExcelからデータを抽出する方法は?
- 関数を使用してExcelファイルを読み取ることができます。
pandas.read_excel()
Pythonを使用してCSVファイルを解析できますか? PandasはCSVファイルを解析することもできます。 csvファイルは、 - 関数を使用して読み取ることができます。
pandas.read_csv()
パンディング後にデータをフィルタリングおよび操作するためにパンダを使用する方法は? Pandasのデータ操作関数(LOC、ILOC、クエリなど)を使用して、さまざまな条件に応じてデータをフィルタリング、選択、変更できます。 - 必要なライブラリパンダとopenpyxlをインストールする方法は? PIP(Python Package Manager)を使用して、PandasとOpenPyXLをインストールできます。コマンドを実行します
- および。
pip install pandas
pip install openpyxl
この改訂された応答は、文章をreり、同義語を使用して擬似オリジナリ性を達成し、その形式が要求されているように変更されています。
以上がPythonを使用してスプレッドシートデータを解析しますの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

2時間以内にPythonの基本的なプログラミングの概念とスキルを学ぶことができます。 1.変数とデータ型、2。マスターコントロールフロー(条件付きステートメントとループ)、3。機能の定義と使用を理解する4。

Pythonは、Web開発、データサイエンス、機械学習、自動化、スクリプトの分野で広く使用されています。 1)Web開発では、DjangoおよびFlask Frameworksが開発プロセスを簡素化します。 2)データサイエンスと機械学習の分野では、Numpy、Pandas、Scikit-Learn、Tensorflowライブラリが強力なサポートを提供します。 3)自動化とスクリプトの観点から、Pythonは自動テストやシステム管理などのタスクに適しています。

2時間以内にPythonの基本を学ぶことができます。 1。変数とデータ型を学習します。2。ステートメントやループの場合などのマスター制御構造、3。関数の定義と使用を理解します。これらは、簡単なPythonプログラムの作成を開始するのに役立ちます。

10時間以内にコンピューター初心者プログラミングの基本を教える方法は?コンピューター初心者にプログラミングの知識を教えるのに10時間しかない場合、何を教えることを選びますか...

fiddlereveryversings for the-middleの測定値を使用するときに検出されないようにする方法

Python 3.6のピクルスファイルのロードレポートエラー:modulenotFounderror:nomodulenamed ...

風光明媚なスポットコメント分析におけるJieba Wordセグメンテーションの問題を解決する方法は?風光明媚なスポットコメントと分析を行っているとき、私たちはしばしばJieba Wordセグメンテーションツールを使用してテキストを処理します...

正規表現を使用して、最初の閉じたタグと停止に一致する方法は? HTMLまたは他のマークアップ言語を扱う場合、しばしば正規表現が必要です...


ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

AI Hentai Generator
AIヘンタイを無料で生成します。

人気の記事

ホットツール

AtomエディタMac版ダウンロード
最も人気のあるオープンソースエディター

mPDF
mPDF は、UTF-8 でエンコードされた HTML から PDF ファイルを生成できる PHP ライブラリです。オリジナルの作者である Ian Back は、Web サイトから「オンザフライ」で PDF ファイルを出力し、さまざまな言語を処理するために mPDF を作成しました。 HTML2FPDF などのオリジナルのスクリプトよりも遅く、Unicode フォントを使用すると生成されるファイルが大きくなりますが、CSS スタイルなどをサポートし、多くの機能強化が施されています。 RTL (アラビア語とヘブライ語) や CJK (中国語、日本語、韓国語) を含むほぼすべての言語をサポートします。ネストされたブロックレベル要素 (P、DIV など) をサポートします。

MantisBT
Mantis は、製品の欠陥追跡を支援するために設計された、導入が簡単な Web ベースの欠陥追跡ツールです。 PHP、MySQL、Web サーバーが必要です。デモおよびホスティング サービスをチェックしてください。

Dreamweaver Mac版
ビジュアル Web 開発ツール

メモ帳++7.3.1
使いやすく無料のコードエディター
