Pythonを使用してスプレッドシートデータを解析します-Python チュートリアル-php.cn

ホームページ

バックエンド開発

Python チュートリアル

Pythonを使用してスプレッドシートデータを解析します

Lisa Kudrow

Feb 20, 2025 am 09:46 AM

大規模な組織や企業で一般的なスプレッドシートデータの処理とそれをWebアプリケーションにインポートすることは、多くの開発者にとって課題です。この記事では、XLSX、CSV、およびスプレッドシートの古いバージョンへの読み取りと書き込みなど、Pythonを使用してそのようなデータを処理および解析する方法を紹介します。

キーポイント：

基本：

スプレッドシートファイルは複数のワークシートのコレクションであり、各ワークシートはテーブルと同様にグリッドに配置されたデータセルのコレクションです。ワークシートでは、データセルは行番号と列番号によって識別されます。

Using Python to Parse Spreadsheet Data たとえば、

上記の画像では、スプレッドシートには1つのワークシート「Sheet1」のみが含まれています。セル「2a」は、2行目と最初の列に対応します。セル2aの値は1です。 GUIを備えたプログラムは列名に文字を割り当てますが、データを解析すると、列番号と列番号は0から始めます。これは、Cell 2aが（1、0）、4bに対応することを意味します（1、3）、3cは（2、2）などに対応します。

python環境設定：

Python 3を使用して、スプレッドシートに読み書きします。 XLSXファイルを読み書きするには、Pandasモジュールをインストールする必要があります。 PIPやEasy_InstallなどのPythonインストーラーを使用してインストールできます。 Pandasは、OpenPyXLモジュールを使用して新しいスプレッドシート（.XLSX）ファイルを読み取り、XLRDモジュールを使用して古いスプレッドシート（.XLSファイル）を読み取ります。 Pandasがインストールされると、両方のモジュール（OpenPyXLとXLRD）が依存関係としてインストールされます。

CSVファイルを読み書きするには、PythonでプレインストールされているCSVモジュールが必要です。 CSVファイルは、Pandasを介して読み取ることもできます。

pip3 install pandas

スプレッドシートをお読みください：

ファイル内のデータを解析する場合は、次の順序で次の操作を実行する必要があります。

Import Pandasモジュール

を選択します
スプレッドシートファイルを開きます

最初に、Pythonでファイルを開きましょう。次の例のスプレッドシート（学習コンテナによって提供）：

pip3 install pandas

Pandasはスプレッドシートをテーブルとして読み取り、パンダのデータフレームとして保存します。

ファイルにASSASCII以外の文字が含まれている場合、Unicode形式で開く必要があります。

import pandas as pd
workbook = pd.read_excel('sample-xlsx-file-for-testing.xlsx')
workbook.head()

スプレッドシートが非常に大きい場合は、特定の列のみをデータフレームにロードする

パラメーターを追加できます。たとえば、次のパラメーターでは、最初の5列のみを読み取ります。 use_cols さらに、

パラメーターを使用して、特定の数の行のみを読み取るか、最初に特定の数の行を無視することができます。

import sys
workbook = pd.read_excel('sample-xlsx-file-for-testing.xlsx', encoding=sys.getfilesystemencoding())

特定のワークシートを開きますnrows skiprows

パラメーターを使用して、スプレッドシートから特定のワークシートを選択できます。デフォルトでは、

関数はファイルの最初のワークシートを解析します。ワークシートの名前は、文字列またはワークシートのインデックス（0から始まる）として提供できます：

sheet_nameリストをパラメーターに渡すことにより、PANDASデータフレームの辞書ストレージとして複数のワークシートを選択することもできます。 read_excel()

セルデータを取得

workbook = pd.read_excel('~/Desktop/import-export-data.xlsx', usecols = 'A:E')
workbook.head()

データフレームにワークシートを選択した後、PANDASデータフレームを照会することにより、特定のデータセルの値を抽出できます。 sheet_name

# 读取名为'Sheet1'的工作表
worksheet = pd.read_excel('sample-xlsx-file-for-testing.xlsx', sheet_name = 'Sheet1')

# 读取文件中的第一个工作表
worksheet = pd.read_excel('sample-xlsx-file-for-testing.xlsx', sheet_name = 0)

メソッドは、インデックスの位置に基づいて値を検索するのに役立ちます。上記のコードでは、

0番目のインデックス位置の値を検索します。同様に、

メソッドを使用して、タグを使用して値を検索できます。たとえば、パラメーター0を

メソッドに渡すと、インデックスでタグ0を検索します。

# 读取前两个工作表和名为'Sheet 3'的工作表
worksheets = pd.read_excel('~/Desktop/import-export-data.xlsx', sheet_name = [0, 1, 'Sheet 3'])

データフレームにデータセットをロードした後、パンダの組み込み関数を使用してデータセットを照会できます。

.iloc().iloc()スプレッドシートを作成します：.loc().loc()

ワークシートを作成するプロセスは、前のセクションに似ています。

import pandas as pd
workbook = pd.read_excel('sample-xlsx-file-for-testing.xlsx')

# 打印'Product'列的第一个值
print(workbook['Product'].iloc[0])

=> Carretera

Import Pandasモジュール

データをワークブックに保存します

ワークブックにワークシートを作成します

ワークブック内のセルにスタイルを追加します

データフレームに

は

関数を使用して同じファイルを開くこともできます。

ワークシートを追加

print(workbook['Product'].loc[0])

=> Carretera

データフレームは、to_excel()パラメーターを使用してワークブックの特定のワークシートとして保存できます。このパラメーターのデフォルト値はSHEIT1：

です

import pandas as pd

name = ['John', 'Mary', 'Sherlock']
age = [11, 12, 13]
df = pd.DataFrame({ 'Name': name, 'Age': age })
df.index.name = 'ID'

スプレッドシートを保存するときのその他のオプション

スプレッドシートに保存する際に、より多くのオプションが必要です。複数のデータフレームを同じファイルに保存する場合は、次の構文を使用できます。 read_excel()

データフレームを既存のスプレッドシートに追加するには、

パラメーターを使用します。エンジンがopenPyxlとして指定されている場合にのみ、付録モードはサポートされていることに注意してください：

さらに、sheet_nameおよび

を使用して、日付と時刻の値を設定します。

pip3 install pandas

（.xls）スプレッドシートの古いバージョンをお読みください：

import pandas as pd
workbook = pd.read_excel('sample-xlsx-file-for-testing.xlsx')
workbook.head()

同じ関数が使用されていますが、PandasはXLRDエンジンを使用して読み取ります。このチュートリアルで以前に説明したのと同じ構文を使用して、古いスプレッドシートに読み書きできます。 read_excel()

csvファイルの簡単な説明：

CSVは、「コンマ分離値」（使用される区切り文字がコンマではない場合は文字分離値と呼ばれることもあります）を表し、その名前は自明です。典型的なCSVファイルは次のようになります：

import sys
workbook = pd.read_excel('sample-xlsx-file-for-testing.xlsx', encoding=sys.getfilesystemencoding())

スプレッドシートをCSVファイルに変換して、解析を簡素化できます。パンダに加えて、PythonのCSVモジュールを使用してCSVファイルを簡単に解析することもできます。

workbook = pd.read_excel('~/Desktop/import-export-data.xlsx', usecols = 'A:E')
workbook.head()

結論：

大規模なWebアプリケーションを操作する場合、スプレッドシートの作成と解析は避けられません。したがって、解析ライブラリに精通していることは、必要に応じて役立ちます。

faq：

pythonの解析はエクセルできますか？

Excelファイルを解析するために使用されるPythonライブラリは何ですか？
Pythonを使用してExcelからデータを抽出する方法は？
関数を使用してExcelファイルを読み取ることができます。 pandas.read_excel()Pythonを使用してCSVファイルを解析できますか？
関数を使用して読み取ることができます。 pandas.read_csv()パンディング後にデータをフィルタリングおよび操作するためにパンダを使用する方法は？
必要なライブラリパンダとopenpyxlをインストールする方法は？
および。 pip install pandas pip install openpyxlこの改訂された応答は、文章をreり、同義語を使用して擬似オリジナリ性を達成し、その形式が要求されているように変更されています。

以上がPythonを使用してスプレッドシートデータを解析しますの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明

この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

Pythonリストをどのようにスライスしますか？May 02, 2025 am 12:14 AM

slicingapythonlistisdoneusingtheyntaxlist [start：stop：step] .hore'showitworks：1）startisthe indexofthefirstelementtoinclude.2）spotisthe indexofthefirmenttoeexclude.3）staptistheincrementbetbetinelements

Numpyアレイで実行できる一般的な操作は何ですか？May 02, 2025 am 12:09 AM

numpyallows forvariousoperationsonarrays：1）basicarithmeticlikeaddition、減算、乗算、および分割; 2）AdvancedperationssuchasmatrixMultiplication;

Pythonを使用したデータ分析では、配列はどのように使用されていますか？May 02, 2025 am 12:09 AM

Arraysinpython、特にnumpyandpandas、aresentialfordataanalysis、offeringspeedandeficiency.1）numpyarraysenable numpyarraysenable handling forlaredatasents andcomplexoperationslikemoverages.2）Pandasextendsnumpy'scapabivitieswithdataframesfortruc

リストのメモリフットプリントは、Pythonの配列のメモリフットプリントとどのように比較されますか？May 02, 2025 am 12:08 AM

listsandnumpyarraysinpythonhavedifferentmemoryfootprints：listsaremoreflexiblellessmemory-efficient、whileenumpyarraysaraysareoptimizedfornumericaldata.1）listsstorereferencesto objects、with whowedaround64byteson64-bitedatigu

実行可能なPythonスクリプトを展開するとき、環境固有の構成をどのように処理しますか？May 02, 2025 am 12:07 AM

toensurepythonscriptsbehaveCorrectlyAcrossDevelosment、staging、and Production、usetheseStrategies：1）環境variablesforsimplestetings、2）configurationfilesforcomplexsetups、and3）dynamicloadingforadaptability.eachtododododododofersuniquebentandrequiresca

Pythonアレイをどのようにスライスしますか？May 01, 2025 am 12:18 AM

Pythonリストスライスの基本的な構文はリストです[start：stop：step]。 1.STARTは最初の要素インデックス、2。ストップは除外された最初の要素インデックスであり、3.ステップは要素間のステップサイズを決定します。スライスは、データを抽出するためだけでなく、リストを変更および反転させるためにも使用されます。

どのような状況で、リストは配列よりもパフォーマンスが向上しますか？May 01, 2025 am 12:06 AM

ListSoutPerformArraysIn：1）ダイナミシジョンアンドフレーケンティオン/削除、2）ストーリングヘテロゼンダタ、および3）メモリ効率の装飾、ButmayhaveslightPerformancostsinceNASOPERATIONS。

PythonアレイをPythonリストに変換するにはどうすればよいですか？May 01, 2025 am 12:05 AM

toconvertapythonarraytoalist、usetheList（）constructororageneratorexpression.1）importhearraymoduleandcreateanarray.2）useList（arr）または[xforxinarr] toconvertoalistは、largedatatessを変えることを伴うものです。

See all articles