大規模な組織や企業で一般的なスプレッドシートデータの処理とそれをWebアプリケーションにインポートすることは、多くの開発者にとって課題です。この記事では、XLSX、CSV、およびスプレッドシートの古いバージョンへの読み取りと書き込みなど、Pythonを使用してそのようなデータを処理および解析する方法を紹介します。
キーポイント:
- Pythonは、PandasやOpenPyXLなどのライブラリを組み合わせて、XLSXファイル、CSVファイル、レガシースプレッドシートの読み書きなど、スプレッドシートデータを簡単に解析します。これにより、これらの形式で保存されているデータを簡単に操作および分析できます。
- スプレッドシートの読み取りプロセスには、Pandasモジュールのインポート、スプレッドシートファイルの開き、特定のワークシートの選択、特定のデータセルの値の抽出が含まれます。 Pandasはスプレッドシートをテーブルとして読み取り、データフレームとして保存します。これにより、データフレームをクエリして特定のデータを抽出できます。
- スプレッドシートを作成するプロセスは、データフレームを作成してワークブックに保存し、ワークブックにワークシートを作成し、ワークブックのセルにデータを追加することに似ています。 PandasのExcelwriterクラスは、既存のスプレッドシートへのデータフレームや設定日と時刻の値など、データをスプレッドシートに保存するためのより多くのオプションを提供します。
- スプレッドシートの基本:
基本:
スプレッドシートファイルは複数のワークシートのコレクションであり、各ワークシートはテーブルと同様にグリッドに配置されたデータセルのコレクションです。ワークシートでは、データセルは行番号と列番号によって識別されます。
たとえば、
python環境設定:
Python 3を使用して、スプレッドシートに読み書きします。 XLSXファイルを読み書きするには、Pandasモジュールをインストールする必要があります。 PIPやEasy_InstallなどのPythonインストーラーを使用してインストールできます。 Pandasは、OpenPyXLモジュールを使用して新しいスプレッドシート(.XLSX)ファイルを読み取り、XLRDモジュールを使用して古いスプレッドシート(.XLSファイル)を読み取ります。 Pandasがインストールされると、両方のモジュール(OpenPyXLとXLRD)が依存関係としてインストールされます。CSVファイルを読み書きするには、PythonでプレインストールされているCSVモジュールが必要です。 CSVファイルは、Pandasを介して読み取ることもできます。
pip3 install pandasスプレッドシートをお読みください:
ファイル内のデータを解析する場合は、次の順序で次の操作を実行する必要があります。
Import Pandasモジュール
- スプレッドシートファイル(またはワークブック)を開きます
- ワークシートを選択
- を選択します 特定のデータセルの値を抽出します
- スプレッドシートファイルを開きます
pip3 install pandas
Pandasはスプレッドシートをテーブルとして読み取り、パンダのデータフレームとして保存します。
ファイルにASSASCII以外の文字が含まれている場合、Unicode形式で開く必要があります。
import pandas as pd workbook = pd.read_excel('sample-xlsx-file-for-testing.xlsx') workbook.head()スプレッドシートが非常に大きい場合は、特定の列のみをデータフレームにロードする
パラメーターを追加できます。たとえば、次のパラメーターでは、最初の5列のみを読み取ります。
use_cols
さらに、
import sys workbook = pd.read_excel('sample-xlsx-file-for-testing.xlsx', encoding=sys.getfilesystemencoding())
特定のワークシートを開きますnrows
skiprows
関数はファイルの最初のワークシートを解析します。ワークシートの名前は、文字列またはワークシートのインデックス(0から始まる)として提供できます:
sheet_name
リストをパラメーターに渡すことにより、PANDASデータフレームの辞書ストレージとして複数のワークシートを選択することもできます。
read_excel()
workbook = pd.read_excel('~/Desktop/import-export-data.xlsx', usecols = 'A:E') workbook.head()
データフレームにワークシートを選択した後、PANDASデータフレームを照会することにより、特定のデータセルの値を抽出できます。
sheet_name
# 读取名为'Sheet1'的工作表 worksheet = pd.read_excel('sample-xlsx-file-for-testing.xlsx', sheet_name = 'Sheet1') # 读取文件中的第一个工作表 worksheet = pd.read_excel('sample-xlsx-file-for-testing.xlsx', sheet_name = 0)メソッドは、インデックスの位置に基づいて値を検索するのに役立ちます。上記のコードでは、
0番目のインデックス位置の値を検索します。同様に、
メソッドを使用して、タグを使用して値を検索できます。たとえば、パラメーター0をメソッドに渡すと、インデックスでタグ0を検索します。
# 读取前两个工作表和名为'Sheet 3'的工作表 worksheets = pd.read_excel('~/Desktop/import-export-data.xlsx', sheet_name = [0, 1, 'Sheet 3'])データフレームにデータセットをロードした後、パンダの組み込み関数を使用してデータセットを照会できます。
.iloc()
.iloc()
スプレッドシートを作成します:.loc()
.loc()
import pandas as pd workbook = pd.read_excel('sample-xlsx-file-for-testing.xlsx') # 打印'Product'列的第一个值 print(workbook['Product'].iloc[0]) => Carretera
Import Pandasモジュール
データをワークブックに保存します
ワークブックにワークシートを作成しますワークブック内のセルにスタイルを追加します
- 新しいファイルを作成します
- 新しいファイルを作成するには、最初にデータフレームが必要です。記事の冒頭でデモテーブルを再作成しましょう:
- データフレームに 関数を呼び出して保存するファイル名を指定することにより、新しいスプレッドシートファイルを作成できます。
は
関数を使用して同じファイルを開くこともできます。ワークシートを追加
print(workbook['Product'].loc[0]) => Carretera
データフレームは、to_excel()
パラメーターを使用してワークブックの特定のワークシートとして保存できます。このパラメーターのデフォルト値はSHEIT1:
import pandas as pd name = ['John', 'Mary', 'Sherlock'] age = [11, 12, 13] df = pd.DataFrame({ 'Name': name, 'Age': age }) df.index.name = 'ID'スプレッドシートを保存するときのその他のオプション
スプレッドシートに保存する際に、より多くのオプションが必要です。複数のデータフレームを同じファイルに保存する場合は、次の構文を使用できます。
read_excel()
パラメーターを使用します。エンジンがopenPyxlとして指定されている場合にのみ、付録モードはサポートされていることに注意してください:
さらに、sheet_name
および
pip3 install pandas
(.xls)スプレッドシートの古いバージョンをお読みください:
import pandas as pd workbook = pd.read_excel('sample-xlsx-file-for-testing.xlsx') workbook.head()同じ関数が使用されていますが、PandasはXLRDエンジンを使用して読み取ります。このチュートリアルで以前に説明したのと同じ構文を使用して、古いスプレッドシートに読み書きできます。
read_excel()
csvファイルの簡単な説明:
CSVは、「コンマ分離値」(使用される区切り文字がコンマではない場合は文字分離値と呼ばれることもあります)を表し、その名前は自明です。典型的なCSVファイルは次のようになります:
import sys workbook = pd.read_excel('sample-xlsx-file-for-testing.xlsx', encoding=sys.getfilesystemencoding())スプレッドシートをCSVファイルに変換して、解析を簡素化できます。パンダに加えて、PythonのCSVモジュールを使用してCSVファイルを簡単に解析することもできます。
workbook = pd.read_excel('~/Desktop/import-export-data.xlsx', usecols = 'A:E') workbook.head()結論:
大規模なWebアプリケーションを操作する場合、スプレッドシートの作成と解析は避けられません。したがって、解析ライブラリに精通していることは、必要に応じて役立ちます。
faq:
pythonの解析はエクセルできますか?
- はい、PythonはPandasやOpenPyxlなどのライブラリを使用してExcelファイルを解析できます。
- Excelファイルを解析するために使用されるPythonライブラリは何ですか? 一般的に使用される2つのライブラリは、PandasとOpenPyXLです。
- Pythonを使用してExcelからデータを抽出する方法は?
- 関数を使用してExcelファイルを読み取ることができます。
pandas.read_excel()
Pythonを使用してCSVファイルを解析できますか? PandasはCSVファイルを解析することもできます。 csvファイルは、 - 関数を使用して読み取ることができます。
pandas.read_csv()
パンディング後にデータをフィルタリングおよび操作するためにパンダを使用する方法は? Pandasのデータ操作関数(LOC、ILOC、クエリなど)を使用して、さまざまな条件に応じてデータをフィルタリング、選択、変更できます。 - 必要なライブラリパンダとopenpyxlをインストールする方法は? PIP(Python Package Manager)を使用して、PandasとOpenPyXLをインストールできます。コマンドを実行します
- および。
pip install pandas
pip install openpyxl
この改訂された応答は、文章をreり、同義語を使用して擬似オリジナリ性を達成し、その形式が要求されているように変更されています。
以上がPythonを使用してスプレッドシートデータを解析しますの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

slicingapythonlistisdoneusingtheyntaxlist [start:stop:step] .hore'showitworks:1)startisthe indexofthefirstelementtoinclude.2)spotisthe indexofthefirmenttoeexclude.3)staptistheincrementbetbetinelements

numpyallows forvariousoperationsonarrays:1)basicarithmeticlikeaddition、減算、乗算、および分割; 2)AdvancedperationssuchasmatrixMultiplication;

Arraysinpython、特にnumpyandpandas、aresentialfordataanalysis、offeringspeedandeficiency.1)numpyarraysenable numpyarraysenable handling forlaredatasents andcomplexoperationslikemoverages.2)Pandasextendsnumpy'scapabivitieswithdataframesfortruc

listsandnumpyarraysinpythonhavedifferentmemoryfootprints:listsaremoreflexiblellessmemory-efficient、whileenumpyarraysaraysareoptimizedfornumericaldata.1)listsstorereferencesto objects、with whowedaround64byteson64-bitedatigu

toensurepythonscriptsbehaveCorrectlyAcrossDevelosment、staging、and Production、usetheseStrategies:1)環境variablesforsimplestetings、2)configurationfilesforcomplexsetups、and3)dynamicloadingforadaptability.eachtododododododofersuniquebentandrequiresca

Pythonリストスライスの基本的な構文はリストです[start:stop:step]。 1.STARTは最初の要素インデックス、2。ストップは除外された最初の要素インデックスであり、3.ステップは要素間のステップサイズを決定します。スライスは、データを抽出するためだけでなく、リストを変更および反転させるためにも使用されます。

ListSoutPerformArraysIn:1)ダイナミシジョンアンドフレーケンティオン/削除、2)ストーリングヘテロゼンダタ、および3)メモリ効率の装飾、ButmayhaveslightPerformancostsinceNASOPERATIONS。

toconvertapythonarraytoalist、usetheList()constructororageneratorexpression.1)importhearraymoduleandcreateanarray.2)useList(arr)または[xforxinarr] toconvertoalistは、largedatatessを変えることを伴うものです。


ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

Video Face Swap
完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

人気の記事

ホットツール

SublimeText3 Linux 新バージョン
SublimeText3 Linux 最新バージョン

SublimeText3 中国語版
中国語版、とても使いやすい

ドリームウィーバー CS6
ビジュアル Web 開発ツール

EditPlus 中国語クラック版
サイズが小さく、構文の強調表示、コード プロンプト機能はサポートされていません

WebStorm Mac版
便利なJavaScript開発ツール

ホットトピック









