ホームページ >バックエンド開発 >Python チュートリアル >Pandas は SQL データベースからデータを簡単に読み取ります

Pandas は SQL データベースからデータを簡単に読み取ります

WBOY
WBOYオリジナル
2024-01-09 22:45:581170ブラウズ

Pandas は SQL データベースからデータを簡単に読み取ります

データ処理ツール: Pandas は SQL データベース内のデータを読み取るため、特定のコード例が必要です

データ量が増加し続け、複雑さが増すにつれて、データ処理が必要になります。現代社会における重要なつながりとなっています。データ処理プロセスにおいて、Pandas は多くのデータ アナリストや科学者にとって好まれるツールの 1 つとなっています。この記事では、Pandas ライブラリを使用して SQL データベースからデータを読み取る方法を紹介し、いくつかの具体的なコード例を示します。

Pandas は、Python をベースとした強力なデータ処理および分析ツールです。 Series や DataFrame などの豊富なデータ構造と、データ クリーニング、フィルタリング、統計、視覚化などのさまざまな機能を提供します。同時に、Pandas は、CSV ファイル、Excel ファイル、SQL データベースなどを含むさまざまなデータ ソースを読み書きするための一連のツールも提供します。

この記事では、Pandas を使用して SQL データベースからデータを読み取る方法に焦点を当てます。 Panda と関連するデータベース ドライバーを事前にインストールする必要があります。ここでは、デモンストレーションの例として MySQL データベースを取り上げます。

まず、Pandas ライブラリと MySQL データベース ドライバーをインポートする必要があります。次のコードをインポートに使用できます:

import pandas as pd
import pymysql

次に、データベース接続を作成することで、Pandas ライブラリの read_sql() 関数を使用して SQL データベース内のデータを読み取ることができます。 。以下はサンプル コードです。

# 创建数据库连接
conn = pymysql.connect(host='localhost', port=3306, user='root', password='password', database='mydb')

# 构建SQL查询语句
sql_query = "SELECT * FROM table_name"

# 读取SQL数据库中的数据
df = pd.read_sql(sql_query, conn)

# 打印数据
print(df)

上記のコードでは、ホスト名、ポート番号、ユーザー名、パスワード、データベース名などのデータベース接続パラメーターを実際の状況に応じて変更する必要があります。同時に、table_name を実際のテーブル名に置き換える必要があります。

read_sql() 関数を使用して SQL データベース内のデータを読み取る場合、実際のニーズに応じて SQL クエリ ステートメントを作成できます。たとえば、SELECT * を使用してすべての列からデータを読み取ることも、条件を追加して必要なデータをフィルターすることもできます。

SQL データベース内のデータを読み取った後、データを印刷したり、さらなるデータ処理や分析を実行したりできます。たとえば、Pandas のさまざまな関数とメソッドを使用して、データのクリーニング、フィルタリング、並べ替え、統計などの操作を実行できます。一般的に使用されるデータ処理操作の例を次に示します。

# 查看数据的前几行
print(df.head())

# 查看数据的基本统计信息
print(df.describe())

# 对数据进行排序
df_sorted = df.sort_values('column_name', ascending=False)

# 筛选符合条件的数据
df_filtered = df[df['column_name'] > 100]

# 计算某列的平均值
average_value = df['column_name'].mean()

# 添加新的计算列
df['new_column'] = df['column_name'] * 2

# 数据可视化
df.plot(kind='bar', x='column_name', y='another_column')

使用後は、必ずデータベース接続を閉じてください。

# 关闭数据库连接
conn.close()

read_sql() 関数を使用します。 Pandas ライブラリを使用すると、SQL データベースのデータを Pandas DataFrame に簡単に読み込んで、さまざまなデータ処理と分析を実行できます。これらの関数の能力により、Pandas はデータ処理における強力なツールになります。

要約すると、この記事では、Pandas ライブラリを使用して SQL データベース内のデータを読み取る方法を紹介し、読み取りプロセスの具体的なコード例を示します。この記事の紹介と例を通じて、読者が Pandas をより適切に使用して SQL データベース内のデータを処理および分析できるようになることを願っています。

以上がPandas は SQL データベースからデータを簡単に読み取りますの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。