Pandas를 사용하여 데이터베이스에서 데이터를 읽는 방법
Pandas는 풍부한 데이터 조작 및 분석 기능을 제공하는 강력한 데이터 분석 도구입니다. 실제 데이터 분석 과정에서 분석을 위해 데이터베이스에서 데이터를 읽어야 하는 경우가 많습니다. 이 기사에서는 Pandas 라이브러리를 사용하여 데이터베이스에서 데이터를 읽는 방법을 소개하고 특정 코드 예제를 제공합니다.
먼저 Pandas 라이브러리 및 데이터베이스 관련 드라이버가 설치되었는지 확인해야 합니다. MySQL 데이터베이스를 사용한다고 가정하면 데이터베이스에 연결하려면 pymysql 모듈을 설치해야 합니다. 다음 명령을 사용하여 관련 종속성을 설치할 수 있습니다.
pip install pandas pip install pymysql
다음으로 필요한 라이브러리를 가져와야 합니다.
import pandas as pd import pymysql
그런 다음 데이터베이스에 연결해야 합니다. 데이터베이스 주소, 사용자 이름, 비밀번호 등과 같은 데이터베이스 관련 정보를 제공해야 합니다. 다음은 로컬 MySQL 데이터베이스에 연결하는 예입니다.
# 连接到数据库 conn = pymysql.connect(host='localhost', user='root', password='password', database='database_name')
연결이 성공한 후 SQL 쿼리 문을 사용하여 데이터베이스에서 데이터를 읽을 수 있습니다. Pandas는 SQL 쿼리를 실행하고 결과를 반환하는 read_sql() 함수를 제공합니다. 다음은 데이터베이스에서 전체 테이블을 읽는 예입니다.
# 从数据库中读取整张表 sql = "SELECT * FROM table_name" df = pd.read_sql(sql, conn)
테이블의 데이터 일부만 읽으려면 WHERE 절을 사용하여 조건을 추가할 수 있습니다. 다음은 데이터베이스에서 조건에 맞는 데이터를 읽는 예입니다.
# 从数据库中读取满足条件的数据 sql = "SELECT * FROM table_name WHERE column_name = 'value'" df = pd.read_sql(sql, conn)
데이터를 읽은 후 데이터에 대한 다양한 연산 및 분석을 수행할 수 있습니다. 예를 들어 데이터의 처음 몇 행, 통계에 대한 기본 정보 등을 볼 수 있습니다. 다음은 일반적으로 사용되는 몇 가지 예입니다.
# 查看数据的前几行 print(df.head()) # 统计数据的基本信息 print(df.describe()) # 计算某一列的平均值 print(df['column_name'].mean())
위의 예 외에도 Pandas는 데이터 필터링, 정렬, 그룹화, 병합 등과 같은 수많은 데이터 조작 및 분석 기능도 제공합니다. 실제 필요에 따라 이러한 기능을 추가로 적용할 수 있습니다.
마지막으로 데이터 읽기 및 분석을 완료한 후 리소스를 해제하기 위해 데이터베이스 연결을 닫아야 합니다.
# 关闭与数据库的连接 conn.close()
요약하면 이 기사에서는 Pandas 라이브러리를 사용하여 데이터베이스에서 데이터를 읽는 방법을 소개하고 구체적인 코드 예제를 제공합니다. 제공된다. Pandas의 강력한 기능을 사용하면 데이터베이스에서 데이터를 쉽게 읽고 다양한 작업 및 분석을 수행할 수 있어 데이터 분석의 효율성과 정확성이 향상됩니다.
위 내용은 Pandas 데이터베이스 읽기 가이드의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!