이 글은 Python 데이터 처리에 대한 관련 내용과 주요 설명을 공유합니다. 이 지식 포인트에 관심이 있는 친구들은 참고할 수 있습니다.
Numpy와 Pandas는 Python 데이터 처리에 자주 사용되는 두 가지 프레임워크입니다. 둘 다 C 언어로 작성되었으므로 작업 속도가 빠릅니다. Matplotlib는 이전에 처리된 데이터를 이미지를 통해 그릴 수 있는 Python 그리기 도구입니다. 저는 이전에 구문만 봤고 체계적으로 연구하고 요약한 적이 없습니다. 이 블로그 게시물에서는 이 세 가지 프레임워크의 API를 요약합니다.
다음은 이 세 가지 프레임워크의 간략한 소개와 차이점입니다.
Numpy: 데이터 생성 및 일부 작업에 자주 사용됩니다.
Pandas: Numpy를 기반으로 구축되었으며 Numpy의 업그레이드 버전입니다
Matplotlib: Python의 강력한 그리기 도구
Numpy
Numpy 빠른 시작 튜토리얼은 다음을 참조할 수 있습니다: Numpy 튜토리얼
Numpy 속성
ndarray.ndim: 치수
ndarray.shape : 수 행 및 열 번호(예: (3, 5))
ndarray.size: 요소 수
ndarray.dtype: 요소 유형
Numpy 생성
array(object, dtype=None): 사용 Python의 목록 또는 Tuple은 데이터를 생성합니다
zeors(shape, dtype=float): 모두 0으로 데이터를 생성합니다
ones(shape, dtype=None): 모두 1로 데이터를 생성
empty(shape, dtype=float ) : 초기화 없이 데이터 생성
arange([start, ]stop, [step, ]dtype=None): 고정 간격 데이터 세그먼트 생성
linspace(start, stop, num=50, dtype=None): 주어진 범위에서 균등하게 데이터를 생성합니다
Numpy 연산
덧셈과 뺄셈: a + b, a - b
곱셈: b*2, 10*np.sin(a)
곱셈: b**2
판단: ae0c73f4541bc4615637d2aade52239d9 0]
Pandas 누락된 데이터 처리
누락된 데이터가 있는 행 삭제: df.dropna(how='any')
누락된 데이터 채우기: df.fillna(value=5)
데이터 값이 NaN인지 여부: pd.isna( df1)
Pandas merge data
pd.concat([df1, df2, df3], axis=0): merge df
pd.merge( left, right, on='key'): 키 기반 필드 병합
df.append(s,ignore_index=True): 데이터 추가
Pandas 가져오기 및 내보내기
df.to_csv('foo.csv '): csv 파일에 저장
pd.read_csv(' foo.csv'): csv 파일에서 읽기
df.to_excel('foo.xlsx', sheet_name='Sheet1'): Excel 파일에 저장
pd.read_excel('foo.xlsx', 'Sheet1 ', index_col=None, na_values=['NA']): Excel 파일에서 읽기
Matplotlib
여기에서는 플롯하는 가장 간단한 방법만 소개합니다.
import pandas as pd import numpy as np import matplotlib.pyplot as plt # 随机生成1000个数据 data = pd.Series(np.random.randn(1000),index=np.arange(1000)) # 为了方便观看效果, 我们累加这个数据 data.cumsum() # pandas 数据可以直接观看其可视化形式 data.plot() plt.show()
관련 권장 사항:
Python 로그의 구성 파일 경로 문제에 대한 간략한 토론
위 내용은 Python 데이터 처리에 대한 간략한 분석의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!