이 기사의 내용은 Python의 간단한 통계 계산에 관한 것입니다. 이는 특정 참고 가치가 있으므로 도움이 될 수 있습니다.
1. 이러한 작업을 위해서는 Anaconda 통합 라이브러리가 컴퓨터에 설치되어 있는지 확인하세요. 설치 후 오류가 발생하면 원래 컴퓨터에서 Python을 제거하고 Anaconda를 직접 추가하는 것이 좋습니다. 설치 중에 확인하세요. 그렇지 않으면 나중에 Pycharm의 컴파일러에서 Anaconda 설치 폴더에서 Python을 선택해야 합니다. 데이터 파일을 저장하기 위해 Pycharm에 새 데이터 폴더를 만듭니다.
2. Python 콘솔을 엽니다.
3. 먼저 Python을 사용하여 pd로 import pandas를 입력한 다음 df=pd.read_csv("./data/CityData.csv")를 입력하여 데이터를 읽어야 합니다. 마지막으로 df를 입력하여 데이터를 표시합니다.
4. type(df) 및 type(df["cid"])를 각각 입력하여 두 데이터 유형이 서로 다른지 확인합니다.
5 df.mean() 또는 df["xid"].mean()
6을 계산합니다. 중앙값: df.median() 또는 df["yid"].median
7을 입력합니다. df.Quantile(q=0.25)
을 입력합니다. 모드 찾기: df.mode() 또는 df["xid"].mode()
를 입력하세요. 9. 표준 편차를 찾으려면: df.std() 또는 df["yid"].std()
를 입력하세요.
10. 분산 계산: df.var() 또는 df["xid"].var()
11. 합계: df.sum() 또는 df["xid"] . sum()
12. 왜도 계수 계산: df.skew() 또는 df["yid"].skew()
13. 또는 df["yid"].kurt()
14. Pandas는 이를 직접 생성할 수 없습니다. ss를 먼저 입력한 다음 ss.norm을 입력해야 합니다. 이때 생성되는 것은 정규분포 객체입니다. ss.norm.stats(moments="mvsk")를 입력하여 확인합니다. mvsk는 각각 평균, 분산, 왜도 계수, 첨도 계수를 나타냅니다.
이때 정규분포의 mvsk에 해당하는 4개의 값이 각각 0, 1, 0, 0으로 생성되는 것을 볼 수 있습니다.
15.ss.norm.pdf(0.0)은 가로좌표가 0일 때 세로좌표의 값을 나타냅니다. ss.norm.ppf(0.9)는 음의 무한대부터 반환 값까지 합산하면 얻어지는 값이 0.9라는 뜻인데, 여기서 ppf 뒤의 값은 0~1 사이여야 한다. ss.norm.cdf(2)는 음의 무한대에서 2까지 적분할 때 반환되는 값을 나타내며, ss.norm.rvs(size=10)는 정규분포를 따르는 10개의 난수를 얻을 수 있다.
16.마찬가지로 ss.chi2 및 ss.t를 입력하여 각각 카이제곱 분포와 T 분포를 얻을 수 있습니다.
17 또한 df.sample(n=10)을 입력하여 추출할 수도 있습니다. 데이터 10개 샘플의 경우 df.sample(frac=0.1)을 입력하여 데이터에서 10% 샘플을 추출합니다.
위 내용은 Python의 단순 통계 계산의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!