Pythonのstatistics
モジュールは、生物統計やビジネス分析などのデータの全体的な特性を迅速に理解できるように、強力なデータ統計分析機能を提供します。データポイントを1つずつ見る代わりに、平均や分散などの統計を見て、無視される可能性のある元のデータの傾向と機能を発見し、大きなデータセットをより簡単かつ効果的に比較してください。
このチュートリアルでは、平均を計算し、データセットの分散の程度を測定する方法を説明します。特に明記されていない限り、このモジュールのすべての関数は、単に平均を合計するのではなく、mean()
関数を使用して平均値の計算をサポートします。 浮動小数点数も使用できます。
import random import statistics from fractions import Fraction as F int_values = [random.randrange(100) for x in range(9)] frac_values = [F(1, 2), F(1, 3), F(1, 4), F(1, 5), F(1, 6), F(1, 7), F(1, 8), F(1, 9)] mix_values = [*int_values, *frac_values] print(statistics.mean(mix_values)) # 929449/42840 print(statistics.fmean(mix_values)) # 21.69582166199813Python 3.8から始めて、
およびgeometric_mean(data, weights=None)
harmonic_mean(data, weights=None)
幾何平均は、データ内のすべてのn値の積をn電力のルートに分割した結果です。浮動ポイントエラーのため、結果は場合によってはわずかに偏っている可能性があります。幾何平均の1つの応用は、複合年間成長率を迅速に計算することです。たとえば、企業の4年間の売上はそれぞれ100、120、150、および200です。 3年の成長率は、それぞれ20%、25%、33.33%でした。企業の平均売上成長率は、割合の幾何平均としてより正確に表現されます。算術平均は、常に間違った成長率を与えます。
高調波平均は、データの逆数の算術平均の逆数です。データにゼロまたは負の数が含まれている場合、
import statistics growth_rates = [20, 25, 33.33] print(statistics.mean(growth_rates)) # 26.11 print(statistics.geometric_mean(growth_rates)) # 25.542796263143476例外がスローされます。
StatisticsError
高調波平均は、平均速度、密度、または並列抵抗の計算など、比率と速度の平均を計算するために使用されます。次のコードは、誰かが固定距離を移動すると平均速度を計算します(ここに100 kmです)。
同じ頻度の発生頻度を持つ複数の値がある場合、Python 3.8の
import statistics speeds = [30, 40, 60] distance = 100 total_distance = len(speeds) * distance total_time = 0 for speed in speeds: total_time += distance / speed average_speed = total_distance / total_time print(average_speed) # 39.99999999999999 print(statistics.harmonic_mean(speeds)) # 40.0
multimode()
import statistics favorite_pet = ['cat', 'dog', 'dog', 'mouse', 'cat', 'cat', 'turtle', 'dog'] print(statistics.multimode(favorite_pet)) # ['cat', 'dog']
モードで中心値を計算することは誤解を招く可能性があります。前述のように、データセット内の他の値に関係なく、モードは常に最も頻繁なデータポイントです。中心位置を決定するもう1つの方法は、関数を使用して特定のデータセットの母集団の分散を計算することです。
この関数の2番目のパラメーターはオプションです。mu pvariance(data, mu=None)
の値が提供されている場合、指定されたデータの平均に等しくなければなりません。この値が欠落している場合、平均は自動的に計算されます。この関数は、母集団全体の分散を計算する場合に役立ちます。データが単なる母集団のサンプルである場合、
は特定のサンプルの平均です。これは、提供されていない場合に自動的に計算されます。
母集団標準偏差とサンプル標準偏差は、それぞれvariance(data, xBar=None)
とxBar
関数を使用して計算できます。
import random import statistics from fractions import Fraction as F int_values = [random.randrange(100) for x in range(9)] frac_values = [F(1, 2), F(1, 3), F(1, 4), F(1, 5), F(1, 6), F(1, 7), F(1, 8), F(1, 9)] mix_values = [*int_values, *frac_values] print(statistics.mean(mix_values)) # 929449/42840 print(statistics.fmean(mix_values)) # 21.69582166199813上記の例からわかるように、分散が小さくなると、より多くのデータポイントが平均値の値に近いことを意味します。小数と分数の標準偏差を計算することもできます。
概要 このシリーズの最後のチュートリアルでは、
モジュールで提供されるさまざまな機能を学びました。関数に提供されたデータがほとんどの場合にソートされていることに気付いたかもしれませんが、ソートする必要はありません。このチュートリアルでは、並べ替えられたリストを使用しました。なぜなら、異なる機能と入力データによって返される値の関係を理解しやすくするためです。以上がPythonの数学モジュール:統計の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

Pythonは、データサイエンス、Web開発、自動化タスクに適していますが、Cはシステムプログラミング、ゲーム開発、組み込みシステムに適しています。 Pythonは、そのシンプルさと強力なエコシステムで知られていますが、Cは高性能および基礎となる制御機能で知られています。

2時間以内にPythonの基本的なプログラミングの概念とスキルを学ぶことができます。 1.変数とデータ型、2。マスターコントロールフロー(条件付きステートメントとループ)、3。機能の定義と使用を理解する4。

Pythonは、Web開発、データサイエンス、機械学習、自動化、スクリプトの分野で広く使用されています。 1)Web開発では、DjangoおよびFlask Frameworksが開発プロセスを簡素化します。 2)データサイエンスと機械学習の分野では、Numpy、Pandas、Scikit-Learn、Tensorflowライブラリが強力なサポートを提供します。 3)自動化とスクリプトの観点から、Pythonは自動テストやシステム管理などのタスクに適しています。

2時間以内にPythonの基本を学ぶことができます。 1。変数とデータ型を学習します。2。ステートメントやループの場合などのマスター制御構造、3。関数の定義と使用を理解します。これらは、簡単なPythonプログラムの作成を開始するのに役立ちます。

10時間以内にコンピューター初心者プログラミングの基本を教える方法は?コンピューター初心者にプログラミングの知識を教えるのに10時間しかない場合、何を教えることを選びますか...

fiddlereveryversings for the-middleの測定値を使用するときに検出されないようにする方法

Python 3.6のピクルスファイルのロードレポートエラー:modulenotFounderror:nomodulenamed ...

風光明媚なスポットコメント分析におけるJieba Wordセグメンテーションの問題を解決する方法は?風光明媚なスポットコメントと分析を行っているとき、私たちはしばしばJieba Wordセグメンテーションツールを使用してテキストを処理します...


ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

AI Hentai Generator
AIヘンタイを無料で生成します。

人気の記事

ホットツール

SecLists
SecLists は、セキュリティ テスターの究極の相棒です。これは、セキュリティ評価中に頻繁に使用されるさまざまな種類のリストを 1 か所にまとめたものです。 SecLists は、セキュリティ テスターが必要とする可能性のあるすべてのリストを便利に提供することで、セキュリティ テストをより効率的かつ生産的にするのに役立ちます。リストの種類には、ユーザー名、パスワード、URL、ファジング ペイロード、機密データ パターン、Web シェルなどが含まれます。テスターはこのリポジトリを新しいテスト マシンにプルするだけで、必要なあらゆる種類のリストにアクセスできるようになります。

SublimeText3 Mac版
神レベルのコード編集ソフト(SublimeText3)

EditPlus 中国語クラック版
サイズが小さく、構文の強調表示、コード プロンプト機能はサポートされていません

メモ帳++7.3.1
使いやすく無料のコードエディター

VSCode Windows 64 ビットのダウンロード
Microsoft によって発売された無料で強力な IDE エディター
