Scipy を使用して経験的分布を理論分布に当てはめる
はじめに
整数値の大規模なデータセットと計算を目的としています。 p 値、より高い値が発生する確率。これらの確率を決定するには、データ分布に近似する理論的な分布を求めます。この記事では、Python の Scipy パッケージを使用してこれを実現する方法について説明します。
分布のフィッティング
Scipy の scipy.stats モジュールは、連続および離散の広範なコレクションを提供します。確率分布。各分布には、その形状と動作を特徴付ける独自のパラメーターがあります。目標は、適合度検定に基づいて経験的データに最もよく適合する分布を見つけることです。
適合度検定
適合度テストは、経験的分布と理論的分布の間の差異を測定します。一般的な検定には、コルモゴロフ-スミルノフ検定とカイ二乗検定が含まれます。 Scipy はこれらのテストを実行する関数を提供しており、候補分布の適合性を評価できます。
Sum of Squared Error (SSE)
Oneこのアプローチは、適合度の尺度として二乗誤差和 (SSE) を利用することです。 SSE は、経験的確率密度関数と理論的確率密度関数間の二乗差を計算します。最小限の SSE を持つ分布が最適であると考えられます。
Python の実装
次の Python コードは、データを理論的な分布に適合させる方法を示しています。使用してSSE:
<br>pdas を pd としてインポート<br>numpy を np としてインポート<br>scipy.stats を st としてインポート<br>matplotlib.pyplot を plt としてインポート<p>データ = pd.read_csv('data.csv') # データファイルに置き換えます</p><h1 id="データのヒストグラム">データのヒストグラム</h1><p>plt.hist(data, bins=50)<br>plt.show() </p><h1 id="候補分布">候補分布</h1><p>dist_names = ['norm', 'expon', 'gamma', 'beta']</p><h1 id="各分布を当てはめて-SSE-を計算します">各分布を当てはめて SSE を計算します</h1><p>best_distribution = None<br>min_sse = np.inf<br> dist in dist_names:</p><pre class="brush:php;toolbar:false">dist = getattr(st, dist) params = dist.fit(data) # Calculate SSE sse = np.mean((dist.pdf(data, *params) - np.histogram(data, bins=50, density=True)[0]) ** 2) # Update the best distribution if necessary if sse <h1 id="の分布パラメータを出力します-最適な分布">の分布パラメータを出力します。最適な分布</h1><p>print(best_distribution[0].name, best_distribution[1])<br></p>
このコードは、最適な分布の名前を提供します。推定されたパラメータを使用します。これらのパラメーターを使用して p 値を計算し、分布の適合度を評価できます。
以上がPython で Scipy を使用して経験データを理論分布に適合させるにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

この記事では、Pythonライブラリである美しいスープを使用してHTMLを解析する方法について説明します。 find()、find_all()、select()、およびget_text()などの一般的な方法は、データ抽出、多様なHTML構造とエラーの処理、および代替案(SEL

Pythonの統計モジュールは、強力なデータ統計分析機能を提供して、生物統計やビジネス分析などのデータの全体的な特性を迅速に理解できるようにします。データポイントを1つずつ見る代わりに、平均や分散などの統計を見て、無視される可能性のある元のデータの傾向と機能を発見し、大きなデータセットをより簡単かつ効果的に比較してください。 このチュートリアルでは、平均を計算し、データセットの分散の程度を測定する方法を説明します。特に明記しない限り、このモジュールのすべての関数は、単に平均を合計するのではなく、平均()関数の計算をサポートします。 浮動小数点数も使用できます。 ランダムをインポートします インポート統計 fractiから

Pythonオブジェクトのシリアル化と脱介入は、非自明のプログラムの重要な側面です。 Pythonファイルに何かを保存すると、構成ファイルを読み取る場合、またはHTTPリクエストに応答する場合、オブジェクトシリアル化と脱滑り化を行います。 ある意味では、シリアル化と脱派化は、世界で最も退屈なものです。これらすべての形式とプロトコルを気にするのは誰ですか? Pythonオブジェクトを維持またはストリーミングし、後で完全に取得したいと考えています。 これは、概念レベルで世界を見るのに最適な方法です。ただし、実用的なレベルでは、選択したシリアル化スキーム、形式、またはプロトコルは、プログラムの速度、セキュリティ、メンテナンスの自由、およびその他の側面を決定する場合があります。

この記事では、深い学習のためにTensorflowとPytorchを比較しています。 関連する手順、データの準備、モデルの構築、トレーニング、評価、展開について詳しく説明しています。 特に計算グラップに関して、フレームワーク間の重要な違い

この記事では、numpy、pandas、matplotlib、scikit-learn、tensorflow、django、flask、and requestsなどの人気のあるPythonライブラリについて説明し、科学的コンピューティング、データ分析、視覚化、機械学習、Web開発、Hの使用について説明します。

この記事では、コマンドラインインターフェイス(CLI)の構築に関するPython開発者をガイドします。 Typer、Click、Argparseなどのライブラリを使用して、入力/出力の処理を強調し、CLIの使いやすさを改善するためのユーザーフレンドリーな設計パターンを促進することを詳述しています。

このチュートリアルは、単純なツリーナビゲーションを超えたDOM操作に焦点を当てた、美しいスープの以前の紹介に基づいています。 HTML構造を変更するための効率的な検索方法と技術を探ります。 1つの一般的なDOM検索方法はExです

この記事では、Pythonにおける仮想環境の役割について説明し、プロジェクトの依存関係の管理と競合の回避に焦点を当てています。プロジェクト管理の改善と依存関係の問題を減らすための作成、アクティベーション、およびメリットを詳しく説明しています。


ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

AI Hentai Generator
AIヘンタイを無料で生成します。

人気の記事

ホットツール

MinGW - Minimalist GNU for Windows
このプロジェクトは osdn.net/projects/mingw に移行中です。引き続きそこでフォローしていただけます。 MinGW: GNU Compiler Collection (GCC) のネイティブ Windows ポートであり、ネイティブ Windows アプリケーションを構築するための自由に配布可能なインポート ライブラリとヘッダー ファイルであり、C99 機能をサポートする MSVC ランタイムの拡張機能が含まれています。すべての MinGW ソフトウェアは 64 ビット Windows プラットフォームで実行できます。

mPDF
mPDF は、UTF-8 でエンコードされた HTML から PDF ファイルを生成できる PHP ライブラリです。オリジナルの作者である Ian Back は、Web サイトから「オンザフライ」で PDF ファイルを出力し、さまざまな言語を処理するために mPDF を作成しました。 HTML2FPDF などのオリジナルのスクリプトよりも遅く、Unicode フォントを使用すると生成されるファイルが大きくなりますが、CSS スタイルなどをサポートし、多くの機能強化が施されています。 RTL (アラビア語とヘブライ語) や CJK (中国語、日本語、韓国語) を含むほぼすべての言語をサポートします。ネストされたブロックレベル要素 (P、DIV など) をサポートします。

WebStorm Mac版
便利なJavaScript開発ツール

AtomエディタMac版ダウンロード
最も人気のあるオープンソースエディター

ZendStudio 13.5.1 Mac
強力な PHP 統合開発環境

ホットトピック









