検索
ホームページバックエンド開発Python チュートリアル子供の好奇心: データサイエンスの驚くべき基礎

The Curiosity of a Child: A Surprising Foundation for Data Science

5 歳児にデータ サイエンスを説明するように頼まれたら、私はおそらく次のように言うでしょう。「それは探偵になったようなものです。手がかり (データ) を収集し、それらがどのように組み合わされるかを把握し (データの分析とクリーンアップ)、それらを使用して謎を解決したり、次に何が起こるかを推測したり (結果を予測) します。」

データサイエンスは、探偵や立派な学位を持った大人だけのものではありません。おそらく、あなたも気づかないうちに、データ サイエンスの原則を日常生活に適用しているはずです。たとえば、私を例に挙げてみましょう。

私は子供の頃、好奇心旺盛で物静かで、考えることをやめない子供でした。表面上は多くを語らなかったが、頭の中ではそれが市場全体だった。私は誰も気づかなかった点と点を結び、よくある「なぜこれはこうなっているのか?」だけではなく、終わりのない質問をしました。しかし、さらに好奇心旺盛な人たちはこう言います。何がそれを可能にするのでしょうか?」大人になった今でも、私には質問しすぎる悪い癖があります。友人に「質問するのは子供みたいだね!」と言われたことがあります。私はそれを褒め言葉として受け取りました。

この好奇心が、子供の頃、特に NEPA (現在の PHCN) のような予測不可能なものに関しては、無意識のうちにデータ サイエンスの原則を受け入れるように導きました。ナイジェリアに住んだことがある方なら、停電が頻繁にあったため、明かりが灯るのがちょっとしたお祝いのように感じられたことをご存知でしょう。私はすべてが予測不可能であることが嫌だったので、注意を払い始めました。私は自ら NEPA コードを解読することにしました。

私のノートは私のミニデータベースになりました。私は NEPA の行動パターンを観察し、電源がオフになったときと再びオンになったときを記録しました。 (データ収集)。 私は学校から家に帰ると、すぐに母親か家にいた人に尋ねました。彼らはいつそれを取ったのですか?私は気づいたことを書き留めます - ライトがどのくらいの時間点灯していたのか、何時に点灯し、いつ消えたのか。 それは儀式のようでした。電源の「ステータス更新」を知る必要がありました。

時間が経つにつれて、祝日、お祭りシーズン、気象条件、サッカーの試合などのパターンや外的要因を考慮に入れました。時間はかかりましたが、傾向に気づき始めました。たとえば、大雨が降った場合、電線が「乾燥」するのに時間がかかるため、何時間も照明が点灯しないことはわかっていました。あるいは、ナイジェリアがサッカーの試合をしているとしたら、NEPA が寛大に感じる可能性が高いでしょう。もし私が今 NEPA モデルを構築しているとしたら、国内送電網が崩壊する回数 (隔週のように感じます) など、より複雑な変数を考慮する必要があるでしょう。

これらのパターンを使用して、「メンタルモデル」を作成しました。電力供給は予測不可能でしたが、それでもある程度は予測できました。兄弟や近所の人たちは私を内部情報を持っているかのように扱うようになり、私は「NEPA 予報官」という非公式の称号を獲得しました。光が戻ってくる?」そして私は自信を持って「2 時間待ってください。うまくいきますよ」と答えます。

確かに、データは完璧ではありませんでした。 NEPAは何度か「手を落とした」。電源が復帰すると思っても復帰しなかったり、予期せず電源が落ちてしまうこともありました。しかし、ほとんどの場合、私の予測は驚くほど正確でした。 そこで、これらの矛盾したケースを除外し (データ クリーニング)、パターンを見つけることに重点を置きました。

振り返ってみると、中核となるデータ サイエンス プロセスをずっと適用していたことに気づきました。
データ収集: 電源装置に関する情報を収集しました。いつ、いつ電源が切れたのか、どのくらいの時間電源が残っていたのかを調べました。
データのクリーニングと準備: 無関係な詳細を削除し、気象条件や時刻などの主要な変数に焦点を当てました。
探索的データ分析 (EDA): 電源がどのように機能するかを理解するために、メモのパターンを探しました。
データ モデリング: 特定したパターンに基づいて電力がいつ回復するかを予測する「メンタル モデル」を作成しました。
モデルの評価: 自分の予測を現実に照らしてテストしました。思った通りにライトが点灯しない場合は、モデルを調整しました。
モデルの展開: 私の「モデル」は他の人にも役立つようになりました。私の兄弟や近所の人たちは、私の予測に基づいて意思決定を行っていました。

おかしな話に聞こえるかもしれませんが、NEPA を使ったこの幼少期の実験が、私にとって初めてのデータ サイエンスの体験でした。データ サイエンスは単なる数値、グラフ、アルゴリズムではありません。それは、私が子供の頃に権力予測をしたのと同じように、現実世界の問題を解決することです。確かに、データ サイエンスは複雑な場合もありますが、その核心は構造化された好奇心であり、誰もが内に秘めているものです。そして私にとって、すべては NEPA と 1 冊のノートから始まりました。

私たちは時間をかけて、データ サイエンスのさまざまな概念やプロセスだけでなく、解決できる問題や作成できるソリューションについても探っていきます。データセットを分析する場合でも、生活を改善するための洞察を見つける場合でも、データ サイエンスは、より良い意思決定を行うために誰もが使用できるツールです。

一緒に詳しく見ていきましょう - 一度に 1 つの手がかり、1 つのパターン、1 つの予測について考えてみましょう!

以上が子供の好奇心: データサイエンスの驚くべき基礎の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
LinuxターミナルでPythonバージョンを表示するときに発生する権限の問題を解決する方法は?LinuxターミナルでPythonバージョンを表示するときに発生する権限の問題を解決する方法は?Apr 01, 2025 pm 05:09 PM

LinuxターミナルでPythonバージョンを表示する際の許可の問題の解決策PythonターミナルでPythonバージョンを表示しようとするとき、Pythonを入力してください...

HTMLを解析するために美しいスープを使用するにはどうすればよいですか?HTMLを解析するために美しいスープを使用するにはどうすればよいですか?Mar 10, 2025 pm 06:54 PM

この記事では、Pythonライブラリである美しいスープを使用してHTMLを解析する方法について説明します。 find()、find_all()、select()、およびget_text()などの一般的な方法は、データ抽出、多様なHTML構造とエラーの処理、および代替案(SEL

TensorflowまたはPytorchで深い学習を実行する方法は?TensorflowまたはPytorchで深い学習を実行する方法は?Mar 10, 2025 pm 06:52 PM

この記事では、深い学習のためにTensorflowとPytorchを比較しています。 関連する手順、データの準備、モデルの構築、トレーニング、評価、展開について詳しく説明しています。 特に計算グラップに関して、フレームワーク間の重要な違い

Pythonの数学モジュール:統計Pythonの数学モジュール:統計Mar 09, 2025 am 11:40 AM

Pythonの統計モジュールは、強力なデータ統計分析機能を提供して、生物統計やビジネス分析などのデータの全体的な特性を迅速に理解できるようにします。データポイントを1つずつ見る代わりに、平均や分散などの統計を見て、無視される可能性のある元のデータの傾向と機能を発見し、大きなデータセットをより簡単かつ効果的に比較してください。 このチュートリアルでは、平均を計算し、データセットの分散の程度を測定する方法を説明します。特に明記しない限り、このモジュールのすべての関数は、単に平均を合計するのではなく、平均()関数の計算をサポートします。 浮動小数点数も使用できます。 ランダムをインポートします インポート統計 fractiから

人気のあるPythonライブラリとその用途は何ですか?人気のあるPythonライブラリとその用途は何ですか?Mar 21, 2025 pm 06:46 PM

この記事では、numpy、pandas、matplotlib、scikit-learn、tensorflow、django、flask、and requestsなどの人気のあるPythonライブラリについて説明し、科学的コンピューティング、データ分析、視覚化、機械学習、Web開発、Hの使用について説明します。

Pythonでコマンドラインインターフェイス(CLI)を作成する方法は?Pythonでコマンドラインインターフェイス(CLI)を作成する方法は?Mar 10, 2025 pm 06:48 PM

この記事では、コマンドラインインターフェイス(CLI)の構築に関するPython開発者をガイドします。 Typer、Click、Argparseなどのライブラリを使用して、入力/出力の処理を強調し、CLIの使いやすさを改善するためのユーザーフレンドリーな設計パターンを促進することを詳述しています。

あるデータフレームの列全体を、Python内の異なる構造を持つ別のデータフレームに効率的にコピーする方法は?あるデータフレームの列全体を、Python内の異なる構造を持つ別のデータフレームに効率的にコピーする方法は?Apr 01, 2025 pm 11:15 PM

PythonのPandasライブラリを使用する場合、異なる構造を持つ2つのデータフレーム間で列全体をコピーする方法は一般的な問題です。 2つのデータがあるとします...

Pythonの仮想環境の目的を説明してください。Pythonの仮想環境の目的を説明してください。Mar 19, 2025 pm 02:27 PM

この記事では、Pythonにおける仮想環境の役割について説明し、プロジェクトの依存関係の管理と競合の回避に焦点を当てています。プロジェクト管理の改善と依存関係の問題を減らすための作成、アクティベーション、およびメリットを詳しく説明しています。

See all articles

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

SublimeText3 Mac版

SublimeText3 Mac版

神レベルのコード編集ソフト(SublimeText3)

Dreamweaver Mac版

Dreamweaver Mac版

ビジュアル Web 開発ツール

PhpStorm Mac バージョン

PhpStorm Mac バージョン

最新(2018.2.1)のプロフェッショナル向けPHP統合開発ツール

ZendStudio 13.5.1 Mac

ZendStudio 13.5.1 Mac

強力な PHP 統合開発環境

SublimeText3 中国語版

SublimeText3 中国語版

中国語版、とても使いやすい