ホームページ >バックエンド開発 >Python チュートリアル >子供の好奇心: データサイエンスの驚くべき基礎

子供の好奇心: データサイエンスの驚くべき基礎

Mary-Kate Olsen
Mary-Kate Olsenオリジナル
2025-01-04 02:12:39160ブラウズ

The Curiosity of a Child: A Surprising Foundation for Data Science

5 歳児にデータ サイエンスを説明するように頼まれたら、私はおそらく次のように言うでしょう。「それは探偵になったようなものです。手がかり (データ) を収集し、それらがどのように組み合わされるかを把握し (データの分析とクリーンアップ)、それらを使用して謎を解決したり、次に何が起こるかを推測したり (結果を予測) します。」

データサイエンスは、探偵や立派な学位を持った大人だけのものではありません。おそらく、あなたも気づかないうちに、データ サイエンスの原則を日常生活に適用しているはずです。たとえば、私を例に挙げてみましょう。

私は子供の頃、好奇心旺盛で物静かで、考えることをやめない子供でした。表面上は多くを語らなかったが、頭の中ではそれが市場全体だった。私は誰も気づかなかった点と点を結び、よくある「なぜこれはこうなっているのか?」だけではなく、終わりのない質問をしました。しかし、さらに好奇心旺盛な人たちはこう言います。何がそれを可能にするのでしょうか?」大人になった今でも、私には質問しすぎる悪い癖があります。友人に「質問するのは子供みたいだね!」と言われたことがあります。私はそれを褒め言葉として受け取りました。

この好奇心が、子供の頃、特に NEPA (現在の PHCN) のような予測不可能なものに関しては、無意識のうちにデータ サイエンスの原則を受け入れるように導きました。ナイジェリアに住んだことがある方なら、停電が頻繁にあったため、明かりが灯るのがちょっとしたお祝いのように感じられたことをご存知でしょう。私はすべてが予測不可能であることが嫌だったので、注意を払い始めました。私は自ら NEPA コードを解読することにしました。

私のノートは私のミニデータベースになりました。私は NEPA の行動パターンを観察し、電源がオフになったときと再びオンになったときを記録しました。 (データ収集)。 私は学校から家に帰ると、すぐに母親か家にいた人に尋ねました。彼らはいつそれを取ったのですか?私は気づいたことを書き留めます - ライトがどのくらいの時間点灯していたのか、何時に点灯し、いつ消えたのか。 それは儀式のようでした。電源の「ステータス更新」を知る必要がありました。

時間が経つにつれて、祝日、お祭りシーズン、気象条件、サッカーの試合などのパターンや外的要因を考慮に入れました。時間はかかりましたが、傾向に気づき始めました。たとえば、大雨が降った場合、電線が「乾燥」するのに時間がかかるため、何時間も照明が点灯しないことはわかっていました。あるいは、ナイジェリアがサッカーの試合をしているとしたら、NEPA が寛大に感じる可能性が高いでしょう。もし私が今 NEPA モデルを構築しているとしたら、国内送電網が崩壊する回数 (隔週のように感じます) など、より複雑な変数を考慮する必要があるでしょう。

これらのパターンを使用して、「メンタルモデル」を作成しました。電力供給は予測不可能でしたが、それでもある程度は予測できました。兄弟や近所の人たちは私を内部情報を持っているかのように扱うようになり、私は「NEPA 予報官」という非公式の称号を獲得しました。光が戻ってくる?」そして私は自信を持って「2 時間待ってください。うまくいきますよ」と答えます。

確かに、データは完璧ではありませんでした。 NEPAは何度か「手を落とした」。電源が復帰すると思っても復帰しなかったり、予期せず電源が落ちてしまうこともありました。しかし、ほとんどの場合、私の予測は驚くほど正確でした。 そこで、これらの矛盾したケースを除外し (データ クリーニング)、パターンを見つけることに重点を置きました。

振り返ってみると、中核となるデータ サイエンス プロセスをずっと適用していたことに気づきました。
データ収集: 電源装置に関する情報を収集しました。いつ、いつ電源が切れたのか、どのくらいの時間電源が残っていたのかを調べました。
データのクリーニングと準備: 無関係な詳細を削除し、気象条件や時刻などの主要な変数に焦点を当てました。
探索的データ分析 (EDA): 電源がどのように機能するかを理解するために、メモのパターンを探しました。
データ モデリング: 特定したパターンに基づいて電力がいつ回復するかを予測する「メンタル モデル」を作成しました。
モデルの評価: 自分の予測を現実に照らしてテストしました。思った通りにライトが点灯しない場合は、モデルを調整しました。
モデルの展開: 私の「モデル」は他の人にも役立つようになりました。私の兄弟や近所の人たちは、私の予測に基づいて意思決定を行っていました。

おかしな話に聞こえるかもしれませんが、NEPA を使ったこの幼少期の実験が、私にとって初めてのデータ サイエンスの体験でした。データ サイエンスは単なる数値、グラフ、アルゴリズムではありません。それは、私が子供の頃に権力予測をしたのと同じように、現実世界の問題を解決することです。確かに、データ サイエンスは複雑な場合もありますが、その核心は構造化された好奇心であり、誰もが内に秘めているものです。そして私にとって、すべては NEPA と 1 冊のノートから始まりました。

私たちは時間をかけて、データ サイエンスのさまざまな概念やプロセスだけでなく、解決できる問題や作成できるソリューションについても探っていきます。データセットを分析する場合でも、生活を改善するための洞察を見つける場合でも、データ サイエンスは、より良い意思決定を行うために誰もが使用できるツールです。

一緒に詳しく見ていきましょう - 一度に 1 つの手がかり、1 つのパターン、1 つの予測について考えてみましょう!

以上が子供の好奇心: データサイエンスの驚くべき基礎の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。