찾다
백엔드 개발파이썬 튜토리얼어린이의 호기심: 데이터 과학의 놀라운 기초

The Curiosity of a Child: A Surprising Foundation for Data Science

만약 5살 아이에게 데이터 과학을 설명하라고 하면 아마도 이렇게 대답할 것입니다. “마치 탐정이 된 것 같아요! 단서(데이터)를 수집하고, 단서가 어떻게 결합되는지 파악하고(데이터 분석 및 정리), 이를 사용하여 미스터리를 풀거나 다음에 무슨 일이 일어날지 추측합니다(결과 예측).”

데이터 과학은 탐정이나 높은 학위를 가진 성인만을 위한 것이 아닙니다. 아마도 당신은 자신도 모르게 데이터 과학 원리를 일상 생활에 적용했을 것입니다. 저를 예로 들어보겠습니다.

저는 자라면서 생각을 멈추지 않는 호기심 많고 조용한 아이였습니다. 겉으로는 별 말을 하지 않았지만 머릿속으로는 온통 시장이었다. 누구도 눈치 채지 못할 것 같은 점들을 연결하고, “이게 왜 이럴까?”라는 평범한 질문이 아닌 끝없는 질문을 던졌습니다. 하지만 좀 더 호기심이 많은 사람들은 “언제 그런 일이 일어날까요? 무엇이 일어날 수 있습니까?” 어른이 된 지금도 질문을 너무 많이 하는 나쁜 버릇이 있어요. 한 친구가 나에게 “아이처럼 질문하는군요!”라고 말한 적이 있습니다. 칭찬으로 받아들였어요.

어렸을 때 특히 NEPA(현재 PHCN)처럼 예측할 수 없는 것에 관해서는 무의식적으로 데이터 과학 원칙을 받아들이게 된 것은 이러한 호기심 때문이었습니다. 나이지리아에 살아본 적이 있다면 정전이 너무 흔해서 불빛이 들어오는 것이 작은 축하 행사처럼 느껴졌다는 것을 아실 것입니다. 나는 그 모든 것이 예측 불가능하다는 것을 싫어했기 때문에 관심을 갖기 시작했습니다. NEPA 코드를 해독하는 일은 제가 직접 맡았습니다.

내 노트가 나의 미니 데이터베이스가 되었습니다. 나는 NEPA의 행동 패턴을 관찰하고 전원이 꺼질 때와 다시 켜질 때마다 기록했습니다. (데이터 수집). 저는 학교에서 집에 오면 즉시 엄마나 집에 있는 누구에게나 “그들이 조명을 가져왔나요?”라고 물었습니다. 언제 가져갔나요?” 나는 내가 알아차린 것을 기록했습니다. 즉, 빛이 얼마나 오래 머물렀는지, 언제 켜졌는지, 언제 꺼졌는지 기록했습니다. 그것은 마치 의식과 같았습니다. 전원 공급 장치의 "상태 업데이트"를 알아야 했습니다.

시간이 지남에 따라 공휴일, 축제 시즌, 기상 조건, 축구 경기 등 패턴과 외부 요인을 고려했습니다. 시간이 좀 걸렸지만 트렌드를 알아차리기 시작했습니다. 예를 들어, 폭우가 내리면 전선이 "건조"되는 데 시간이 필요하기 때문에 몇 시간 동안 조명을 가져오지 못할 것이라는 것을 알았습니다. 또는 나이지리아가 축구 경기를 한다면 NEPA가 관대하다고 느낄 가능성이 높았습니다. 오늘 NEPA 모델을 구축한다면 국가 전력망이 붕괴되는 횟수(격주로 느껴짐)와 같은 더 복잡한 변수를 고려해야 합니다.

이러한 패턴을 사용하여 '멘탈 모델'을 만들었습니다. 전원 공급 장치는 예측할 수 없었지만 어느 정도 예측할 수 있었습니다. 형제자매와 이웃은 저를 내부 정보를 갖고 있는 것처럼 대하기 시작했고 저는 "NEPA 예보관"이라는 비공식 직함을 얻었습니다. 빛이 돌아오나요?” 그러면 저는 "2시간만 주면 될 거예요."라고 자신있게 대답했습니다.

물론, 데이터가 완벽하지는 않았습니다. NEPA는 여러 번 "내 손을 잡았습니다". 가끔 생각했던 대로 전원이 들어오지 않거나, 갑자기 전원이 꺼지는 경우도 있었습니다. 하지만 대부분의 경우 내 예측은 놀라울 정도로 정확했습니다. 그래서 이러한 불일치 사례를 걸러내고(데이터 클리닝) 패턴을 찾는 데 집중했습니다.

돌이켜보면 핵심 데이터 과학 프로세스를 계속 적용하고 있었다는 것을 깨달았습니다.
데이터 수집: 전원 공급 장치가 언제, 언제, 얼마나 오래 머물렀는지에 대한 정보를 수집했습니다.
데이터 정리 및 준비: 관련 없는 세부 정보를 제거하고 기상 조건이나 시간과 같은 주요 변수에 집중했습니다.
탐색적 데이터 분석(EDA): 전원 공급 장치가 어떻게 작동하는지 이해하기 위해 노트에서 패턴을 찾았습니다.
데이터 모델링: 제가 파악한 패턴을 바탕으로 언제 힘이 돌아올지 예측하는 '멘탈 모델'을 만들었습니다.
모델 평가: 현실과 비교하여 예측을 테스트했습니다. 예상대로 불이 들어오지 않으면 모델을 조정했습니다.
모델 배포: 내 "모델"은 다른 사람들에게 유용해졌습니다. 내 형제자매와 이웃은 내 예측에 의존하여 결정을 내렸습니다.

웃기게 들리겠지만 어린 시절 NEPA를 사용한 이 실험은 제가 처음으로 데이터 과학을 접한 순간이었습니다. 데이터 과학은 단순한 숫자, 차트, 알고리즘 그 이상입니다. 제가 어렸을 때 권력 예측을 했을 때와 마찬가지로 실제 문제를 해결하는 것입니다. 예, 데이터 과학은 복잡할 수 있지만 그 핵심은 구조화된 호기심일 뿐입니다. 즉 우리 모두가 우리 안에 가지고 있는 것입니다. 그리고 저에게는 이 모든 것이 NEPA와 노트북에서 시작되었습니다.

시간이 지남에 따라 데이터 과학의 다양한 개념과 프로세스뿐만 아니라 해결할 수 있는 문제와 만들 수 있는 솔루션도 탐색해 보겠습니다. 데이터 세트를 분석하든, 삶을 개선하기 위한 통찰력을 찾든, 데이터 과학은 우리 모두가 더 나은 결정을 내리는 데 사용할 수 있는 도구입니다.

한 번에 하나의 단서, 하나의 패턴, 하나의 예측을 함께 살펴보세요!

위 내용은 어린이의 호기심: 데이터 과학의 놀라운 기초의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
Linux 터미널에서 Python 버전을 볼 때 발생하는 권한 문제를 해결하는 방법은 무엇입니까?Linux 터미널에서 Python 버전을 볼 때 발생하는 권한 문제를 해결하는 방법은 무엇입니까?Apr 01, 2025 pm 05:09 PM

Linux 터미널에서 Python 버전을 보려고 할 때 Linux 터미널에서 Python 버전을 볼 때 권한 문제에 대한 솔루션 ... Python을 입력하십시오 ...

HTML을 구문 분석하기 위해 아름다운 수프를 어떻게 사용합니까?HTML을 구문 분석하기 위해 아름다운 수프를 어떻게 사용합니까?Mar 10, 2025 pm 06:54 PM

이 기사에서는 HTML을 구문 분석하기 위해 파이썬 라이브러리 인 아름다운 수프를 사용하는 방법을 설명합니다. 데이터 추출, 다양한 HTML 구조 및 오류 처리 및 대안 (SEL과 같은 Find (), find_all (), select () 및 get_text ()와 같은 일반적인 방법을 자세히 설명합니다.

Tensorflow 또는 Pytorch로 딥 러닝을 수행하는 방법은 무엇입니까?Tensorflow 또는 Pytorch로 딥 러닝을 수행하는 방법은 무엇입니까?Mar 10, 2025 pm 06:52 PM

이 기사는 딥 러닝을 위해 텐서 플로와 Pytorch를 비교합니다. 데이터 준비, 모델 구축, 교육, 평가 및 배포와 관련된 단계에 대해 자세히 설명합니다. 프레임 워크, 특히 계산 포도와 관련하여 주요 차이점

Python으로 명령 줄 인터페이스 (CLI)를 만드는 방법은 무엇입니까?Python으로 명령 줄 인터페이스 (CLI)를 만드는 방법은 무엇입니까?Mar 10, 2025 pm 06:48 PM

이 기사는 Python 개발자가 CLIS (Command-Line Interfaces) 구축을 안내합니다. Typer, Click 및 Argparse와 같은 라이브러리를 사용하여 입력/출력 처리를 강조하고 CLI 유용성을 향상시키기 위해 사용자 친화적 인 디자인 패턴을 홍보하는 세부 정보.

한 데이터 프레임의 전체 열을 Python의 다른 구조를 가진 다른 데이터 프레임에 효율적으로 복사하는 방법은 무엇입니까?한 데이터 프레임의 전체 열을 Python의 다른 구조를 가진 다른 데이터 프레임에 효율적으로 복사하는 방법은 무엇입니까?Apr 01, 2025 pm 11:15 PM

Python의 Pandas 라이브러리를 사용할 때는 구조가 다른 두 데이터 프레임 사이에서 전체 열을 복사하는 방법이 일반적인 문제입니다. 두 개의 dats가 있다고 가정 해

인기있는 파이썬 라이브러리와 그 용도는 무엇입니까?인기있는 파이썬 라이브러리와 그 용도는 무엇입니까?Mar 21, 2025 pm 06:46 PM

이 기사는 Numpy, Pandas, Matplotlib, Scikit-Learn, Tensorflow, Django, Flask 및 요청과 같은 인기있는 Python 라이브러리에 대해 설명하고 과학 컴퓨팅, 데이터 분석, 시각화, 기계 학습, 웹 개발 및 H에서의 사용에 대해 자세히 설명합니다.

파이썬에서 가상 환경의 목적을 설명하십시오.파이썬에서 가상 환경의 목적을 설명하십시오.Mar 19, 2025 pm 02:27 PM

이 기사는 프로젝트 종속성 관리 및 충돌을 피하는 데 중점을 둔 Python에서 가상 환경의 역할에 대해 설명합니다. 프로젝트 관리 개선 및 종속성 문제를 줄이는 데있어 생성, 활성화 및 이점을 자세히 설명합니다.

정규 표현이란 무엇입니까?정규 표현이란 무엇입니까?Mar 20, 2025 pm 06:25 PM

정규 표현식은 프로그래밍의 패턴 일치 및 텍스트 조작을위한 강력한 도구이며 다양한 응용 프로그램에서 텍스트 처리의 효율성을 높입니다.

See all articles

핫 AI 도구

Undresser.AI Undress

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

Clothoff.io

AI 옷 제거제

AI Hentai Generator

AI Hentai Generator

AI Hentai를 무료로 생성하십시오.

뜨거운 도구

ZendStudio 13.5.1 맥

ZendStudio 13.5.1 맥

강력한 PHP 통합 개발 환경

에디트플러스 중국어 크랙 버전

에디트플러스 중국어 크랙 버전

작은 크기, 구문 강조, 코드 프롬프트 기능을 지원하지 않음

맨티스BT

맨티스BT

Mantis는 제품 결함 추적을 돕기 위해 설계된 배포하기 쉬운 웹 기반 결함 추적 도구입니다. PHP, MySQL 및 웹 서버가 필요합니다. 데모 및 호스팅 서비스를 확인해 보세요.

SublimeText3 Linux 새 버전

SublimeText3 Linux 새 버전

SublimeText3 Linux 최신 버전

mPDF

mPDF

mPDF는 UTF-8로 인코딩된 HTML에서 PDF 파일을 생성할 수 있는 PHP 라이브러리입니다. 원저자인 Ian Back은 자신의 웹 사이트에서 "즉시" PDF 파일을 출력하고 다양한 언어를 처리하기 위해 mPDF를 작성했습니다. HTML2FPDF와 같은 원본 스크립트보다 유니코드 글꼴을 사용할 때 속도가 느리고 더 큰 파일을 생성하지만 CSS 스타일 등을 지원하고 많은 개선 사항이 있습니다. RTL(아랍어, 히브리어), CJK(중국어, 일본어, 한국어)를 포함한 거의 모든 언어를 지원합니다. 중첩된 블록 수준 요소(예: P, DIV)를 지원합니다.