>백엔드 개발 >파이썬 튜토리얼 >엔드투엔드 분석 솔루션으로서의 Jupyter 노트북

엔드투엔드 분석 솔루션으로서의 Jupyter 노트북

WBOY
WBOY원래의
2024-08-13 06:38:171278검색

소개

일어났어요. 해야 할 일 목록을 보니 팀원의 작업이 있습니다. 그들은 당신이 일종의 분석을 수행하고 보고서를 작성하기를 원합니다. 요청 자체는 상대적으로 복잡합니다. 즉, 문제 설명을 사용하여 요청을 분석하고, 데이터 소스에서 데이터를 가져오고, 탐색하고, 통찰력을 수집한 다음, 발견한 내용을 팀원에게 전달해야 할 수 있습니다.

이 문제를 해결하는 방법은 다음과 같습니다.

  • 작업 추적 플랫폼(예: Trello, Jira)에서 문제 설명 작성
  • SSMS, 파워 쿼리와 같은 인터페이스를 사용하여 데이터 소스(예: SQL 데이터베이스)에서 데이터 가져오기
  • 분석 도구(Python, R, Excel)에서 탐색적 데이터 분석 및 복잡한 변환 수행
  • 통찰력을 파악한 다음 이를 소화 가능한 방식으로 머글에게 제시합니다(Powerpoint 또는 관심이 있는 경우 Tableau 또는 Power BI와 같은 시각화 도구)

데이터 전문가의 일상처럼 들리시나요? 하지만 여러분은 어떤지 모르겠지만 그렇게 많은 도구를 통해 데이터를 이동하는 것은 상당히 혼란스러울 수 있습니다. 이는 매우 비효율적인 작업 흐름을 만듭니다. 하지만 더 좋은 방법이 있다고 말하면 어떨까요? 문제 설명을 준비하고, SQL 쿼리를 작성하고, 분석을 수행하고, 결과를 모두 한곳에서 제시할 수 있다고 생각하시나요? 데이터와 Python으로 작업하는 경우 임시 분석을 위한 탁월한 도구인 Jupyter Notebook에 이미 익숙할 것입니다. Notebook의 대화형 환경에서는 순차적 분석과 스토리텔링이 가능합니다. 그러나 노트북의 아름다움은 IPython과의 결합에만 국한되지 않습니다. Jupyter Notebook은 기본적으로 HTML, CSS 및 JS를 사용하여 구축되었습니다. 이는 이러한 기술을 사용하여 노트북의 기능을 확장할 수 있음을 의미합니다. 이 기사에서는 Jupyter Notebook의 웹 인터페이스와 Python의 풍부한 데이터 라이브러리를 활용하여 엔드투엔드 보고 솔루션을 구축하는 방법을 보여 드리겠습니다.

계속 진행하려면 시스템에 다음 소프트웨어 및/또는 패키지를 설치해야 합니다.

SQL Server: 이는 데이터 추출을 위해 상호 작용할 SQL 언어입니다
Aventure Works 데이터베이스: 이는 데이터를 쿼리할 데이터베이스 모음입니다. AW db는 일반적으로 기본적으로 SQL Server 설치와 함께 제공됩니다. 하지만 그렇지 않은 경우 링크를 클릭하고 SQL Server 설치에 로드하는 방법에 대한 지침을 따르십시오.
Python과 Jupyter: Python과 Jupyter를 동시에 설치하는 가장 쉬운 방법은 아나콘다 배포판을 사용하는 것입니다. 이미 Python이 있지만 Jupyter만 설치하려면 이 링크를 사용하세요.
Python 라이브러리:

  • pyodbc
  • 판다
  • sqlalchemy
  • 음모
  • mlxtend
  • 네트워크x

이제 이 문제를 해결했으니 바로 Jupyter Notebook을 살펴보겠습니다. 아래에서 해당 내용을 찾을 수 있습니다:

주의: 위 삽입은 github 저장소에서 가져온 것이며 여기에서 복제할 수 있습니다. 그러나 github에서 호스팅되기 때문에 모든 JS 상호 작용이 비활성화되어 "토글 버튼"이 렌더링되지 않습니다. 그러나 저장소를 컴퓨터에 복제하고 노트북을 로컬로 실행하면 버튼이 다음과 같이 표시되는 것을 볼 수 있습니다.

Jupyter Notebooks as an End-to-End Analytics Solution

그리고 "토글 버튼"을 클릭하면 입력 셀이 숨겨지고 다음과 같은 내용이 남습니다.

Jupyter Notebooks as an End-to-End Analytics Solution

그리고 그게 다입니다. 요약하자면, 하나의 환경(노트북) 내에서 모든 작업을 수행할 수 있었던 작업은 다음과 같습니다.
  • 문제 설명 정의 및 목표 확장
  • SQL 데이터베이스에서 직접 데이터에 연결하고 쿼리
  • 분석 수행
  • 플롯 시각화
  • 마크다운을 사용하여 섹션, 레이아웃 및 결과의 형식을 지정하여 스토리를 전달하고 기술 지식이 없는 사람도 보고서를 읽을 수 있도록 합니다.
  • 기술적 입력을 숨기고 스토리와 통찰력만 남기는 기능 제공

하나의 환경 내에서 완벽한 엔드투엔드 분석 워크플로우를 제공합니다. 다음 단계는 보고서를 이해관계자와 원활하게 공유할 수 있는 프레임워크, 기술 및/또는 파이프라인을 구축하는 것입니다. 이 글이 충분한 관심을 끌면 다음에 글을 쓰겠습니다. ?

위 내용은 엔드투엔드 분석 솔루션으로서의 Jupyter 노트북의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.