>기술 주변기기 >일체 포함 >파이썬에서 인과 관계 AI를 시작하기 - 코드 예제 및 첫 단계

파이썬에서 인과 관계 AI를 시작하기 - 코드 예제 및 첫 단계

Lisa Kudrow
Lisa Kudrow원래의
2025-03-10 11:05:09304검색
많은 업계 전문가들은 데이터 중심 결정을 내릴 때 일반적인 예측 알고리즘의 신뢰성에 의문을 제기합니다. 초콜릿 소비와 노벨상 수상자 사이의 가짜 상관 관계는 상관 관계와 원인의 중요한 차이점을 강조합니다. 상관 관계가 존재하지만 인과 관계를 자동으로 암시하지는 않습니다. 근본 원인을 이해하고 영향력있는 변화를 위해 데이터 분석을 사용하는 것은 비즈니스에 필수적이며, Microsoft 및 Amazon과 같은 주요 회사는 인과 관계 AI에 많이 투자합니다. 이 튜토리얼은 Python의 Dowhy 라이브러리를 사용하여 기본 인과 관계 AI 개념을 소개합니다. 표준 기계 학습과 다르지만 회귀 분석의 기본 파악이 도움이됩니다. DataCamp의 "파이썬에서 선형 모델링 소개"및 "비즈니스를위한 머신 러닝"과정은 관련 배경을 제공합니다. 인과 관계

인과 추론은 예측 분석과 다른 접근법이 필요합니다. Nancy Cartwright의 "원인은없고, 원인이 없다"는 인과 관계에 대한 인과 적 구조에 대한 가정의 필요성을 강조한다. 순전히 데이터 중심의 접근 방식은 충분하지 않습니다. 인과 관계를 결정하려면 데이터 자체를 넘어서 외부 지식을 요구하는 대안 적 설명을 배제해야합니다. 는 직원 생산성에 대한 새로운 업무 (WFH) 정책의 영향을 고려하십시오. 초기 분석은 WFH 직원에게 더 높은 작업 완료를 보여줄 수 있지만 이것이 인과 적입니까? 직원의 성격이나 가족 상황과 같은 다른 요인은 WFH 선호도와 생산성에 영향을 줄 수 있으며 일반적인 원인으로 작용합니다.

참고 : ausalfolusion.net에 의해 생성 된 그래프 인과 관계 그래프는 이러한 관계를 시각적으로 나타내므로 가정을 명확하게하고 개선을 허용합니다. 이러한 가정은 강력 할 수 있지만 인과 적 그래프의 명백한 특성은 분석 신뢰성을 향상시킵니다. Python의 Dowhy Microsoft의 Dowhy Library (Pywhy Ecosystem의 일부)는 Python의 인과 적 분석을위한 주요 도구입니다. 인과 추론 단계를 설명하기 위해 데이터를 시뮬레이션합니다 dowhy는 표 1에 표시된대로 레이블을 사용합니다 (원래 테이블은 변경되지 않음). 인과 적 그래프는 데이터 매개 변수에 의해 암시 적으로 정의됩니다. Dowhy는 도트 언어를 사용하여 그래프를 나타냅니다 인과 모델은 데이터와 그래프를 결합하여 생성됩니다

인과 분석 및 편향 감소

간단한 선형 회귀는 경사 계수를 보여 주지만 일반적인 원인으로 인해 바이어스 될 수 있습니다. Dowhy의 백도어 기준은 치료와 결과에 영향을 미치는 변수를 제어함으로써이를 해결하는 데 도움이됩니다 (이 예에서 내향 및 어린이 수).
!pip install git+https://github.com/microsoft/dowhy.git
import numpy as np
import pandas as pd
import dowhy
from dowhy import CausalModel
import dowhy.datasets
import statsmodels.api as sm

# Set seed for reproducibility
np.random.seed(1)

# Simulate data
data = dowhy.datasets.linear_dataset(
    beta=1,
    num_common_causes=2,
    num_discrete_common_causes=1,
    num_instruments=1,
    num_samples=10000,
    treatment_is_binary=True)

df = data['df']

# ... (rest of the DoWhy code remains the same) ...
dowhy는 다양한 추정 방법을 제공합니다. 역 확률 가중치는 일반성을 위해 여기에 사용됩니다. 결과 추정치는 근거 진실에 가깝고 편견 감소를 보여줍니다.

스트레스 테스트 및 견고성

Dowhy의 반박 테스트는 가정 신뢰성을 평가하는 데 도움이됩니다. 관찰되지 않은 일반적인 원인을 추가하면 견적 범위에 크게 영향을 미치며 관찰 할 수없는 변수의 영향을 강조합니다. 기기 변수

기구 변수 (WFH에 영향을 미치는 지하철 폐쇄와 같은 생산성에 직접 영향을 미치지는 않음)는 대체 식별 전략을 제공합니다. Dowhy는 적합한 기기를 자동으로 식별하여 잠재적으로 덜 정확하지만 추정치를 더 강력하게 제공합니다.

결론 Getting started with causal AI in Python – code examples and first steps

Dowhy는 인과 관계 AI를 단순화하여 포괄적 인 파이프 라인을 제공합니다. 기본 사항을 마스터 한 후 고급 기술 및 기타 라이브러리를 탐색하십시오. 인과 관계는 적절한 모델과 가정을 정의하기 위해 도메인 전문 지식과 협업이 필요합니다. 이 노력은 정보에 입각 한 비즈니스 결정에 중요한 인과 답변을 얻는 데 가치가 있습니다. DataCamp의 "비즈니스를위한 머신 러닝"과정은 추가 학습 기회를 제공합니다.

위 내용은 파이썬에서 인과 관계 AI를 시작하기 - 코드 예제 및 첫 단계의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.