>백엔드 개발 >파이썬 튜토리얼 >Plotly 차트를 이미지로 병렬로 변환

Plotly 차트를 이미지로 병렬로 변환

Susan Sarandon
Susan Sarandon원래의
2025-01-04 02:32:39320검색

Converting Plotly charts into images in parallel

제가 일하는 회사에서는 Plotly 차트를 광범위하게 사용하고 있습니다. 이를 통해 보기 좋게 보이는 대화형 그래픽을 쉽게 만들 수 있습니다. Plotly Express 라이브러리를 통한 Python 경험은 훌륭하고 시작 기준도 낮습니다.

Plotly 그래프에는 두 가지 주요 사용 사례가 있습니다.

  • Plotly Dash를 사용한 대화형 대시보드용. Plotly 차트를 Dash에 통합하는 것은 확실히 훌륭합니다.
  • PDF를 렌더링하기 전에 차트를 이미지로 변환하는 PDF 보고서의 경우

일반적인 PDF 보고서의 경우 5~20개의 숫자를 사용하여 시간 경과에 따른 특정 측정항목의 변화, 여러 범주에 대한 특정 값의 분포 또는 서로 인접한 여러 범주의 비교를 표시합니다.

PDF 보고서를 만들기 위해 Weasyprint, Jinja 및 Plotly 차트를 조합하여 사용합니다. 보고서를 PDF로 렌더링하려면 먼저 모든 그래프를 이미지로 렌더링해야 합니다.

Kaleido를 사용한 그래프 렌더링

이를 위해 우리는 훌륭한 Kaleido 패키지를 사용합니다. Chrome 브라우저를 사용하여 그래프를 렌더링하고 이미지로 저장합니다. API는 사용이 간편합니다.

from kaleido.scopes.plotly import PlotlyScope

scope = PlotlyScope()
img_bytes = scope.transform(
    figure=figure, format="png", width=1000, height=1000, scale=4,
)

이렇게 하면 그림의 그림이 높이와 너비가 1000px이고 렌더링 배율이 4인 이미지로 렌더링됩니다(즉, 이미지의 실제 크기는 4000px x 4000px입니다). 배율이 높을수록 최종 이미지의 DPI가 높아져 모양이 더 좋아지고 최종 PDF가 더 커집니다.

많은 그래프 렌더링

그래프를 렌더링하는 데는 약간의 시간이 걸리며 그래프를 많이(10~20개) 렌더링하면 프로그램 런타임에서 상당한 부분을 차지하게 됩니다. PDF 렌더링 파이프라인의 속도를 높이기 위해 다음 솔루션을 배포했습니다.

내부적으로 Kaleido는 그래프를 이미지로 렌더링하는 문제를 포함된 Chrome 웹 브라우저에 아웃소싱합니다. 즉, Python 자체 렌더링의 경우 이 이미지는 기본적으로 I/O를 기다리고 있습니다.

이 특정 프로세스의 속도를 높이고 I/O만 기다리기 때문에 멀티스레딩을 사용할 수 있습니다.

무작위 그래프 만들기

다음과 같이 임의의 그림을 만들어 보겠습니다.

import pandas as pd
import numpy as np
import plotly.graph_objects as go

def get_random_figure() -> go.Figure:
    n_bars = 50
    dates = pd.date_range(start="2021-01-01", end="2021-12-31", freq="M")

    figure = go.Figure()
    for i in range(n_bars):
        values = np.random.rand(len(dates))
        figure.add_trace(go.Bar(x=dates, y=values, name=f"Label {i+1}"))

    figure.update_layout(
        dict(
            barmode="group",
            legend=dict(orientation="h", yanchor="top", xanchor="left"),
        )
    )
    figure.update_layout(yaxis=dict(tickformat=".0%"), xaxis=dict(showgrid=False))
    return figure

이제 위의 코드를 사용하여 그림을 이미지로 변환할 수 있습니다.

from kaleido.scopes.plotly import PlotlyScope
import plotly.graph_objects as go

def figure_to_bytes(figure: go.Figure) -> bytes:
    scope = PlotlyScope()
    return scope.transform(figure=figure, format="png", width=1000, height=1000, scale=4)

마지막으로 나중을 위해 다음을 정의합니다.

def transform_random_figure() -> bytes:
    return figure_to_bytes(get_random_figure())

스레드에서 이미지 변환 실행

Python의 GIL(전역 인터프리터 잠금)로 인해 하나의 스레드만 동시에 Python 코드를 실행할 수 있다는 것을 알 수도 있고 모를 수도 있습니다. 그래프를 이미지로 변환하는 것은 Python 코드가 아니기 때문에 스레드를 사용하여 동시에 많은 그래프 변환을 시작한 다음 결과를 수집할 수 있습니다.

이를 위해 도우미 클래스를 정의합니다.

from kaleido.scopes.plotly import PlotlyScope

scope = PlotlyScope()
img_bytes = scope.transform(
    figure=figure, format="png", width=1000, height=1000, scale=4,
)

이 클래스는 변환 결과(예: 이미지의 바이트)를 검색하는 데 도움이 됩니다.

다음으로 해야 할 일은 Python에서 스레드 작업을 위한 표준 패턴을 따르는 것입니다.

  1. start() 메소드로 시작하려는 스레드를 시작하세요.
  2. join() 메서드를 사용하여 스레드가 결과를 반환할 때까지 기다립니다.

우리 스레드는 각각 변환_무작위_그림()을 호출한 다음 바이트를 반환해야 합니다. 이 경우 10개의 스레드를 시작합니다.

import pandas as pd
import numpy as np
import plotly.graph_objects as go

def get_random_figure() -> go.Figure:
    n_bars = 50
    dates = pd.date_range(start="2021-01-01", end="2021-12-31", freq="M")

    figure = go.Figure()
    for i in range(n_bars):
        values = np.random.rand(len(dates))
        figure.add_trace(go.Bar(x=dates, y=values, name=f"Label {i+1}"))

    figure.update_layout(
        dict(
            barmode="group",
            legend=dict(orientation="h", yanchor="top", xanchor="left"),
        )
    )
    figure.update_layout(yaxis=dict(tickformat=".0%"), xaxis=dict(showgrid=False))
    return figure

start() 메소드는 실제 로직을 시작하는 스레드의 run() 메소드도 호출합니다(즉, 주어진 함수를 실행합니다. 우리의 경우 이는 변환_무작위_그림()을 의미합니다).

결과를 수집하기 위해 스레드의 Join() 메소드를 사용하고 결과를 파일에 씁니다.

from kaleido.scopes.plotly import PlotlyScope
import plotly.graph_objects as go

def figure_to_bytes(figure: go.Figure) -> bytes:
    scope = PlotlyScope()
    return scope.transform(figure=figure, format="png", width=1000, height=1000, scale=4)

작동 원리

여기서 주요 아이디어는 그래프를 이미지로 변환하려고 할 때마다 스레드를 시작하고 이 스레드는 백그라운드에서 그래프가 완료될 때까지 기다리는 것입니다.

전체 보고서를 종합한 후에는 모든 스레드에서 Join()을 호출하고 모든 그래프의 이미지를 검색한 다음 이를 보고서에 넣습니다.

이렇게 하면 이미 그래프 없이 전체 보고서를 생성할 수 있으며 모든 그래프가 자체적으로 변환될 때까지 기다리지 않아도 되므로 시간을 절약할 수 있습니다.

요약

요약하자면, 여러 Plotly 차트를 이미지로 변환하려면 Python 표준 라이브러리의 멀티스레딩 모듈을 사용하여 변환 프로세스 속도를 높이세요.

transform() 호출을 스레드로 이동한 다음 모든 스레드가 완료될 때까지 기다리면 매우 쉽게 수행할 수 있습니다.

부록: 코드

def transform_random_figure() -> bytes:
    return figure_to_bytes(get_random_figure())

위 내용은 Plotly 차트를 이미지로 병렬로 변환의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.