머신러닝과 제한된 최적화를 기반으로 한 디지털 트윈 모델링-일체 포함-php.cn

집

기술 주변기기

일체 포함

머신러닝과 제한된 최적화를 기반으로 한 디지털 트윈 모델링

王林

Apr 18, 2023 am 10:40 AM

기계 학습디지털 트윈데이터 과학

번역가 | Zhu Xianzhong

리뷰어 | Sun Shujuan

소개

요즘에는 디지털 트윈(Digital Twins)을 만드는 데 널리 사용됩니다. 디지털 트윈은 실제 물리적 시스템 또는 프로세스의 디지털 대응물입니다. 입력 동작, 모니터링, 유지 관리, 계획 등을 예측합니다. 인지 고객 서비스 봇과 같은 디지털 트윈은 일상적인 애플리케이션에서 일반적이지만, 이 기사에서는 업계 트윈 데이터 과학 기술에서 두 가지 유형의 디지털 트윈을 설명하여 모델링을 위한 두 가지 유형을 비교할 것입니다.

이 기사에서 논의된 디지털 트윈의 널리 사용되는 두 가지 데이터 과학 영역은 다음과 같습니다.

a) 진단 및 예측 분석: 이 분석 방법에서는 일련의 입력이 주어지면 디지털 트윈이 원인을 진단하거나 예측합니다. 시스템의 향후 동작. IoT 기반 기계 학습 모델은 스마트 머신과 공장을 만드는 데 사용됩니다. 이 모델을 사용하면 센서 입력을 실시간으로 분석하여 향후 문제와 오류가 발생하기 전에 진단, 예측 및 예방할 수 있습니다.

b) 처방적 분석: 이 분석 방법은 일반적으로 준수해야 할 일련의 변수 및 제약 조건을 고려하여 다수의 후보로부터 최상의 솔루션을 결정하기 위해 전체 네트워크를 시뮬레이션합니다. 처리량, 활용도, 생산량 등 명시된 비즈니스 목표를 극대화합니다. 이러한 최적화 문제는 공급망 계획 및 스케줄링 분야에서 널리 사용됩니다. 예를 들어 물류 제공업체가 정시 배송을 극대화하기 위해 자원(차량, 인력)에 대한 일정을 생성하는 경우도 있습니다. 최대 OTIF(On Time In Full) 배송을 달성하기 위해 기계 및 작업자의 사용을 최적화합니다. 여기에 사용된 데이터 과학 기술은 제한된 수학적 최적화, 즉 강력한 솔버를 사용하여 복잡한 의사결정 기반 문제를 해결하는 알고리즘입니다.

요약하자면, ML 모델은 기록 데이터를 기반으로 특정 입력 기능 세트에 대해 가능한 결과를 예측하고, 최적화 모델은 예측된 결과가 발생하는 경우 비즈니스에 맞게 이를 해결/완화/활용할 방법을 결정하는 데 도움이 됩니다. 제한된 자원으로 달성하기 위해 선택할 수 있는 여러 잠재적으로 경쟁하는 목표가 있습니다.

이 두 데이터 과학 분야는 일부 도구(예: Python 라이브러리)를 공유하면서 완전히 다른 기술 세트를 가진 데이터 과학자를 동원합니다. 이들은 종종 비즈니스 문제를 생각하고 모델링하는 다른 방식이 필요합니다. 따라서 한 도메인에 경험이 있는 데이터 과학자가 다른 도메인에 적용할 수 있는 기술과 기술을 이해하고 교차 활용할 수 있도록 관련된 방법을 이해하고 비교해 보겠습니다.

디지털 트윈 모델 적용 사례

비교를 위해 완제품이나 제조 공정에서 발견되는 결함이나 이상 현상을 진단하는 것이 목적인 ML 기반 생산 근본 원인 분석(RCA) 프로세스의 트윈 모델을 고려해 보겠습니다. 원인. 이를 통해 부서 관리자는 도구의 예측을 기반으로 가장 가능성이 높은 근본 원인을 제거하고, 궁극적으로 문제를 식별하고 CAPA(수정 및 예방 조치: 시정 및 예방 조치)를 구현하며, 많은 인력을 들이지 않고도 모든 기계 유지 관리 기록을 신속하게 검색할 수 있습니다. 이력기록, 프로세스 SOP(Standard Operating Procedure: 표준작업절차), IoT 센서 입력 등 목표는 기계 가동 중단 시간과 생산 손실을 최소화하고 자원 활용도를 높이는 것입니다.

기술적으로 이는 다중 클래스 분류 문제로 간주될 수 있습니다. 이 문제에서 특정 결함이 존재한다고 가정하면 모델은 기계 관련, 운영자 관련, 프로세스 지침 관련, 원자재 관련, 또는 다른 것뿐만 아니라 이러한 1차 분류 라벨에 따라 기계 교정, 기계 유지 관리, 운영자 기술, 운영자 교육 등과 같은 세부적인 이유도 포함됩니다. 이 상황에 대한 최적의 솔루션에는 여러 복잡한 ML 모델의 평가가 필요하지만 이 기사의 목적을 강조하기 위해 조금 단순화하겠습니다. 이것이 다항 로지스틱 회귀 문제라고 가정합니다(이유는 다음에서 명확해질 것입니다). 부분).

비교를 위해 생산이나 수익과 같은 목표를 극대화하기 위한 일정을 생성하는 생산 계획 프로세스의 최적화된 트윈 모델을 고려해 보겠습니다. 이러한 자동화된 타임라인은 조직이 시장의 새로운 기회(예: 코로나19로 인한 의약품 수요)에 대응하거나 원자재, 공급업체, 물류 제공업체 및 고객/시장 혼합의 영향을 극대화하기 위해 리소스를 신속하게 조정하는 데 도움이 됩니다. 최근 공급망 병목 현상과 같은 예상치 못한 사건의 영향.

비즈니스 문제를 모델링하기 위한 기본 수준에서 이러한 디지털 트윈을 개발하려면 다음 사항을 고려해야 합니다.

A. 입력 기능 또는 치수

B 입력 데이터 - 이러한 치수의 값

D, 출력 또는 대상

의 변환 규칙을 출력하려면 다음으로 기계 학습(ML) 및 제한된 최적화 모델에서 이러한 요소를 더 심층적으로 분석하고 비교해 보겠습니다.

A. 입력 기능: ML과 최적화 모두에 적합한 시스템의 데이터 차원입니다. 생산 프로세스의 문제를 진단하려는 ML 모델의 경우 고려해야 할 기능에는 IoT 입력, 과거 기계 유지 관리 데이터, 운영자 기술 및 교육 정보, 원자재 품질 정보, SOP(표준 운영 절차) 절차) 및 기타 콘텐츠가 포함될 수 있습니다. .

마찬가지로 제약이 있는 최적화 환경에서 고려해야 할 특성에는 장비 가용성, 작업자 가용성, 원자재 가용성, 작업 시간, 생산성, 기술 등 최적의 생산 계획을 개발하는 데 필요한 일반적인 특성이 포함됩니다.

B. 입력 데이터: 위의 두 가지 방법이 고유값을 상당히 다른 방식으로 사용하는 경우입니다. 그 중 ML 모델은 학습을 위해 많은 양의 과거 데이터가 필요합니다. 그러나 데이터를 모델에 입력하기 전에 데이터 준비, 관리 및 정규화와 관련된 중요한 작업이 필요한 경우가 많습니다. 이력은 실제로 발생한 이벤트(예: 기계 고장이나 작업자의 기술 문제로 인해 출력이 충분하지 않은 경우)에 대한 기록이지만 일반적으로 이러한 가능한 모든 값의 단순한 조합이 아니라는 점에 유의하는 것이 중요합니다. 특성을 얻을 수 있습니다. 즉, 트랜잭션 내역에는 자주 발생하는 시나리오에 대한 더 많은 레코드가 포함되는 반면, 일부 다른 시나리오에 대한 레코드는 상대적으로 적습니다. 거의 발생하지 않는 시나리오의 경우에는 더 적을 수도 있습니다. 모델 학습의 목표는 학습 데이터에 특성 값 또는 특성 값 조합이 거의 없거나 전혀 없는 경우에도 특성과 출력 레이블 간의 관계를 학습하고 정확한 레이블을 예측하는 것입니다.

반면, 최적화 방법의 경우 특성 값은 일반적으로 일자, 배치, 마감일, 날짜별 원자재 가용성, 유지 관리 일정, 기계 전환 시간, 공정 단계, 작업자 기술 등 실제 데이터로 유지됩니다. , 등. ML 모델과의 주요 차이점은 입력 데이터 처리 시 마스터 데이터 특성 값(예: 일수, 기술, 기계, 작업자, 프로세스 유형 등)의 가능한 모든 유효한 조합에 대한 인덱스 테이블을 생성하여 목록을 형성해야 한다는 것입니다. 가능한 솔루션 부분. 예를 들어, 운영자 A는 주의 첫 번째 날에 기계 M1을 사용하여 S1의 기술 수준에서 프로세스의 1단계를 수행하거나, 운영자 B는 두 번째 날에 기계 M1을 사용하여 S2의 기술 수준에서 1단계를 수행합니다. 작업자, 기계, 기술 수준, 날짜 등의 가능한 모든 조합에 대해서도 이러한 조합이 실제로 과거에 발생했는지 여부에 관계없이 가능합니다. 이로 인해 최적화 엔진에 제공되는 매우 큰 입력 데이터 레코드 세트가 생성됩니다. 최적화 모델의 목표는 목적 방정식을 최대화(또는 최소화)하면서 주어진 제약 조건을 준수하는 고유값의 특정 조합을 선택하는 것입니다.

C. 입력에서 출력으로의 변환 규칙: 이 역시 두 방법의 중요한 차이점입니다. ML과 최적화 모델은 모두 고급 수학적 이론을 기반으로 하지만 최적화 방법에서 복잡한 비즈니스 문제의 수학적 모델링과 프로그래밍은 일반적으로 ML에 비해 더 많은 노력이 필요하며 이는 다음 소개에 반영됩니다.

그 이유는 ML에서는 scikit-learn과 같은 오픈 소스 라이브러리, Pytorch나 Tensorflow와 같은 프레임워크, 심지어 클라우드 서비스 제공업체의 ML/딥 러닝 모델의 도움을 받아 입력을 출력으로 변환하는 규칙이 완전히 남아 있기 때문입니다. 여기에는 최적의 규칙(가중치, 편향, 활성화 함수 등)을 도출하기 위해 손실 수정을 수행하는 작업도 포함됩니다. 데이터 과학자의 주요 책임은 입력 기능과 해당 값의 품질과 완전성을 보장하는 것입니다.

최적화 방법의 경우에는 그렇지 않습니다. 입력이 상호 작용하고 출력으로 변환되는 방식에 대한 규칙을 상세한 방정식을 사용하여 작성한 다음 Gurobi, CPLEX 등과 같은 솔버에 제공하여 다음을 찾아야 하기 때문입니다. 최적 또는 실행 가능한 솔루션 계획. 또한 비즈니스 문제를 수학 방정식으로 공식화하려면 모델링 프로세스의 상호 관계에 대한 깊은 이해가 필요하며 데이터 과학자가 비즈니스 분석가와 긴밀히 협력해야 합니다.

아래에서는 문제 RCA(근본 원인 분석) 애플리케이션에 대한 로지스틱 회귀 모델의 도식 다이어그램을 사용하여 이를 설명하겠습니다.

머신러닝과 제한된 최적화를 기반으로 한 디지털 트윈 모델링

로지스틱 회귀 ML 모델

이 경우 입력 데이터를 기반으로 합니다. 결과를 생성하는 규칙(Zᵢ)을 계산하는 작업은 추론할 모델에 맡겨져 있는 반면, 데이터 과학자는 일반적으로 시각적인 방식으로 정확한 예측을 달성하기 위해 잘 정의된 혼동 행렬, RMSE 및 기타 측정 기술을 사용하느라 바쁩니다.

이를 최적화 방법을 통해 생산 계획이 생성되는 방식과 비교할 수 있습니다.

(I) 첫 번째 단계는 계획 프로세스를 요약하는 비즈니스 규칙(제약 조건)을 정의하는 것입니다.

다음은 생산 계획의 예입니다.

먼저 몇 가지 입력 변수를 정의합니다(일부는 목표를 추진하는 데 사용되는 결정 변수일 수 있음).

Bᵦ,_p,ᵢ——제품 p(제품 테이블 내)의 배치 β(배치 테이블 내)가 i번째 날에 예약되었는지 여부를 나타내는 이진 변수입니다.
Oₒ,_p,ᵢ – 인덱스 o(연산자 테이블의)에 있는 연산자가 i일에 제품 p 배치를 처리하도록 예약되어 있는지 여부를 나타내는 이진 변수입니다.
M_m,_p,ᵢ – (기계 테이블에서) 인덱스가 m인 기계가 i일에 제품 p 배치를 처리하도록 예약되어 있는지 여부를 나타내는 이진 변수입니다.

및 일부 계수:

TOₒ, _p – 운영자 o가 제품 p 배치를 처리하는 데 걸리는 시간입니다.
TM_m,_p——m 기계가 제품 p 배치를 처리하는 데 걸리는 시간입니다.
OAvₒ,ᵢ – i일에 운영자 인덱스 o에 사용할 수 있는 시간입니다.
MAv_m,ᵢ——i번째 날에 인덱스가 m인 기계의 사용 가능한 시간입니다.

이 경우 다음을 사용하여 일부 제약 조건(규칙)을 구현할 수 있습니다.

a) 계획에서 특정 배치는 한 번만 시작할 수 있습니다.

각 제품 배치에 대해 Bt는 총 배치 수, Pr은 총 제품 수, D는 계획의 일수입니다.

머신러닝과 제한된 최적화를 기반으로 한 디지털 트윈 모델링

b) 제품은 시작만 가능합니다. 한 명의 작업자 또는 기계에서 하루에 한 번.

각 제품의 각 날짜에 대해 Op는 모든 작업자의 집합이고 Mc는 모든 기계의 집합입니다.

머신러닝과 제한된 최적화를 기반으로 한 디지털 트윈 모델링

c) 배치(모든 제품)에 소요된 총 시간은 다음을 초과해서는 안 됩니다. 그날 작업자 및 기계 가용성 시간.

각 작업자마다 다음과 같은 제약이 있습니다.

머신러닝과 제한된 최적화를 기반으로 한 디지털 트윈 모델링

각 기계의 각 요일마다 다음과 같은 제약이 있습니다.

머신러닝과 제한된 최적화를 기반으로 한 디지털 트윈 모델링

d) 작업자가 일정의 첫 5일 이내에 처리하는 경우 제품 배치, 동일한 제품의 다른 모든 배치는 동일한 운영자에게 할당되어야 합니다. 이를 통해 작업자의 연속성과 생산성이 유지됩니다.

각 연산자와 각 제품에 대해 매일 d(6일차부터)에는 다음과 같은 제약 조건이 있습니다.

머신러닝과 제한된 최적화를 기반으로 한 디지털 트윈 모델링

위는 프로그램에 순서대로 작성해야 하는 수백 가지 제약 조건 중 몇 가지입니다. 실제 생산 스케줄링 시나리오에 대한 비즈니스 규칙은 수학 방정식을 형성합니다. 이러한 제약 조건은 선형 방정식(또는 더 구체적으로 혼합 정수 방정식)이라는 점에 유의하세요. 그러나 이들 모델과 로지스틱 회귀 ML 모델 간의 복잡성 차이는 여전히 매우 분명합니다.

(II) 제약 조건이 결정되면 출력 목표를 정의해야 합니다. 이는 다음 섹션에 설명된 것처럼 중요한 단계이며 복잡한 프로세스가 될 수 있습니다.

(III) 마지막으로 입력된 결정 변수, 제약 조건 및 목표는 솔루션(일정)을 얻기 위해 솔버로 전송됩니다.

최적화 방법을 기반으로 디지털 트윈을 설명하는 도식은 다음과 같습니다.

머신러닝과 제한된 최적화를 기반으로 한 디지털 트윈 모델링

최적화 모델

D, 출력 또는 대상: ML 모델의 경우 문제 유형에 따라(분류, 회귀) , 클러스터링) 정확도를 측정하기 위한 매우 잘 확립된 출력 및 메트릭이 될 수 있습니다. 이 기사에서 이러한 문제를 자세히 다루지는 않겠지만, 이용 가능한 정보가 풍부하기 때문에 다양한 모델의 출력이 주요 CSP(AWS Sagemaker, Azure)와 같은 높은 수준의 자동화를 통해 평가될 수 있다는 점은 주목할 가치가 있습니다. ML 등) .

최적화된 모델이 올바른 출력을 생성하는지 평가하는 것이 더 어렵습니다. 최적화 모델은 "목표"라고 불리는 계산 표현을 최대화하거나 최소화하는 방식으로 작동합니다. 제약 조건과 마찬가지로 목표는 부분적으로 비즈니스가 달성하려는 목표를 기반으로 데이터 과학자가 설계합니다. 보다 구체적으로 이는 최적화 프로그램이 그 합을 최대화하려고 시도하는 결정 변수에 보상 조건과 페널티 조건을 첨부함으로써 달성됩니다. 실제 문제의 경우 때로는 상충되는 목표 사이에서 적절한 균형을 찾기 위해 다양한 목표에 적합한 가중치를 찾는 데 많은 반복이 필요합니다.

위의 생산 일정 예를 더 자세히 설명하기 위해 다음과 같은 두 가지 목표를 설계할 수도 있습니다.

a) 일정은 사전 로드되어야 하며 배치는 가능한 한 빨리 예약되어야 하며 계획의 남은 용량은 다음과 같아야 합니다. 계획이 끝나면. 배치에 1일 페널티를 추가하여 이를 수행할 수 있으며, 이는 일정에서 매일 점차적으로 증가합니다.

머신러닝과 제한된 최적화를 기반으로 한 디지털 트윈 모델링

b) 반면, 배치가 납품 기한을 준수하고 그룹이 기계 용량을 초과하지 않는 한 리소스(작업자 및 기계) 부분이 최적으로 활용되도록 동일한 제품의 배치를 그룹화하려고 합니다. 따라서 일괄 처리가 작은 그룹이 아닌 큰 그룹으로 정렬되는 경우 더 높은 보너스(따라서 아래 표현식에서는 지수)를 제공하는 Batch_group_bonus를 정의합니다. 오늘 시작될 수 있는 일부 배치는 며칠 내에 사용 가능한 더 많은 배치로 시작되어 일정 초기에 일부가 이행되지 않은 상태로 남을 수 있으므로 이는 때때로 이전 목표와 교차할 수 있다는 점에 유의하는 것이 중요합니다.

머신러닝과 제한된 최적화를 기반으로 한 디지털 트윈 모델링

솔버의 작동 방식에 따라 실제 구현 방법에서는 배치 그룹 결정 변수가 필요한 경우가 많습니다. 그러나 이는 다음 개념을 나타냅니다.

솔버는 다음과 같이 목표를 최대화합니다.

Objective = Batch_group_bonus + Day_penalty

목표의 위 두 구성 요소 중 어느 것이 특정 일정 날짜에 더 큰 영향을 미치는지 최대 W₁, W² 가중치와 일정 날짜에 따라 달라지는데, 일정 후반으로 갈수록 날짜 페널티 값이 점차 커지기 때문입니다(i 값이 높을수록). 어느 시점에서 일수 페널티 값이 Batch_group_bonus보다 크면 계획 해결자는 배치를 예약하지 않는 것이 현명하다는 것을 알게 됩니다. 따라서 계획에 리소스 용량이 있더라도 페널티가 0이 발생하므로 예약 및 발생됩니다. 순 마이너스 페널티를 적용하여 목표를 극대화합니다. 이러한 문제는 데이터 과학자가 문제를 해결하고 해결해야 합니다.

ML 방법과 최적화 방법의 상대적 워크로드 비교

위의 논의를 바탕으로 일반적으로 최적화 프로젝트에는 ML 프로젝트보다 더 많은 노력이 필요하다는 것을 추론할 수 있습니다. 최적화에는 개발 프로세스의 거의 모든 단계에서 광범위한 데이터 과학 작업이 필요합니다. 구체적인 요약은 다음과 같습니다.

a) 입력 데이터 처리: ML 및 최적화에서 이는 데이터 과학자가 수행합니다. ML 데이터 처리에는 관련 기능 선택, 표준화, 이산화 등이 필요합니다. 텍스트와 같은 비정형 데이터의 경우 특징 추출, 토큰화 등 NLP 기반 방법이 포함될 수 있습니다. 현재 PCA와 같은 차원 축소 방법은 물론, 특징의 통계적 분석에 사용할 수 있는 다국어 기반의 라이브러리가 있습니다.

최적화에서 모든 비즈니스와 계획에는 모델에 통합되어야 하는 미묘한 차이가 있습니다. 최적화 문제는 과거 데이터를 다루지 않고 가능한 모든 데이터 변경 사항과 식별된 특징을 의사 결정 변수와 제약 조건이 의존해야 하는 인덱스로 결합합니다. ML과 달리 데이터 처리에는 많은 개발 작업이 필요합니다.

b) 모델 개발: 위에서 언급했듯이 최적화 솔루션의 모델 공식화에는 제약 조건과 목표를 공식화하기 위해 데이터 과학자와 비즈니스 분석가의 많은 노력이 필요합니다. 솔버는 수학적 알고리즘을 실행하며 솔루션을 찾기 위해 수백 또는 수천 개의 방정식을 동시에 풀어야 하지만 비즈니스 배경은 없습니다.

ML에서는 모델 훈련이 고도로 자동화되고 알고리즘이 오픈 소스 라이브러리 API로 패키징되거나 클라우드 서비스 제공업체에 의해 패키징됩니다. 비즈니스별 데이터를 기반으로 하는 매우 복잡하고 사전 훈련된 신경망 모델은 훈련 작업을 마지막 몇 계층까지 단순화합니다. AWS Sagemaker Autopilot 또는 Azure AutoML과 같은 도구는 입력 데이터 처리, 기능 선택, 다양한 모델의 훈련 및 평가 및 출력 생성의 전체 프로세스를 자동화할 수도 있습니다.

c) 테스트 및 출력 처리 : ML에서는 최소한의 처리만으로 모델의 출력을 활용할 수 있습니다. 결과의 해석 가능성과 같은 다른 측면을 도입하려면 약간의 노력이 필요할 수 있지만 일반적으로 이해하기 쉽습니다(예: 서로 다른 레이블의 확률). 출력 및 오류 시각화에도 약간의 노력이 필요할 수 있지만 입력 처리에 비하면 그리 많지 않습니다.

여기에서도 최적화 문제에는 진행 상황을 평가하기 위해 숙련된 계획 전문가의 눈으로 반복적인 수동 테스트와 검증이 필요합니다. 솔버는 목표를 최대화하려고 시도하지만, 이는 일정 품질 관점에서 볼 때 그 자체로는 의미가 없는 경우가 많습니다. ML과 달리 임계값 위 또는 아래의 목표 값에 올바른 계획이 포함되어 있거나 잘못된 계획이 포함되어 있다고 말할 수는 없습니다. 일정이 비즈니스 목표와 일치하지 않는 것으로 확인되면 문제는 제약 조건, 의사 결정 변수 또는 목적 기능과 관련될 수 있으므로 크고 복잡한 일정에서 변칙의 원인을 찾기 위해 신중한 분석이 필요합니다.

또한 고려해야 할 사항은 솔버의 출력을 사람이 읽을 수 있는 형식으로 해석하는 데 필요한 개발입니다. 솔버는 배치 그룹 지수, 배치 우선 순위 지수, 운영자 및 기계 지수 등 계획 내 실제 물리적 개체의 지수 값인 입력 결정 변수를 가져와 선택된 값을 반환합니다. 이러한 인덱스 값을 해당 데이터 프레임에서 전문가가 시각적으로 제시하고 분석할 수 있는 일관된 타임라인으로 변환하려면 역처리가 필요합니다.

d) 마지막으로, 운영 단계에서도 ML 모델은 훈련 단계에 비해 관찰 예측을 생성하는 데 훨씬 적은 계산과 시간이 필요합니다. 그러나 일정은 매번 처음부터 작성되며 각 실행에 동일한 리소스가 필요합니다.

아래 그림은 ML 및 최적화 프로젝트의 각 단계에서 상대적인 워크로드를 대략적으로 보여줍니다.

머신러닝과 제한된 최적화를 기반으로 한 디지털 트윈 모델링

ML과 최적화의 상대적 워크로드를 비교하는 개략도

ML과 최적화가 함께 작동할 수 있나요?

머신러닝과 최적화는 기업의 보완적인 문제를 해결하므로 ML 모델의 결과와 최적화는 서로를 강화합니다. IoT 예측 유지 관리 및 오류 감지, AR/VR 원격 유지 관리 및 앞서 언급한 생산 프로세스 RCA와 같은 AI/ML 애플리케이션은 제조업체의 연결된 공장 전략의 일부를 구성합니다.

최적화 애플리케이션은 공급망 계획의 기초를 형성하며 비즈니스 전략을 운영에 연결하는 것으로 생각할 수 있습니다. 이는 조직이 예상치 못한 사건에 대응하고 계획을 세우는 데 도움이 됩니다. 예를 들어, 생산 라인에서 문제가 감지되면 RCA(근본 원인 분석) 도구를 사용하여 생산 라인 관리자가 가능한 원인을 신속하게 파악하고 필요한 조치를 취할 수 있습니다. 그러나 이로 인해 예상치 못한 기계 가동 중단이나 작동 지침 재할당이 발생할 수도 있습니다. 따라서 생산 계획은 사용 가능한 감소된 생산 능력을 사용하여 다시 생성해야 할 수도 있습니다.

ML의 일부 기술을 최적화에 적용할 수 있고 그 반대도 가능합니까?

ML 프로젝트의 경험을 최적화 프로젝트에 적용할 수 있습니다. 예를 들어, 출력 최적화에 중요한 목적 함수의 경우 비즈니스 단위가 수학적 모델링 측면에서 제약 조건만큼 잘 정의되지 않는 경우가 있습니다. 제약 조건은 따라야 하는 규칙이므로 일반적으로 잘 알려져 있습니다. 예를 들어 비즈니스 목표는 다음과 같습니다.

a) 배송 기한을 준수하면서 배치를 가능한 한 빨리 우선순위에 따라 정렬해야 합니다.

b) 일정은 미리 로드되어야 하며, 가능한 한 짧은 간격으로, 낮은 리소스 활용도로 예약되어야 합니다.

c) 용량을 효율적으로 활용하려면 배치를 그룹화해야 합니다.

d) 고부가가치 제품에 대한 기술 수준이 더 높은 작업자에게 이러한 배치를 할당하는 것이 가장 좋습니다.

이러한 목표 중 일부에는 적절한 균형이 필요한 상충되는 우선순위가 있을 수 있습니다. 이로 인해 데이터 과학자는 영향을 미치는 요소(예: 보너스 및 벌칙)의 복잡한 조합을 작성할 때 가장 일반적인 계획에 적용되는 것으로 보이는 내용을 자주 작성하게 됩니다. 시나리오는 시행착오를 통해 수행되지만 버그가 발생할 때 논리를 이해하고 유지하기가 어려울 수 있습니다. 최적화 솔버는 타사 제품을 사용하는 경우가 많기 때문에 디버깅하려는 모델을 구축하는 데이터 과학자가 해당 코드를 사용할 수 없는 경우가 많습니다. 이로 인해 일정 생성 과정의 특정 지점에서 특정 보너스와 벌칙이 어떤 값을 차지했는지 확인할 수 없게 되고, 이러한 값이 제대로 작동하게 만드는 것이므로 설득력 있는 대상 표현을 작성하는 것이 매우 중요합니다.

따라서 위의 접근 방식은 널리 사용되는 ML 관행인 보너스와 벌칙의 표준화를 채택하는 데 도움이 됩니다. 그런 다음 정규화된 값은 구성 매개변수 또는 각 요소의 영향, 서로 간의 관계, 각 요소 내 이전 및 다음 요소의 값을 제어하는 다른 수단을 사용하여 제어된 방식으로 확장될 수 있습니다.

결론

요약하자면, 머신러닝과 제한적 최적화는 모두 조직과 일상생활에서 발생하는 다양한 문제를 해결하기 위한 고급 수학적 방법입니다. 이들은 모두 물리적 장비, 프로세스 또는 네트워크 리소스의 디지털 트윈을 배포하는 데 사용될 수 있습니다. 두 가지 유형의 애플리케이션 모두 유사한 높은 수준의 개발 프로세스를 따르지만 ML 프로젝트는 라이브러리 및 클라우드 기반 알고리즘에서 사용할 수 있는 높은 수준의 자동화를 활용할 수 있는 반면, 최적화에는 복잡한 계획 프로세스를 완전히 구현하기 위해 비즈니스와 데이터 과학자 간의 긴밀한 협력이 필요합니다. 모델링. 일반적으로 최적화 프로젝트에는 더 많은 개발 작업이 필요하고 리소스 집약적입니다. 실제 개발에서 ML과 최적화 도구는 기업에서 함께 작동해야 하는 경우가 많으며 두 기술 모두 데이터 과학자에게 유용합니다.