엔지니어는 기계 학습 알고리즘의 기능을 이해함으로써 애플리케이션에 효과적인 소프트 센서를 생성할 수 있습니다.
가상 센서라고도 알려진 소프트 센서는 수백 개의 측정 데이터를 종합적으로 처리할 수 있는 소프트웨어입니다. 소프트 센서를 추가하려는 공장 관리자는 소프트 센서와 작동하는 기계 학습의 범위에 혼란을 겪을 수 있습니다. 그러나 주제를 더 깊이 살펴보면 대부분의 소프트 센서 설계에 기본이 되는 몇 가지 핵심 알고리즘이 있음을 알 수 있습니다.
이러한 모델의 선택, 교육 및 구현은 데이터 과학자의 업무인 경우가 많지만, 공장 관리자 및 기타 운영 전문가도 해당 모델의 역량을 익히고 싶어할 것입니다.
소프트 센서는 소프트웨어 환경에서 생성되지만 실제 센서와 동일한 이점을 제공할 수 있습니다. 어떤 경우에는 실제 센서보다 소프트 센서가 더 선호될 수도 있습니다.
운영 전문가와 데이터 과학자가 협력하여 센서를 설계해야 하는 데는 여러 가지 이유가 있습니다. 한 가지 이유는 특정 결과에 필요한 주요 매개변수를 실시간 또는 거의 실시간으로 측정하려는 욕구 때문입니다. 이러한 측정은 전반적인 성능을 향상시키는 데 중요합니다.
소프트 센서의 기타 사용 사례는 다음과 같습니다.
머신러닝 실습에서는 순환 패턴을 따르는 경우가 많습니다. 먼저 데이터를 준비하고 정리합니다. 다음으로, 데이터 과학자는 모델의 기반이 되는 알고리즘을 선택합니다. 그런 다음 데이터 과학자는 처리되지 않거나 전처리된 시계열 및 상황별 데이터를 사용하여 모델 교육을 시작합니다. 마지막으로 모델이 테스트되고 배포됩니다. 그런 다음 다시 순환하여 모델을 개선합니다.
일반적으로 선택할 수 있는 모델에는 두 가지 주요 유형이 있습니다.
이러한 모델 중에서 지도 모델은 소프트 센서를 개발하거나 예측 라벨을 생성하는 데 더 나은 선택입니다. 수백 개의 지도 기계 학습 모델이 있지만 회귀 알고리즘이라는 클래스의 일부 모델만이 소프트 센서를 만드는 데 유용합니다. 다음은 각 모델에 대한 설명입니다.
이는 소프트 센서를 만드는 가장 유용하고 간단한 방법 중 하나입니다. 그러나 중합체 점도 측정과 같은 일부 절차는 선형 회귀 분석에 비해 너무 복잡합니다. 이 알고리즘은 목표 변수의 값을 예측하는 함수를 생성합니다. 하나 이상의 변수 집합을 선형으로 결합한 함수입니다. 하나의 변수를 사용하는 경우를 일변량 선형 회귀라고 합니다. 다중 변수는 다중 선형 회귀라는 이름을 부여합니다. 이 모델을 사용할 때의 이점은 명확성입니다. 어떤 변수가 목표에 가장 큰 영향을 미치는지 쉽게 판단할 수 있습니다. 이를 특성 중요도라고 합니다.
이론적으로 결정 트리에는 데이터를 맞추는 데 필요한 만큼의 규칙과 분기가 있을 수 있습니다. 이들은 일련의 기능이라고 하는 독립 변수의 이러한 규칙을 사용합니다. 결과는 목표 값의 조각별 상수 추정치입니다. 많은 규칙과 분기를 가질 수 있으므로 매우 유연할 수 있습니다.
반면에 데이터를 과적합할 위험도 있습니다. 과적합은 모델을 너무 오랫동안 훈련할 때 발생합니다. 이를 통해 모델은 데이터 세트의 노이즈에 적응하기 시작하고 이를 정상적으로 처리하기 시작할 수 있습니다. 데이터에 과소적합이 발생할 수도 있습니다. 이 경우, 알고리즘은 충분히 오랫동안 훈련되지 않았으므로 독립 변수가 목표 변수와 어떻게 관련될 수 있는지, 또는 독립 변수가 목표 변수에 어떤 영향을 미칠 수 있는지 판단할 만큼 충분한 데이터가 없었습니다.
데이터 과적합과 과소적합 모두 모델 실패의 원인이 됩니다. 모델은 더 이상 새로운 데이터를 처리할 수 없으며 소프트 센서와 함께 사용할 수 없습니다. 데이터 과적합 및 과소적합 개념은 의사결정 트리 모델에만 국한되지 않습니다.
이것은 본질적으로 하나의 모델에 여러 의사결정 트리 모델을 결합한 것입니다. 이는 더 많은 유연성을 제공하고 더 많은 기능을 허용하며 더 큰 예측력을 제공합니다. 그러나 이는 데이터에 과적합될 위험도 높습니다.
기계 학습에서는 Gradient Boosting을 종종 앙상블 모델이라고 합니다. Random Forest와 마찬가지로 Gradient Boosting은 여러 의사결정 트리를 결합합니다. 그러나 이것이 다른 점은 마지막으로 계산된 손실 함수를 최소화하기 위해 각 트리를 최적화한다는 것입니다. 이러한 모델은 매우 효과적일 수 있지만 시간이 지남에 따라 해석하기가 더욱 어려워집니다.
소위 딥러닝은 신경망 회귀 모델의 개념입니다. 이 모델은 입력 변수를 받아들이고 회귀 문제에 적용될 때 목표 변수에 대한 값을 생성합니다. 가장 기본적인 신경망은 다층 퍼셉트론입니다. 이 모델에서는 단일 배열의 뉴런만 사용됩니다. 보다 일반적으로 신경망에는 입력 레이어, 하나 이상의 숨겨진 레이어(각각 많은 뉴런이 있음) 및 값을 얻기 위한 출력 레이어가 있습니다.
히든 레이어의 각 뉴런 내 가중치 입력 값을 합산하여 활성화 함수(예: 시그모이드 함수)를 통해 전달합니다. 이 기능은 모델을 비선형으로 만듭니다. 함수가 모델을 통과하면 단일 뉴런이 포함된 출력 레이어에 도달합니다. 모델을 훈련할 때 특성과 목표 값에 가장 잘 맞는 가중치와 편향을 결정하세요.
디자인을 처음 접하는 사람들이 흔히 오해하는 것은 모든 특정 요구 사항에 맞는 하나의 올바른 모델이 있다는 것입니다. 그러나 실제로는 그렇지 않습니다. 다른 모델보다 하나의 모델을 선택하는 것은 부분적으로 데이터 과학자의 경험을 바탕으로 한 복잡한 결정입니다.
또한 이러한 지도 회귀 모델은 매번 동일한 결과를 생성하지 않습니다. 따라서 "최고의" 모델은 없지만 일부 모델은 특정 상황에 더 적합할 수 있습니다.
기계 학습 활동에서 데이터 과학자와 운영 전문가 간의 협업은 관련 매개 변수, 대상 용도, 개발 및 배포 방법에 대한 상호 이해에서 시작됩니다.
위 내용은 기계 학습 알고리즘을 통해 소프트 센서를 설계하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!