>기술 주변기기 >일체 포함 >NIO 딥러닝 알고리즘 실습

NIO 딥러닝 알고리즘 실습

WBOY
WBOY앞으로
2023-05-15 11:07:061550검색

NIO 딥러닝 알고리즘 실습

1. NIO Power 사업배경

1. NIO 에너지 서비스 시스템

NIO Power 사업팀의 목표는 모바일 인터넷 파워업을 기반으로 글로벌 혁신 스마트 에너지 서비스 시스템을 구축하는 것입니다. 해결책은 광범위한 충전 및 교환 시설 네트워크를 보유하고 NIO 클라우드 기술을 사용하여 "충전 가능, 교환 가능 및 업그레이드 가능" 에너지 서비스 시스템을 구축하여 자동차 소유자에게 전체 시나리오 전원 공급 서비스를 제공하는 것입니다.

NIO 딥러닝 알고리즘 실습

2. 장비 운영 및 유지보수 문제

NIO 전력 장비 운영 및 유지보수 서비스에는 주로 NIO 전력 교체 스테이션, NIO 슈퍼 충전 파일, 7KW 가정용 충전 파일 2.0 및 20KW 가정용이 포함됩니다. 고속 충전소 충전 장비 및 기타 장비는 현재 주로 다음과 같은 많은 과제에 직면해 있습니다.

① 장비에 안전 위험이 없는지 확인하세요.

② 사용자 불만: 파워업 경험이 좋지 않습니다.

3 장비 고장으로 인해 충전 및 교체 성공률이 감소합니다.

④ 장비 고장으로 인한 다운타임입니다.

⑤ 운영 및 유지 관리 비용이 높습니다.

2. NIO 전력기기 운영 및 유지보수 솔루션

NIO 딥러닝 알고리즘 실습

회사의 4가지 주요 충방전 장비 유형(파워 스왑 스테이션, 슈퍼 충전 파일, 7KW 가정용 충전 파일, 20KW 가정용 충전 파일) 고속 충전 파일)에는 다수의 센서가 포함되어 있어 센서에서 실시간으로 수집한 데이터를 NIO Energy Cloud로 통합하여 통합 저장 및 관리하고 PHM(Fault Prediction and Health Management) 기반의 예측 유지 관리 기술을 도입합니다. GAN(Generative Adversarial Network), Conceptor(Conceptor Network) 등 일련의 AI 알고리즘을 통해 장비의 이상 감지 상태 및 고장 진단 상태를 파악하고, 장비에 대한 최적의 예측 유지보수 의사결정 솔루션을 제공합니다. 진단 예측 결과에 따라 관련 운영 및 유지보수 작업을 수행합니다. 단일, 실현:

① 장비 보안 위험을 제거합니다.

② 전원 켜짐 경험이 좋지 않다는 사용자 불만을 줄입니다.

③ 충전 및 교환 성공률이 향상됩니다.

④ 장비 고장으로 인한 가동 중단 시간을 줄입니다.

⑤ 운영 및 유지 관리 비용을 절감합니다.

따라서 PHM 기술과 알고리즘의 도입은 회사가 스마트 에너지 서비스 시스템을 개선하고 폐쇄 루프를 형성하는 데 효과적으로 도움이 되어 NIO Power의 서비스 기능을 개선하고 최적화했습니다.

3. PHM 기술이 직면한 과제

최첨단 PHM 기술은 모두 데이터 기반 인공 지능 기술을 기반으로 하며, 수많은 샘플과 라벨을 사용하여 모델을 구축합니다. 모델은 종종 이상적이지만 실제 장면은 이상적이지 않습니다.

NIO 딥러닝 알고리즘 실습

위 그림에서 볼 수 있듯이 실제 장면은 다음과 같은 특징을 갖는 경우가 많습니다.

① 결함 샘플이 거의 없습니다.

② 결함 샘플에 라벨링이 어렵습니다.

이로 인해 이 시나리오에서는 두 가지 유형의 문제가 발생합니다. 하나는 비지도 학습 문제이고 다른 하나는 소규모 샘플 학습 문제입니다.

4. PHM 첨단 기술

실제 시나리오에서 직면하는 이 두 가지 문제에 대응하여 우리는 다음과 같은 PHM 첨단 기술을 제안하고 이를 NIO Power 시나리오에 적용했습니다.

1. GAN(Generative Adversarial Network) 기반 비지도 이상 탐지

(1) GAN 구조

2014년에 제안된 생성적 적대 네트워크는 딥러닝 기반 비지도 학습의 일종입니다. 기술은 주로 생성기와 판별기라는 두 개의 하위 네트워크로 구성됩니다.

NIO 딥러닝 알고리즘 실습

위 그림의 빨간색 G 네트워크는 생성자 네트워크이고 파란색 D 네트워크는 판별자 네트워크입니다.

Generator 네트워크는 난수 분포(예: 가우스 분포)를 입력하고 샘플 관점에서 사용자가 지정한 특정 분포를 출력하며, 난수 분포에서 샘플링된 100개의 데이터 샘플을 입력합니다. G 네트워크, G 네트워크는 이러한 100개의 샘플을 실제 데이터와 동일한 공간에 매핑하여 분포 G(z)를 형성하고 판별기 네트워크를 사용하여 두 분포 G(z)와 실제 데이터 X 간의 차이를 얻습니다. , G 네트워크는 G(z) 분포가 실제 데이터 X 분포에 가까워질 때까지 최적화됩니다. G 네트워크는 이러한 100개의 데이터를 출력하고 특정 분포 G(z)를 형성합니다.

판별기 네트워크 의 핵심은 G(z) 분포와 실제 데이터 x 분포의 대략적인 Jensen-Shanon 발산을 구성하여 생성된 분포와 실제 분포의 차이를 측정하는 것입니다. . 대략적인 Jensen-Shanon 발산은 이항 교차 엔트로피를 기반으로 하는 표준 이진 분류 네트워크를 통해 구현되며 판별자 네트워크 출력은 0에서 1까지의 연속 값입니다. 출력이 1이면 입력 샘플 X가 실제 분포에서 나온 것으로 간주되고, 출력이 0이면 입력 샘플 X가 가짜이고 가짜로 간주됩니다.

GAN 네트워크의 훈련 형태에서 생성자가 생성한 샘플은 실제 샘플의 분포에 가까워지려고 노력하고 판별자는 생성된 샘플을 가짜로 구별하여 생성자에게 제공합니다. 더 정확한 Jensen - Shanon 발산 값의 기울기를 통해 생성기가 더 나은 방향으로 반복할 수 있습니다. 결국 둘은 대립적인 관계를 형성하게 되는데, 생성자는 '필사적으로' 거짓 데이터를 생성하고, 판별자는 '필사적으로' 참과 거짓 입력 데이터를 구별하게 된다. GAN 네트워크는 결국 평형 상태에 도달하게 됩니다. 생성된 데이터 분포 G(z)는 모든 실제 샘플 X의 분포를 완전히 포함합니다.

(2) GAN 손실 함수

GAN 네트워크를 수학적 관점에서 이해하는 것은 손실 함수를 통해 이해할 수 있습니다. 손실 함수는 가치 함수 V(G, D)를 사용하여 주어진 G 네트워크에 대한 공통 최소 최대 최적화를 통해 G 네트워크와 D 네트워크의 매개변수를 동시에 최적화할 수 있으며, 최적화 목표는 표시된 것처럼 가치 함수를 최소화하는 것입니다.

NIO 딥러닝 알고리즘 실습

공식에서 JSD는 손실 함수의 핵심 최적화 용어이며 두 분포 간의 차이를 측정하는 척도입니다. 공식에서 볼 수 있듯이, 이 최적화의 본질은 X와 G(z) 사이의 분포 차이를 최소화하는 것입니다. 분포 차이가 작을수록 G 네트워크가 더 성공적으로 훈련됩니다.

(3) 이상 탐지를 위한 Auto-Encoder Aided GAN (AE-GAN)

GAN 네트워크를 기반으로 장비 운영 데이터의 이상 탐지를 구현하기 위해 Auto-Encoder가 도입되었습니다.

NIO 딥러닝 알고리즘 실습

구체적인 구현 방법은

첫 번째 단계는 GAN 모델을 구축하고 이를 훈련시켜 장비 운영 데이터의 분포를 재구성하는 G 네트워크를 얻는 것입니다.

두 번째 단계는 GAN 네트워크에서 D 네트워크 부분을 폐기하고 G 네트워크 매개변수를 수정한 다음 G 네트워크 앞에 인코더 네트워크를 도입하는 것입니다. 이러한 방식으로 인코더 네트워크와 G 네트워크가 결합됩니다. 표준 자동 인코더 네트워크 세트를 형성합니다. 이 네트워크의 손실 함수는 재구성 오류입니다.

이러한 방식으로 Auto-Encoder 네트워크를 최적화하여 이상 탐지를 완료할 수 있습니다. 그 뒤에 있는 원리는 입력 샘플에 관계없이 Auto-Encoder 네트워크의 출력 샘플이 정상 샘플 내에 있다는 것입니다. 간격. 따라서 입력 샘플이 정상 샘플이면 생성된 샘플과 원본 샘플이 동일한 간격에 있으므로 재구성 오류는 매우 작거나 심지어 0에 가깝습니다. 샘플이 여전히 정상 샘플 간격 내에 있으면 큰 재구성 오류가 발생하므로 재구성 오류를 사용하여 샘플이 정상인지 확인할 수 있습니다.

세 번째 단계는 작은 배치의 정상 샘플을 통해 일련의 재구성 오류 점수를 얻고, 그 최대값을 이상 탐지를 위한 재구성 오류 임계값으로 사용하는 것입니다.

원칙은 2022년 IEEE의 지능형 교통 시스템 거래에 게재된 논문에서 완전히 논의되었습니다. 논문 정보는 다음과 같습니다:

M. , (Conceptor) 소표본 결함 진단

우리가 사용하는 두 번째 유형의 기술은 비지도 RNN의 소표본 결함 진단 기술입니다(명칭: Conceptor Network: Conceptor).

(1) 비지도 RNN

먼저 이 기술의 배경인 비지도 RNN을 소개하겠습니다. 일반 RNN과 비교했을 때, 비지도 RNN의 가장 특별한 점은 네트워크의 입력 레이어 뉴런의 연결 가중치와 히든 레이어의 연결 가중치가 무작위로 초기화되어 전체 학습 및 추론 과정에서 고정된다는 점입니다. 이는 입력 레이어와 은닉 레이어의 가중치 매개변수를 학습할 필요가 없음을 의미합니다. 따라서 일반 RNN 네트워크와 비교하여 은닉 레이어 뉴런을 매우 크게 설정하여 메모리 기간과 메모리 용량을 늘릴 수 있습니다. 네트워크가 매우 크면 입력 시계열의 메모리 기간이 길어집니다. 이 특별한 비지도 RNN의 숨겨진 계층 뉴런을 종종 저장소라고 합니다. NIO 딥러닝 알고리즘 실습

① Reservoir State Update

상태 업데이트 방법은 표준 RNN 업데이트 방법과 동일합니다.

② Conceptor

에 의한 장기 시간 종속성 표현

이 비지도 RNN을 기반으로 비지도 표현 학습 방법을 개발합니다. 구체적으로 가변 길이의 다차원 시계열을 입력하고 Reservoir 방법을 통해 각 시간 단계의 RNN 숨겨진 뉴런 상태를 얻습니다. 위 그림의 하늘색 상자), N×N 차원의 개념 행렬이 얻어집니다. 선형 대수학의 관점에서 이해하면 이 행렬의 의미는 시계열을 처리할 때 각 시간 단계에 대해 시계열 신호가 N차원 공간에 투영된다는 것입니다(N은 숨겨진 뉴런의 규모에 해당함).

N차원 공간에 ti 개의 점이 있는 경우 이렇게 점 구름을 형성합니다. 점 구름 타원체는 N개의 상호 직교로 분해될 수 있습니다. 방향을 구하고, 각 방향의 고유벡터와 고유값을 구합니다. Conceptor의 역할은 고유값과 고유벡터를 캡처하고 이러한 N 고유벡터에 대한 고유값을 정규화하는 것입니다. 이는 시계열에서 캡처된 N 속성(예: 주기성, 추세, 변동성 및 기타)으로 이해될 수 있습니다. 즉, 암시적 특징의 추출과 추출된 모든 특징 정보는 이 N차원 행렬(즉, 상자 부분 위 그림의 오른쪽에 있는 진한 파란색 개념자 행렬)에 유지됩니다.

3 길이가 가변적인 시계열의 유사성 측정

행렬의 기본 특성에 따라 두 시계열의 Conceptor 행렬을 빼고 Frobenius Norm을 추출하여 두 시간의 Conceptor를 구합니다. series Distance; 이 스칼라는 두 시계열 간의 차이를 특성화하는 데 사용할 수 있습니다.

(2) Conceptor 기반 소표본 결함 진단

Conceptor의 위 기능을 기반으로 소표본 결함 진단 분석을 수행할 수 있습니다.

NIO 딥러닝 알고리즘 실습실제 결함 샘플 수가 적은 경우(예: 결함 샘플이 10개 미만인 경우) 해당 시계열은 모두 Conceptor 네트워크에 입력되고 집계되어 해당 시계열이 형성됩니다. 개념 행렬은 이 범주의 결함으로 패턴의 추상 표현과 유사하게 일반 샘플이 일반 개념 행렬로 집계됩니다. 테스트 시 동일한 방법을 사용하여 입력 시계열에서 해당 개념 행렬을 추출하고, 정상 표본과 비정상 표본의 개념 행렬을 비교 분석하여 해당 개념 차이를 계산합니다. 입력 표본과 특정 고장 모드의 개념 행렬 사이의 유사성이 높으면 해당 표본이 해당 고장 모드에 속한다고 간주할 수 있습니다. ㅋㅋㅋ 산업 장비의 성능 저하 수준 추정을 위한 신경망 분류, Expert Systems with Application, Volume 213, Part B, 2023, 118962. 전원 스왑 스테이션에 있는 배터리 구획의 느슨한 체인 모니터링

(1) 배경

전원 교환 스테이션에 있는 배터리함의 체인은 배터리함 호이스트와 협력하여 들어오는 배터리를 충전실로 들어 올려 충전합니다. 체인에 결함이 있는 경우 느슨해지거나 부러질 수 있으며, 이로 인해 배터리가 충전함에 운반되는 동안 끼어 배터리를 충전함에 넣지 못할 수 있습니다. 또한, 체인이 끊어지면 배터리가 떨어져 배터리가 손상되거나 화재 사고까지 발생할 수 있습니다.

따라서 체인의 풀림을 사전에 감지하여 관련 안전사고 발생을 사전에 방지하고 위험을 최소화할 수 있는 모델 구축이 필요합니다.

(2) 문제 설정

NIO 딥러닝 알고리즘 실습

체인 풀림과 직결되는 변수는 주로 진동 관련 신호이지만, 진동 데이터를 수집하고 저장하는 데 드는 비용이 높기 때문에 대부분의 장비에서는 수집하지 않습니다. 진동.

진동 데이터가 누락된 경우 체인 구동 모터의 토크, 위치, 속도 및 기타 신호를 통해 체인의 느슨함을 감지할 수 있습니다.

(3) 산업 메커니즘 분석

아래 그림의 느슨한 체인 데이터와 일반 체인 데이터를 비교하면 배터리실의 느슨한 체인이 토크 신호, 그리고 변동의 진폭은 감쇠 추세를 보여줍니다.

NIO 딥러닝 알고리즘 실습

이 오류의 실제 샘플 수는 20개 미만으로 매우 적습니다. 그러나 이러한 유형의 오류는 매우 중요하므로 예측 모델의 정확도와 재현율이 매우 높습니다.

(4) 체인 풀림 검출 모델 설계

NIO 딥러닝 알고리즘 실습

① 먼저 원본 데이터를 시계열로 나누고, 긴 시계열에 대한 균일 공정의 토크 데이터를 추출합니다.

② 그런 다음 시계열을 분해하고 시계열의 변동 특성만 유지합니다.

③ 시퀀스에 대한 스펙트럼 분석을 추가로 수행하고 최종적으로 스펙트럼 특성을 얻습니다.

오류 발생 시 주파수 대역이 두 개 이상이고 서로 다른 주파수 대역의 진폭은 특정 분포를 따르므로 기존 방법을 사용하면 정확도가 낮고 잘못된 경보가 더 많이 발생합니다. 및 누락 알람. 따라서 결함 모드에서 특정 결함 분포를 보다 정확하게 포착하고 최종적으로 장비 이상 점수를 얻기 위해 AE-GAN 모델이 선택되었습니다.

(5) 체인 풀림 감지 데이터와 알고리즘 간의 상호 작용 프로세스

NIO 딥러닝 알고리즘 실습

풀림 감지 데이터와 알고리즘 간의 상호 작용에는 주로 데이터 웨어하우스, 데이터 레이어, 기능 레이어, 알고리즘의 레이어가 포함됩니다. 레이어와 모델 레이어.

그 중 기능 레이어는 주로 위에서 언급한 기능 엔지니어링과 관련된 알고리즘 모듈입니다. 이 경우 알고리즘 레이어는 알고리즘 레이어의 비정상적인 점수 결과와 데이터 기록을 기반으로 AE-GAN 알고리즘을 사용합니다. 기능 레이어의 기능 테이블, 모델 레이어에서 추가 판단 및 결정이 이루어지며, 최종 출력 작업 주문이 처리를 위해 전문가에게 전송됩니다.

위 프로세스를 기반으로 기존의 전문가 경험 탐지가 AI 알고리즘 탐지로 업그레이드되어 정확도가 30% 이상 향상되었습니다.

2. 과충전 파일건 팁 열화 불량 진단

(1) 산업 메커니즘 분석

먼저, 충전 전류, 전압, 온도 및 기타 충전의 물리적 신호를 기반으로 물리적 모델을 설정합니다. 건 팁의 특성을 얻기 위한 건 온도 상승 계수의 물리량은 추가 결함 진단을 위한 특성 신호로 사용됩니다. 그러나 이러한 종류의 물리학 기반 기능 엔지니어링은 일반적으로 기능 생성을 위해 시간 슬라이딩 창을 사용하고 기능 결과로 인해 새로운 시계열을 얻는 경우가 많습니다.

다음 그림을 예로 들어 보겠습니다. 이 프로젝트는 일반적으로 아래 그림과 유사한 특징적인 시계열을 얻기 위해 기간으로 1주 또는 1개월의 데이터를 선택합니다. 그림에서 볼 수 있듯이 이 시퀀스의 노이즈는 매우 크고 품질이 저하된 샘플과 일반 샘플을 직접 구별하기가 어렵습니다.

NIO 딥러닝 알고리즘 실습

또한 실제 불량 샘플에서는 성능이 저하된 팁 수가 50개 미만인 경우가 많습니다.

위의 두 가지 이유를 바탕으로 수동 경험을 없애고 모델을 통해 저하된 샘플의 시계열 특성을 자동으로 포착하기 위해 Conceptor 모델이 도입되었습니다.

(2) 고장진단 과정

NIO 딥러닝 알고리즘 실습

① 고장 샘플 데이터 수집

  1. 회사에서는 수천 개의 과충전 파일을 생산했는데, 그 중 수십 개의 과충전 파일만이 남아있습니다. 건 팁을 교체한 적이 있습니다.
  2. 건 팁 교체 기록을 기준으로 해당 기간의 결함 샘플 데이터를 모델의 훈련 세트로 일치시킵니다.
  3. 결함 데이터에는 6차원 시계열이 포함되어 있으며 계열 길이가 다릅니다.

② 모델 구성

  1. 이 결함의 물리적 메커니즘은 상대적으로 복잡하므로 사전 지식, 전문가 경험 및 물리적 메커니즘을 기반으로 한 모델링은 상대적으로 구현하기 어렵고 모델을 일반화하기가 어렵습니다. .
  2. 이 글에서 언급한 Conceptor 모델 방법은 순수 데이터 기반 방법을 기반으로 하며, 기존의 물리적 정보 추출 기능을 전혀 도입하지 않아 모델의 복잡성을 크게 줄이고 모델링 효율성을 향상시킬 수 있습니다.
  3. Conceptor 모델 방식을 사용하여 이상 기간의 다차원 시계열 데이터를 모델에 입력하여 해당 개념 표현 행렬을 얻습니다.

a. 50개의 결함 샘플을 입력하면 50개의 개념 표현 행렬을 얻게 됩니다.

b 이 50개의 행렬의 평균을 집계하고 결함 모드의 표현 행렬을 곱합니다. .중심, 결함 모드에서 표현 행렬을 얻습니다.

c. 모델 테스트 단계에서 입력 테스트 데이터에 대한 개념 행렬을 계산하고 이를 결함 모드의 표현 행렬과 비교합니다. 그런 다음 이상 점수를 얻습니다.

3 모델 조기경보

  1. 1) 모델 결과를 바탕으로 미리 구분된 3단계의 알람 룰을 바탕으로 악화 정도에 따른 판단을 거쳐 최종적으로 계층적 조기 경보가 이루어집니다. 경고가 달성되었습니다.

위의 과정을 바탕으로 기존의 메커니즘 모델 탐지 방식을 AI 알고리즘 탐지 방식과 결합한 메커니즘 모델로 업그레이드하여 모델 오경보율을 원본의 1/5로 줄일 수 있습니다.

6. Q&A 세션

Q1: AE-GAN 모델에서 정상 샘플과 비정상 샘플을 어떻게 구별하나요?

A1: 훈련된 AE-GAN 모델의 경우 Auto-Encoder에 샘플을 입력하고 샘플의 재구성 오류를 가져옵니다. 이는 변칙 점수가 지정된 임계값보다 작으면 샘플입니다. 정상으로 간주되고, 비정상 샘플의 경우도 마찬가지입니다. 이 방법을 사용하는 전제는 모든 학습 데이터가 정규 샘플 데이터라는 것입니다.

Q2: GAN 네트워크를 훈련할 때 작은 샘플의 결함 데이터와 일반 데이터를 혼합하여 사용합니까? 두 데이터의 균형을 맞추는 방법은 무엇입니까?

A2: GAN 네트워크를 훈련할 때, 특정 모드의 정상 데이터나 비정상 데이터가 훈련에 사용되지 않으므로 샘플 불균형과 같은 문제가 발생하지 않습니다. 실제 데이터에서 두 가지 유형의 데이터 샘플 사이에 큰 차이가 있는 경우 GAN 네트워크 1은 일반적으로 정상 샘플에 대해 훈련되고 GAN 네트워크 2는 비정상 샘플의 특정 고정 패턴에 대해 훈련됩니다. 테스트 샘플은 두 네트워크의 재구성 오류를 기반으로 테스트됩니다.

Q3: GAN 훈련 중에 모델 붕괴가 발생합니까?

A3: 모드 붕괴는 GAN 모델 훈련에서 직면하게 되는 핵심 문제입니다. 첫째, 모드 붕괴를 이해하고, 둘째, GAN 훈련의 핵심 작업에 집중합니다.

Mode 붕괴는 생성기에 의해 생성된 데이터가 특정 영역에 초점을 맞추기 때문입니다. 그 이유는 GAN 네트워크의 손실 함수 정의가 무시되기 때문입니다. GAN 네트워크 훈련 과정에서 G 네트워크의 손실과 D 네트워크의 손실은 일반적으로 별도로 계산되며 두 네트워크의 결합 손실 함수(즉, 공식의 JSD 손실)는 종종 무시됩니다. 훈련 모드 붕괴가 발생하면 JSD 손실이 수렴되지 않는 경우가 많으므로 훈련 중에 JSD 손실을 시각화하면 모드 붕괴를 효과적으로 방지할 수 있습니다. 이는 또한 최근 개선된 여러 버전의 GAN 모델이 눈에 띄고 더 나은 결과를 얻을 수 있었던 이유이기도 합니다. 또한 표준 GAN 네트워크에 특정 트릭을 도입하면 유사한 효과를 얻을 수 있습니다.

Q4: RNN의 히든 레이어를 무작위로 수정하면 어떤 이점이 있나요?

A4: 양성 샘플과 음성 샘플 사이에 큰 차이가 있는 시나리오의 경우 일반적으로 사용되는 LSTM, RNN, GRNN 및 기타 모델을 사용하면 손실 함수의 비수렴 문제에 자주 직면하게 됩니다. 따라서 이러한 문제를 처리하려는 아이디어는 비지도 학습에서 시작하여 메인 네트워크의 히든 레이어의 가중치를 무작위로 고정하고, 생성된 개념 매트릭스의 특성 구성 요소를 정규화하기 위해 특정 방법을 사용하는 경우가 많습니다. ; 가중치 매개변수가 무작위임에도 불구하고 획득된 표현 구성요소는 시계열의 숨겨진 특성을 반영할 수 있으며, 이는 작은 샘플 장면을 구별하기에 충분합니다. RNN 숨겨진 레이어가 무작위로 고정되어 있다는 장점이 있습니다.

Q5: Conceptor 모델의 네트워크 형태를 소개합니다.

A5: 모델은 아래 사진에 나와 있습니다.

NIO 딥러닝 알고리즘 실습

그 중 Reserve 부분은 기본적으로 일반 RNN 네트워크와 동일하며, 유일한 차이점은 Win 과 W가 랜덤하게 설정된다는 점입니다( 이는 무작위로 한 번만 생성된다는 점에 유의하세요.) 이후 각 시간 단계에서 뉴런의 숨겨진 상태가 계산되고 업데이트되며 해당 개념 행렬이 획득됩니다. 위의 내용은 Conceptor의 전체 버전입니다.

Q6: AE-GAN의 인코더 네트워크 학습 과정은 무엇인가요? 입력과 출력이란 무엇입니까?

A6: 다음 그림은 인코더 네트워크의 학습 과정입니다.

NIO 딥러닝 알고리즘 실습

먼저 표준 GAN을 학습시키고 이를 기반으로 G 네트워크의 숨겨진 레이어의 매개변수를 고정한 다음 G 네트워크 앞에 인코더 네트워크를 삽입합니다. 두 개의 네트워크가 연결되어 자동 인코더 네트워크를 형성합니다. Auto-Encoder 네트워크의 입력은 원본 데이터 샘플이고 출력은 재구성된 데이터 샘플입니다. AE-GAN 네트워크는 재구성된 샘플을 구성하여 비정상적인 데이터를 식별합니다.

Q7: 기사에 설명된 두 가지 방법에 대한 논문 및 관련 오픈 소스 코드가 있나요?

A7: 자세한 내용은 기사의 관련 장을 참조하세요. 코드는 아직 오픈 소스가 아닙니다.

Q8: AE-GAN을 이미지 필드의 이상 탐지에 사용할 수 있나요?

A8: 사용할 수 있습니다. 그러나 일반 신호에 비해 이미지 필드는 더 높은 차원, 더 복잡한 데이터 분포 및 훈련에 필요한 더 많은 양의 데이터를 갖습니다. 따라서 이미지 분류에 사용하고 데이터 샘플이 적으면 모델 효과가 손상되고, 이상 탐지에 사용하면 효과가 여전히 좋습니다.

Q9: 이상 탐지 평가 지표는 무엇인가요? 거짓양성 및 거짓음성, 둘 다 함께 평가됩니다.

A9: 가장 직관적인 평가 지표는 위양성률과 위음성률입니다. 보다 과학적인 지표로는 재현율, 정밀도율, F-점수 등이 있습니다.

Q10: 결함 샘플 특징을 일치시키는 방법은 무엇입니까?

A10: 결함 특성을 얻는 더 직접적이고 빠른 방법이 없다면 일반적으로 순수 데이터 기반 방법을 사용하여 결함 샘플 특징을 마이닝합니다. 일반적으로 딥러닝 네트워크는 결함 특성을 학습하기 위해 구축됩니다. 결함 샘플이며 개념 매트릭스로 특성화됩니다.

Q11: PHM 알고리즘은 모델 선택을 어떻게 수행합니까?

A11: 데이터 특성을 파악하기 위해 일반적으로 비지도 RNN 방법을 사용하는 것은 표본 수가 적다면 이상 탐지 문제에 대한 정규 표본 수가 많은 경우 AE-GAN 네트워크를 사용할 수 있습니다. 그것을 구현하십시오.

Q12: RNN이 출력하는 두 가지 유형의 개념 행렬을 통해 이상 현상을 식별하는 방법은 무엇입니까?

A12: RNN의 개념 행렬 출력은 동일한 상태의 데이터 특성이 유사하므로 입력 시계열의 모든 기능 집합으로 이해될 수 있습니다. 즉, 개념 행렬을 계산하고 이를 가장 높은 개념 중심 행렬과 비교하여 알 수 없는 상태의 입력 시계열에 대해 이러한 유형의 상태에서 개념 중심 행렬을 추상화합니다. 유사성은 입력 데이터에 해당하는 범주입니다.

Q13: AE-GAN 네트워크에서 이상 임계값을 설정하는 방법은 무엇입니까?

A13: 네트워크 훈련을 완료한 후 작은 배치의 정규 샘플 데이터를 사용하여 재구성 오류를 계산하고 최대값을 임계값으로 사용합니다.

Q14: AE-GAN 네트워크의 이상 임계값이 업데이트되나요?

A14: 일반적으로 업데이트되지 않지만 원래 데이터 분포가 변경되면(예: 작동 조건 변경) 임계값을 다시 학습해야 할 수도 있고 전이 학습 관련 방법이 GAN에 도입될 수도 있습니다. 네트워크에서 임계값을 미세 조정합니다.

Q15: GAN은 어떻게 시계열을 훈련하나요?

A15: GAN은 일반적으로 원래 시계열을 학습하지 않지만 원래 시계열을 기반으로 추출된 특징을 학습합니다.

Q16: 기존 GAN과 비교하여 AE-GAN에서 GAN을 도입하는 역할은 무엇인가요? 어떤 개선점을 얻을 수 있나요?

A16: 기존 GAN은 이상 탐지에도 자주 사용됩니다. AE-GAN은 GAN의 원리를 더욱 심층적으로 분석하여 모드 붕괴와 같은 문제를 최대한 방지할 수 있으며, Auto-Encoder의 도입으로 이상 탐지 원리가 정확하게 실행되도록 보장할 수 있습니다. 이를 통해 잘못된 경보 비율을 줄입니다.

Q17: 휴일 동안 충전 파일의 시계열 데이터가 전체적으로 증가합니까? 잘못된 판단을 피하는 방법은 무엇입니까?

A17: 결함 진단 모델은 여러 수준으로 나누어져 있습니다. 모델 계층의 결과는 의사 결정 계층의 기초일 뿐이며 일반적으로 판단을 돕기 위해 다른 비즈니스 논리와 결합됩니다. .

Q18: 모델이 출시된 후 비지도 이상 탐지의 적용 효과를 어떻게 평가하나요?

A18: 일반적으로 이상 징후 탐지 결과를 토대로 기술 전문가를 지정하여 실제 현장에서 확인하게 됩니다.

Q19: 배터리 교환소에서 배터리 이상을 감지하기 위해 기사에 언급된 두 가지 방법을 사용하려고 하시나요?

A19: 관련 시도가 진행 중입니다.

Q20: 시계열 데이터의 길이를 통일하는 방법은 무엇인가요? 0으로 패딩하면 그래디언트가 떨어지지 않습니까?

A20: 기사에 언급된 Conceptor 모델은 모든 길이의 시계열을 처리할 수 있으므로 0을 채울 필요가 없으며 매개변수 "훈련" 프로세스도 방지하므로 이러한 문제를 피할 수 있습니다.

Q21: GAN이 과적합으로 인해 어려움을 겪게 될까요?

A21: 이상 탐지 분야에만 사용된다면 실제로 "과적합"이 많을수록 모델 성능이 더 좋아질 것입니다. 또한 훈련 과정에서 GAN 모델의 G 네트워크에 큰 무작위성이 있기 때문에 일반적으로 과적합이 발생하지 않습니다.

Q22: GAN 모델을 훈련할 때 사용되는 훈련 데이터의 크기는 얼마나 됩니까? 더 나은 결과를 얻기 위한 일반적인 설정은 무엇입니까?

A22: 이러한 유형의 문제는 일반적으로 신경망의 크기, 숨겨진 뉴런의 크기 등에 따라 달라집니다. 일반적으로 말하면, 계층당 100개의 뉴런이 있는 2계층 신경망의 경우 더 나은 결과를 얻으려면 학습 데이터의 양이 숨겨진 계층 차원보다 1~2배 더 커야 합니다. 패턴 붕괴가 발생하지 않도록 하려면 몇 가지 트릭을 사용해야 합니다.

Q23: Conceptor 모델의 최소 단위 숨겨진 매개변수는 전문가의 경험을 바탕으로 설정되어 있나요? 편향은 일반 RNN과 어떻게 비교됩니까? 고장 분석을 위한 라벨 볼륨은 얼마입니까? 비즈니스 가치를 정량화하는 방법은 무엇입니까?

A23: 현재 온라인에 있는 많은 Conceptor 모델은 추가 매개변수 조정 없이 동일한 경험적 매개변수 세트를 사용합니다. 실제 경험에 따르면 관련 매개변수를 10에서 100으로 설정하면 결과에 거의 영향을 미치지 않습니다. . 결함 데이터의 샘플 크기가 작고 결과가 더 정확해지기를 원하는 경우 매개변수를 128, 256 또는 그 이상으로 설정할 수 있으며 그에 따라 계산 비용이 더 높아집니다. 결함 분석을 위한 레이블 수는 일반적으로 1~10개입니다. 비즈니스 가치 정량화는 일반적으로 허위 경보 및 경보 누락으로 측정됩니다. 왜냐하면 허위 경보 및 누락된 경보는 정량적 비즈니스 가치 영향으로 직접 변환될 수 있기 때문입니다.

Q24: 오류 시작 시간과 정밀도 및 재현율을 확인하는 방법은 무엇입니까?

A24: Conceptor 방법은 시간 성장 창을 사용하여 여러 개념 행렬을 형성하는 데 사용할 수 있으며 개념 행렬의 스펙트럼 클러스터링을 사용하여 결함 발생 시간을 결정할 수 있습니다. 자세한 내용은 Conceptor 장의 관련 논문을 참조하세요.

Q25: 다수의 일반 데이터가 동일한 값을 갖나요? 모델이 동일한 샘플을 반복적으로 학습합니까?

A25: 실제 시나리오에서는 장비의 다양한 작동 조건으로 인해 일반 데이터가 크게 달라지는 경우가 많습니다.

Q26: GAN에는 어떤 결함 특성이 적합하고, RNN에는 어떤 결함 특성이 적합한가요?

A26: 일반적으로 말해서 이 두 모델의 구체적인 사용 시나리오를 명확하게 나누기는 어렵습니다. GAN은 특수한 데이터 배포로 이러한 문제를 해결하는 데 더 뛰어나고 분류 네트워크로 특성화하기 어려운 반면, 감독되지 않은 RNN이 더 적합합니다. 작은 샘플 문제를 처리하기 위해.

Q27: 이 글에서 언급된 모델을 '인사 위반 탐지'와 같은 특수한 시나리오에서 사용할 수 있나요?

A27: 도메인별 시나리오의 경우 도메인별 지식을 도입하여 고차 특징을 추출할 수 있다면 일반적으로 감지에 이미지만 사용하고 이미지 샘플 크기가 크고 가능하다면 가능합니다. 정상적인 동작을 나타내면 문제는 이 기사에서 언급된 모델을 사용하여 감지할 수 있는 CV 도메인 분할 장면 감지로 변환될 수 있습니다.

Q28: Conceptor Distance는 유사성 판단인가요? 매개변수로 학습되나요?

A28: 매개변수가 없습니다.

Q29: 각 결함에 대해 모델을 훈련해야 하나요?

A29: 모델 요구 사항, 결함 표본 크기, 분포 복잡성 등을 포함한 특정 시나리오에 따라 다릅니다. 두 결함의 타이밍 파형의 유사성이 매우 높으면 일반적으로 별도의 모델을 학습할 필요가 없습니다. 두 결함 모드의 데이터 형식을 결정하려면 다중 분류 모델만 구축하면 됩니다. 매우 다르기 때문에 GAN 모델을 사용하여 데이터를 정확하게 업데이트할 수 있습니다.

Q30: 모델 훈련 시간과 훈련 비용은 얼마인가요?

A30: Conceptor 모델은 훈련 비용이 매우 낮고 특징을 추출하는 데 사용할 수 있습니다. GAN 모델 훈련 시간은 상대적으로 길지만 일반적인 구조화된 표 형식 데이터의 경우 훈련 시간이 너무 길지 않습니다.

Q31: 모델을 훈련할 때 일반 샘플의 훈련 세트는 어떤 모습인가요? 시계열 슬라이딩 윈도우를 분할할 때 각 시계열 하위 집합에 권장되는 최소 횟수가 있습니까?

A31: 두 모델 모두 양성 및 음성 샘플 수에 대한 요구 사항이 없습니다. 모델 학습 시간을 고려하면 일반적으로 수천 개의 대표 샘플이 학습을 위해 선택됩니다. 일반적으로 타이밍 하위 집합의 횟수에 대한 최소 권장 횟수는 없습니다.

Q32: RNN 네트워크에서 얻은 특징 행렬의 대략적인 크기는 무엇입니까?

A32: 특징 행렬의 차원은 숨겨진 뉴런의 수와 직접적인 관련이 있습니다. N개의 숨겨진 뉴런이 있는 경우 특징 행렬의 차원은 N×N입니다. 모델의 복잡도와 계산 효율성을 고려하면 N은 일반적으로 너무 크게 설정되지 않으며 일반적으로 사용되는 설정값은 32이다.

Q33: GAN의 판별자를 분류자로 사용하면 어떨까요? 판별자는 정상 데이터만 학습하며, 비정상 데이터는 거짓 데이터로 분류됩니다. 이 접근 방식의 단점은 무엇입니까?

A33: GAN의 원리에 따르면 D 네트워크는 정상 샘플과 가짜 샘플을 구별하는 데 사용됩니다. 가짜 샘플이 "완전한 신체" 상태로 훈련되면 정상 샘플에 매우 가까워집니다. 정상 샘플과 비정상 샘플을 구별하기 어렵습니다. AE-GAN 네트워크는 정상 샘플과 비정상 샘플이 어느 정도 차별성을 가지고 있다고 가정하며, 이는 AE-GAN을 사용하는 이론적 기반입니다.

Q34: 소표본 학습 모델은 일반화 능력을 어떻게 보장하나요?

A34: 모델의 일반화 능력은 선험적 가정을 기반으로 해야 합니다. 동일한 유형의 모든 결함은 유사한 데이터 분포를 갖습니다. 유사한 결함 데이터의 분포가 상당히 다른 경우 일반적으로 모델의 일반화 능력을 보장하기 위해 결함 범주를 더 세분화해야 합니다.

Q35: 입력 데이터에 대해 데이터 전처리를 수행하는 방법은 무엇입니까?

A35: 기사에 언급된 두 모델의 경우 데이터를 정규화하기만 하면 됩니다.

Q36: GAN은 격리 포리스트 및 AE와 같은 기존 비지도 방향과 어떻게 비교됩니까?

A36: GAN은 이론의 완성도를 통해 정규 표본 데이터의 분포를 더욱 완벽하게 묘사할 수 있어 더욱 완전한 결정 경계를 구축할 수 있습니다. 그러나 일반 AE, 격리된 숲, One Class SVM과 같은 방법은 이론적 완전성이 없으며 보다 완전한 결정 경계를 구성할 수 없습니다.

Q37: Discriminator가 이후 단계에서 정상 샘플과 가짜 샘플을 거의 구별하지 못한다면, 이때 AE-GAN 부분은 별 의미가 없을 것입니다.

A37: 판별기가 실제로 정상 샘플과 가짜 샘플을 식별할 수 없는 경우, 이상 탐지 단계에서 생성기의 훈련이 매우 성공적이라는 측면에서 볼 수 있습니다. 판별자는 사용되지 않습니다. GAN 네트워크의 생성기는 매우 중요하므로 AE-GAN은 정규화된 AE인 AE의 업그레이드 버전으로 이해될 수 있습니다.

Q38: RNN 대신 Transformer를 사용해 보셨나요?

A38: 작은 샘플과 높은 해석 가능성 요구 사항이 있는 시나리오에서는 아직 그러한 시도가 이루어지지 않았으며 관련 시도는 나중에 이루어질 수 있습니다.

Q39: AE-GAN과 VAE의 차이점은 무엇인가요?

A39: VAE는 이상 탐지에 일반적으로 사용되는 방법이기도 합니다. VAE는 숨겨진 레이어에서 사전 가우스 분포를 사용하고 사전 가우스 분포의 모양을 실제 데이터에 맞게 변경하여 두 분포를 동일하게 만듭니다. 그러나 VAE는 JSD 분기 대신 KL 분기를 손실 함수로 사용하며 KL 분기는 비대칭이므로 복잡한 예에서는 제대로 작동하지 않을 수 있습니다.

Q40: 실험 중에 신호 기능에 심각한 또는 누락된 데이터 노이즈가 있습니까? 기능을 정리하는 더 좋은 방법은 무엇입니까?

A40: 기사에 나온 충전건 케이스는 소음이 심한 케이스입니다. 시계열을 기반으로 한 일부 분해 방법은 시계열의 주기 항목, 추세 항목, 노이즈 항목 등을 분해할 수 있으며, 누락된 특징은 불완전한 데이터 방법을 사용하여 처리할 수 있습니다.

Q41: APA와 같은 강화 전략을 훈련에 추가할 수 있나요?

A41: GAN을 예로 들면, 샘플 향상은 주로 노이즈를 추가하여 수행되며 APA 향상 전략은 사용되지 않습니다.

Q42: 4.1.(3)의 두 번째 단계에서 정규 범위가 큰 간격에 걸쳐 있는 경우 샘플 1, 2, 3이 3개 있으면 샘플 1과 2는 정규 샘플, 샘플 3은 샘플 1과 샘플 2가 정상 범위의 양쪽에 위치하고 샘플 3이 샘플 1과 멀지 않지만 정상 범위를 초과하면 샘플 1과 2 사이의 재구성 오류가 더 커집니다. 샘플 1과 3?

A42: 이 기사에 제공된 참고 자료에는 극단적인 예가 많이 포함되어 있습니다. 예를 들어, 인용한 예는 전형적인 2가우스 공 예입니다. AE-GAN은 이러한 유형의 문제를 해결할 수 있습니다.

위 내용은 NIO 딥러닝 알고리즘 실습의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
이 기사는 51cto.com에서 복제됩니다. 침해가 있는 경우 admin@php.cn으로 문의하시기 바랍니다. 삭제