오늘은 2023.1년 arixv에 올라온 다변량 시계열 예측 글을 소개해드리고자 합니다. 출발점이 꽤 흥미롭습니다. 다변량 시계열의 공정성을 향상시키는 방법입니다. 본 논문에서 사용된 모델링 방법은 시공간 예측, Domain Adaptation 등에서 사용되었던 기존의 연산을 모두 사용하였지만, 다변수 공평성의 점은 비교적 새로운 것이다.
- 논문 제목: 공정성 인식 다변량 시계열 예측을 위한 학습 정보 표현: 그룹 기반 관점
- 다운로드 주소: https://arxiv.org/pdf/2301.11535.pdf
1. 다변수 시계열의 공정성
공정성 문제는 기계 학습 분야의 거시적 개념입니다. 기계 학습의 공정성에 대한 한 가지 이해는 다양한 샘플에 대한 모델 피팅 효과의 일관성입니다. 모델이 일부 표본에서는 잘 수행되고 다른 표본에서는 성능이 좋지 않으면 모델의 공정성이 떨어집니다. 예를 들어, 일반적인 시나리오는 추천 시스템에서 헤드 샘플에 대한 모델의 예측 효과가 꼬리 샘플의 예측 효과보다 더 우수하다는 것입니다. 이는 다양한 샘플에 대한 모델 예측 효과의 불공평성을 반영합니다.
다변량 시계열 예측 문제로 돌아가서, 공정성은 모델이 각 변수에 대해 더 나은 예측 효과를 갖는지 여부를 나타냅니다. 다양한 변수에 대한 모델의 예측 효과가 매우 다른 경우 이 다변량 시계열 예측 모델은 불공평합니다. 예를 들어 아래 그림의 예에서 표의 첫 번째 행은 각 변수에 대한 다양한 모델의 예측 효과에 대한 MAE의 분산입니다. 다양한 모델에는 어느 정도 불공평성이 있음을 알 수 있습니다. 아래 그림의 시퀀스는 예입니다. 일부 시퀀스는 예측이 더 좋고 다른 시퀀스는 예측이 더 나쁩니다.
2. 불공정의 원인과 해결책
불공정은 왜 발생하는 걸까요? 다변량 시계열이든 다른 기계 학습 분야이든, 서로 다른 샘플의 예측 효과가 크게 달라지는 주요 이유 중 하나는 서로 다른 샘플이 서로 다른 특성을 갖고 모델이 훈련 과정에서 특정 샘플의 특성에 의해 지배될 수 있다는 것입니다. , 그 결과 모델은 훈련을 지배하는 샘플에 대해 잘 예측하지만 지배적이지 않은 샘플에 대해서는 예측이 좋지 않습니다.
다변량 시계열에서는 변수마다 순서 패턴이 매우 다를 수 있습니다. 예를 들어, 위에 표시된 예에서 대부분의 시퀀스는 고정되어 있어 모델 훈련 프로세스를 지배합니다. 소수의 시퀀스가 다른 시퀀스와 다른 변동성을 나타내므로 이러한 시퀀스에 대한 모델의 예측 성능이 저하됩니다.
다변량 시계열의 불공평함을 해결하는 방법은 무엇입니까? 한 가지 생각은, 서로 다른 시퀀스의 서로 다른 특성으로 인해 불공정이 발생하므로, 시퀀스 간의 공통점과 차이점을 독립적으로 분해하여 모델링할 수 있다면 위에서 언급한 문제가 완화될 수 있다는 것입니다.
이 기사는 이 아이디어를 기반으로 합니다. 전체 아키텍처는 클러스터링 방법을 사용하여 다변수 시퀀스를 그룹화하고, 추가로 적대적 학습 방법을 사용하여 원래 표현에서 각 그룹을 떼어내는 것입니다. 정보, 공개 정보를 얻으십시오. 위의 과정을 통해 공개 정보와 시퀀스별 정보가 분리되고, 이 두 부분의 정보를 기반으로 최종 예측이 이루어집니다.
3. 구현 세부정보
전체 모델 구조는 주로 다변수 시퀀스 관계 학습, 시공간 관계 네트워크, 시퀀스 클러스터링 및 분해 학습의 4개 모듈로 구성됩니다.
다변수 시퀀스 관계 학습
다변수 시계열의 핵심 포인트 중 하나는 각 시퀀스 간의 관계를 학습하는 것입니다. 이 기사에서는 공간-시간적 방법을 사용하여 이 관계를 학습합니다. 다변량 시계열은 많은 시공간 예측 작업과 달리 다양한 변수 간의 관계를 미리 정의할 수 있으므로 여기서는 인접 행렬의 자동 학습 방법을 사용합니다. 구체적인 계산 논리는 각 변수에 대해 무작위로 초기화된 임베딩을 생성한 다음 임베딩의 내부 곱과 일부 후처리를 사용하여 두 변수 간의 관계를 인접 행렬의 해당 위치에 있는 요소로 계산하는 것입니다.
인접 행렬을 자동으로 학습하는 이 방법은 Connecting the Dots: Multivariate Time Series Forecasting with Graph Neural Networks(KDD 2020), REST: Reciprocal Framework for에 표시된 것처럼 시공간 예측에 매우 일반적으로 사용됩니다. 시공간 결합 예측(WWW 2021) 및 기타 기사에서는 이 방법을 채택했습니다. 관심 있는 학생들은 Planet 기사 KDD2020 클래식 시공간 예측 모델 MTGNN 코드 분석에서 관련 모델의 원리 구현을 자세히 소개했습니다.
공간-시간 관계 네트워크
인접 행렬을 사용하여 기사에서는 그래프 시계열 예측 모델을 사용하여 다변수 시계열을 시공간적으로 인코딩하여 각 변수 시퀀스의 표현을 얻습니다. 구체적인 모델 구조는 DCRNN과 매우 유사하며 GRU를 기반으로 각 단위의 계산에 GCN 모듈이 도입됩니다. 일반 GRU의 각 단위 계산 과정에서 이웃 노드의 벡터가 도입되어 GCN을 수행하여 업데이트된 표현을 얻는 것으로 이해될 수 있습니다. DCRNN의 구현 코드 원리에 대해서는 DCRNN 모델 소스 코드 분석 문서를 참조할 수 있습니다.
Sequence Clustering
각 변수 시계열의 표현을 얻은 후 다음 단계는 이러한 표현을 클러스터링하여 각 변수 시퀀스의 그룹화를 얻은 다음 각 변수 그룹의 고유 정보를 추출하는 것입니다. 이 문서에서는 클러스터링 프로세스를 안내하기 위해 다음 손실 함수를 소개합니다. 여기서 H는 각 변수 시퀀스의 표현을 나타내고 F는 각 변수 시퀀스와 K 범주의 관계를 나타냅니다.
이 손실 함수의 업데이트 프로세스에는 EM 알고리즘의 사용이 필요합니다. 즉, H를 나타내도록 시퀀스를 수정하고 F를 최적화하고 F를 수정하여 H를 최적화합니다. 본 논문에서 채택한 방법은 표현 H를 얻기 위해 여러 라운드의 모델을 훈련시킨 후 SVD를 사용하여 행렬 F를 한 번 업데이트하는 것입니다.
분해 학습
분해 학습 모듈의 핵심은 각 범주 변수의 공개 표현과 비공개 표현을 구별하는 것입니다. 공개 표현은 각 클러스터 변수의 시퀀스가 공유하는 특성을 의미하고 비공개 표현은 각 클러스터 내의 특성. 가변 시퀀스에 고유한 특성입니다. 이 목표를 달성하기 위해 논문에서는 분해 학습과 적대적 학습의 아이디어를 채택하여 각 클러스터의 표현을 원래 시퀀스 표현에서 분리합니다. 클러스터 표현은 각 클래스의 특성을 나타내고, 스트립 표현은 모든 시퀀스의 공통성을 나타냅니다. 이러한 공통 표현을 예측에 사용하면 각 변수를 예측하는 데 공정성을 얻을 수 있습니다.
이 기사에서는 적대 학습 아이디어를 사용하여 공개 표현과 비공개 표현(즉, 클러스터링을 통해 얻은 각 클러스터의 표현) 사이의 L2 거리를 손실 역최적화로 직접 계산하므로 공개 부분 표현과 비공개 표현의 격차는 최대한 넓습니다. 또한, public 표현과 private 표현의 내적을 0에 가깝게 만들기 위해 직교 제약 조건을 추가합니다.
4. 실험 결과
이 기사의 실험은 주로 공정성과 예측 효과의 두 가지 측면에서 비교됩니다. 비교 모델에는 기본 시계열 예측 모델(LSTNet, Informer), 그래프 시계열 예측 모델 등이 포함됩니다. 공정성 측면에서는 다양한 변수에 따른 예측 결과의 분산을 이용하여 비교를 통해 이 방법의 공정성이 다른 모델에 비해 크게 향상되었습니다(아래 표 참조).
이 기사에서 제안한 모델은 기본적으로 SOTA와 동등한 결과를 얻을 수 있습니다.
5. 요약
모델의 공정성을 보장하는 방법은 많은 시나리오에서 직면하는 문제입니다. 머신러닝의 . 본 논문에서는 이러한 차원의 문제를 다변량 시계열 예측에 도입하고 시공간 예측 및 적대적 학습 방법을 사용하여 이를 더 잘 해결합니다.
위 내용은 다변량 시계열의 공정성 문제의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

법률 기술 혁명은 법률 전문가가 AI 솔루션을 적극적으로 수용하도록 추진력을 얻고 있습니다. 수동 저항은 더 이상 경쟁력을 유지하려는 사람들에게는 실행 가능한 옵션이 아닙니다. 기술 채택이 중요한 이유는 무엇입니까? 법률 전문가

많은 사람들은 AI와의 상호 작용이 익명이며 인간의 의사 소통과는 대조적이라고 가정합니다. 그러나 AI는 모든 채팅 중에 사용자를 적극적으로 프로파일 링합니다. 모든 프롬프트, 모든 단어는 분석 및 분류됩니다. AI Revo 의이 중요한 측면을 살펴 보겠습니다

성공적인 인공 지능 전략은 강력한 기업 문화 지원과 분리 될 수 없습니다. Peter Drucker가 말했듯이 비즈니스 운영은 사람들에게 달려 있으며 인공 지능의 성공도 마찬가지입니다. 인공 지능을 적극적으로 수용하는 조직의 경우 AI에 적응하는 기업 문화를 구축하는 것이 중요하며 AI 전략의 성공 또는 실패조차 결정합니다. West Monroe는 최근에 번성하는 AI 친화적 인 기업 문화를 구축하기위한 실용적인 가이드를 발표했으며 다음은 다음과 같습니다. 1. AI의 성공 모델을 명확하게 설명하십시오. 우선, AI가 비즈니스를 강화할 수있는 방법에 대한 명확한 비전이 있어야합니다. 이상적인 AI 운영 문화는 인간과 AI 시스템 간의 작업 프로세스를 자연스럽게 통합 할 수 있습니다. AI는 특정 작업에 능숙하지만 인간은 창의성과 판단에 능숙합니다.

메타 업그레이드 AI 보조 응용 프로그램 및 웨어러블 AI의 시대가오고 있습니다! ChatGpt와 경쟁하도록 설계된이 앱은 텍스트, 음성 상호 작용, 이미지 생성 및 웹 검색과 같은 표준 AI 기능을 제공하지만 이제 지리적 위치 기능을 처음으로 추가했습니다. 이것은 메타 AI가 자신의 위치와 질문에 대답 할 때보고있는 내용을 알고 있음을 의미합니다. 귀하의 관심사, 위치, 프로필 및 활동 정보를 사용하여 이전에는 불가능한 최신 상황 정보를 제공합니다. 이 앱은 또한 실시간 번역을 지원하여 Ray-Ban 안경의 AI 경험을 완전히 바꾸고 유용성을 크게 향상 시켰습니다. 외국 영화에 대한 관세 부과는 미디어와 문화에 대한 권력의 알몸 운동입니다. 구현되면 AI 및 가상 프로덕션으로 가속됩니다.

인공 지능은 사이버 범죄 분야를 혁신하여 새로운 방어 기술을 배우도록 강요하고 있습니다. 사이버 범죄자들은 깊은 위조 및 지능형 사이버 공격과 같은 강력한 인공 지능 기술을 사용하여 전례없는 규모로 사기 및 파괴를 사용하고 있습니다. 글로벌 비즈니스의 87%가 지난해 AI 사이버 범죄를 목표로 한 것으로보고되었습니다. 그렇다면이 현명한 범죄의 물결의 희생자가되는 것을 어떻게 피할 수 있습니까? 개인 및 조직 차원에서 위험을 식별하고 보호 조치를 취하는 방법을 살펴 보겠습니다. 사이버 범죄자가 인공 지능을 사용하는 방법 기술이 발전함에 따라 범죄자들은 개인, 기업 및 정부를 공격 할 수있는 새로운 방법을 지속적으로 찾고 있습니다. 인공 지능의 광범위한 사용은 최신 측면 일 수 있지만 잠재적 인 피해는 전례가 없습니다. 특히 인공 지능

인공 지능 (AI)과 인간 지능 (NI) 사이의 복잡한 관계는 피드백 루프로 가장 잘 이해됩니다. 인간은 AI를 만들어 인간 활동에 의해 생성 된 데이터에 대해 인간 능력을 향상 시키거나 복제합니다. 이 ai

최첨단 AI 모델을 둘러싼 이해의 부족을 강조한 Anthropic의 최근 진술은 전문가들 사이에서 격렬한 논쟁을 불러 일으켰습니다. 이 불투명도는 진정한 기술 위기입니까, 아니면 단순히 더 많은 소프로가는 길에 일시적인 장애물입니까?

인도는 풍부한 언어 태피스트리를 가진 다양한 국가로 지역 간의 원활한 의사 소통을 지속적으로 도전합니다. 그러나 Sarvam의 Bulbul-V2


핫 AI 도구

Undresser.AI Undress
사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover
사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool
무료로 이미지를 벗다

Clothoff.io
AI 옷 제거제

Video Face Swap
완전히 무료인 AI 얼굴 교환 도구를 사용하여 모든 비디오의 얼굴을 쉽게 바꾸세요!

인기 기사

뜨거운 도구

SecList
SecLists는 최고의 보안 테스터의 동반자입니다. 보안 평가 시 자주 사용되는 다양한 유형의 목록을 한 곳에 모아 놓은 것입니다. SecLists는 보안 테스터에게 필요할 수 있는 모든 목록을 편리하게 제공하여 보안 테스트를 더욱 효율적이고 생산적으로 만드는 데 도움이 됩니다. 목록 유형에는 사용자 이름, 비밀번호, URL, 퍼징 페이로드, 민감한 데이터 패턴, 웹 셸 등이 포함됩니다. 테스터는 이 저장소를 새로운 테스트 시스템으로 간단히 가져올 수 있으며 필요한 모든 유형의 목록에 액세스할 수 있습니다.

DVWA
DVWA(Damn Vulnerable Web App)는 매우 취약한 PHP/MySQL 웹 애플리케이션입니다. 주요 목표는 보안 전문가가 법적 환경에서 자신의 기술과 도구를 테스트하고, 웹 개발자가 웹 응용 프로그램 보안 프로세스를 더 잘 이해할 수 있도록 돕고, 교사/학생이 교실 환경 웹 응용 프로그램에서 가르치고 배울 수 있도록 돕는 것입니다. 보안. DVWA의 목표는 다양한 난이도의 간단하고 간단한 인터페이스를 통해 가장 일반적인 웹 취약점 중 일부를 연습하는 것입니다. 이 소프트웨어는

SublimeText3 Mac 버전
신 수준의 코드 편집 소프트웨어(SublimeText3)

SublimeText3 영어 버전
권장 사항: Win 버전, 코드 프롬프트 지원!

SublimeText3 Linux 새 버전
SublimeText3 Linux 최신 버전