찾다
기술 주변기기일체 포함Adapter 및 GPT 기반 시계열 다중 작업 통합 대규모 모델

오늘은 장기주기 예측에 사용할 수 있는 어댑터 기반의 범용 시계열 분석 프레임워크를 제안하는 Alibaba Damo Academy의 최신 연구에 대해 이야기하고 싶습니다. 단기 예측, 제로샷, 소수 등 7개 시계열 작업에서 놀라운 결과를 얻었습니다.

Adapter 및 GPT 기반 시계열 다중 작업 통합 대규모 모델

논문 제목: 하나의 크기로 모든 것에 적합: 사전 훈련된 언어 모델과 특별히 설계된 어댑터를 사용한 보편적인 시계열 분석

다운로드 가능한 링크: https://arxiv.org/pdf/2311.14782v1.pdf

1. 배경

시계열 예측 분야에서 대규모 모델을 구축할 때 어려운 점 중 하나는 NLP나 CV 분야처럼 훈련 데이터가 충분하지 않다는 것입니다. 이 기사에서는 NLP 또는 CV 분야에서 훈련된 대규모 모델을 기반으로 어댑터 기술과 결합하여 이를 시계열에 적용하여 다양한 시계열 문제를 해결하는 솔루션을 제안합니다.

NLP의 어댑터는 널리 사용됩니다. CV와 같은 분야, 특히 최근 대형 모델 애플리케이션에서는 대형 모델의 경량 미세 조정을 수행하는 데 어댑터가 사용되는 경우가 많습니다. 어댑터는 경량형 네트워크입니다. 이를 대형 모델의 일부 모듈에 삽입한 다음 대형 모델의 매개변수를 수정하고 어댑터의 매개변수만 업데이트하면 경량형 대형 모델 미세 조정이 가능합니다.

Adapter 및 GPT 기반 시계열 다중 작업 통합 대규모 모델Pictures

이제 Alibaba Damo Academy의 이번 작업에서 어댑터를 사용하여 사전 훈련된 NLP와 CV 모델을 결합하여 통합 시계열 모델을 구축하는 방법을 소개하겠습니다.

2. 전체 구조

본 글에서 제안하는 모델은 Preze 매개변수의 사전 학습된 언어 모델을 기반으로 하며 4가지 유형의 어댑터를 결합하여 구현됩니다. 전체 모델 구조는 아래 그림과 같습니다.

Adapter 및 GPT 기반 시계열 다중 작업 통합 대규모 모델Pictures

먼저 입력 시계열에 대해 정규화를 위해 RevIN 방법을 사용하겠습니다. 이는 각 시계열에서 평균을 빼고 분산으로 나누는 것을 의미합니다. 다음으로 PatchTST 방법을 사용하여 슬라이딩 윈도우를 통해 시계열을 여러 세그먼트로 분할하고 세그먼트 임베딩을 생성합니다. 처리된 시계열은 NLP 분야의 사전 훈련된 언어 모델에 입력됩니다. 전체 학습 과정 동안 언어 모델의 원래 매개변수는 변경되지 않으며 새로 추가된 4가지 유형의 어댑터 매개변수만 업데이트됩니다

3. 어댑터 디자인

이 기사에서는 연결할 수 있는 4가지 유형의 어댑터를 소개합니다. 시계열 적응이라는 목표를 달성하기 위해 CV 분야에서 NLP와 대형 모델의 다양한 위치. 이 네 가지 어댑터는 시간 어댑터, 채널 어댑터, 주파수 어댑터 및 예외 어댑터입니다. 시간 어댑터는 시간 차원 정보를 융합하는 데 사용되는 MLP 네트워크입니다. 본 논문에서는 시간 차원이나 공간 차원의 고차원 정보를 먼저 저차원 공간에 매핑한 후 다시 고차원 공간에 매핑하는 병목 구조를 채택합니다. 그 목적은 시간적 관계를 추출하는 과정에서 과적합의 위험을 피하기 위한 것입니다

채널 어댑터: 채널 어댑터의 구조는 시간적 어댑터와 유사하지만 차이점은 공간 차원에서 수행된다는 점입니다. 다변량 시퀀스의 변수 간의 관계를 추출하는 데 사용됩니다.

pictureAdapter 및 GPT 기반 시계열 다중 작업 통합 대규모 모델 주파수 어댑터는 시계열을 주파수 영역에 매핑합니다. 주파수 영역은 주파수 영역에서 MLP를 수행한 다음 이를 시간 영역으로 다시 매핑하여 주파수 영역과 같은 전역 정보를 추출합니다.

Anomaly Adapter: 이 부분에서는 주로 새로운 시계열 이상 탐지 방법을 구현합니다. 여기서는 Attention Score 행렬을 사용합니다. 정상적인 시퀀스의 경우 Attention Score 행렬은 주기적인 반복 특성을 나타내지만 비정상적인 시퀀스는 그렇지 않습니다. a 가우스 커널은 이상 어댑터 역할을 하며 시계열 이상 탐지를 위해 주의 출력 결과와 계산된 KL 발산을 사용합니다.

사진Adapter 및 GPT 기반 시계열 다중 작업 통합 대규모 모델또한 각 어댑터에 따라 다양한 정도의 영향을 받기 때문에 기사에서는 어댑터를 선택적으로 사용하기 위해 Gated 네트워크를 사용했습니다.

4. 실험 결과

7가지 효과. 본 논문에서 제안한 시계열 통합 대형 모델은 각 작업에서 업계의 다양한 SOTA 모델보다 더 나은 결과를 얻었습니다. 장기 예측 작업을 예로 들면 GPT2+Adaptor 기반의 통합 모델이 가장 잘 수행됩니다

Adapter 및 GPT 기반 시계열 다중 작업 통합 대규모 모델사진

위 내용은 Adapter 및 GPT 기반 시계열 다중 작업 통합 대규모 모델의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명
이 기사는 51CTO.COM에서 복제됩니다. 침해가 있는 경우 admin@php.cn으로 문의하시기 바랍니다. 삭제
신속한 엔지니어링에서 생각의 그래프는 무엇입니까?신속한 엔지니어링에서 생각의 그래프는 무엇입니까?Apr 13, 2025 am 11:53 AM

소개 신속한 엔지니어링에서 "Thought of Thought"는 그래프 이론을 사용하여 AI의 추론 과정을 구성하고 안내하는 새로운 접근법을 나타냅니다. 종종 선형 S와 관련된 전통적인 방법과 달리

Genai 에이전트와 함께 조직의 이메일 마케팅을 최적화하십시오Genai 에이전트와 함께 조직의 이메일 마케팅을 최적화하십시오Apr 13, 2025 am 11:44 AM

소개 축하해요! 당신은 성공적인 사업을 운영합니다. 웹 페이지, 소셜 미디어 캠페인, 웹 세미나, 컨퍼런스, 무료 리소스 및 기타 소스를 통해 매일 5000 개의 이메일 ID를 수집합니다. 다음 명백한 단계는입니다

Apache Pinot을 사용한 실시간 앱 성능 모니터링Apache Pinot을 사용한 실시간 앱 성능 모니터링Apr 13, 2025 am 11:40 AM

소개 오늘날의 빠르게 진행되는 소프트웨어 개발 환경에서 최적의 애플리케이션 성능이 중요합니다. 응답 시간, 오류율 및 자원 활용과 같은 실시간 메트릭 모니터링 메인이 도움이 될 수 있습니다.

Chatgpt가 10 억 명의 사용자를 쳤습니까? Openai CEO는'몇 주 만에 두 배가되었습니다Chatgpt가 10 억 명의 사용자를 쳤습니까? Openai CEO는'몇 주 만에 두 배가되었습니다Apr 13, 2025 am 11:23 AM

"얼마나 많은 사용자가 있습니까?" 그는 자극했다. Altman은“마지막으로 우리가 마지막으로 말한 것은 매주 5 억 명의 행위자이며 매우 빠르게 성장하고 있다고 생각합니다. 앤더슨은 계속해서“당신은 나에게 몇 주 만에 두 배가되었다고 말했습니다. “저는 그 개인이라고 말했습니다

Pixtral -12B : Mistral AI의 첫 번째 멀티 모드 모델 -Anuctics VidhyaPixtral -12B : Mistral AI의 첫 번째 멀티 모드 모델 -Anuctics VidhyaApr 13, 2025 am 11:20 AM

소개 Mistral은 최초의 멀티 모드 모델, 즉 Pixtral-12B-2409를 발표했습니다. 이 모델은 Mistral의 120 억 개의 매개 변수 인 NEMO 12B를 기반으로합니다. 이 모델을 차별화하는 것은 무엇입니까? 이제 이미지와 Tex를 모두 가져갈 수 있습니다

생성 AI 응용 프로그램을위한 에이전트 프레임 워크 - 분석 Vidhya생성 AI 응용 프로그램을위한 에이전트 프레임 워크 - 분석 VidhyaApr 13, 2025 am 11:13 AM

쿼리에 응답 할뿐만 아니라 자율적으로 정보를 모으고, 작업을 실행하며, 여러 유형의 데이터 (텍스트, 이미지 및 코드를 처리하는 AI 구동 조수가 있다고 상상해보십시오. 미래처럼 들리나요? 이것에서

금융 부문에서 생성 AI의 응용금융 부문에서 생성 AI의 응용Apr 13, 2025 am 11:12 AM

소개 금융 산업은 효율적인 거래 및 신용 가용성을 촉진함으로써 경제 성장을 주도하기 때문에 모든 국가 개발의 초석입니다. 거래가 발생하는 용이성 및 신용

온라인 학습 및 수동 공격 알고리즘 안내온라인 학습 및 수동 공격 알고리즘 안내Apr 13, 2025 am 11:09 AM

소개 소셜 미디어, 금융 거래 및 전자 상거래 플랫폼과 같은 소스에서 전례없는 속도로 데이터가 생성되고 있습니다. 이 지속적인 정보 스트림을 처리하는 것은 어려운 일이지만

See all articles

핫 AI 도구

Undresser.AI Undress

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

Clothoff.io

AI 옷 제거제

AI Hentai Generator

AI Hentai Generator

AI Hentai를 무료로 생성하십시오.

인기 기사

R.E.P.O. 에너지 결정과 그들이하는 일 (노란색 크리스탈)
3 몇 주 전By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. 최고의 그래픽 설정
3 몇 주 전By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. 아무도들을 수없는 경우 오디오를 수정하는 방법
3 몇 주 전By尊渡假赌尊渡假赌尊渡假赌
WWE 2K25 : Myrise에서 모든 것을 잠금 해제하는 방법
4 몇 주 전By尊渡假赌尊渡假赌尊渡假赌

뜨거운 도구

Eclipse용 SAP NetWeaver 서버 어댑터

Eclipse용 SAP NetWeaver 서버 어댑터

Eclipse를 SAP NetWeaver 애플리케이션 서버와 통합합니다.

Atom Editor Mac 버전 다운로드

Atom Editor Mac 버전 다운로드

가장 인기 있는 오픈 소스 편집기

ZendStudio 13.5.1 맥

ZendStudio 13.5.1 맥

강력한 PHP 통합 개발 환경

VSCode Windows 64비트 다운로드

VSCode Windows 64비트 다운로드

Microsoft에서 출시한 강력한 무료 IDE 편집기

스튜디오 13.0.1 보내기

스튜디오 13.0.1 보내기

강력한 PHP 통합 개발 환경