Sur la question de l'équité dans les séries chronologiques multivariées-IA-php.cn

Maison

Périphériques technologiques

Sur la question de l'équité dans les séries chronologiques multivariées

王林

Apr 28, 2023 am 10:07 AM

机器学习序列多元时间

Aujourd'hui, j'aimerais vous présenter un article sur la prédiction de séries chronologiques multivariées publié sur arixv en 2023.1. Le point de départ est assez intéressant : comment améliorer l'équité des séries chronologiques multivariées. Les méthodes de modélisation utilisées dans cet article sont toutes des opérations conventionnelles qui ont été utilisées dans la prédiction spatio-temporelle, l'adaptation de domaine, etc., mais l'enjeu de l'équité multivariable est relativement nouveau.

Sur la question de léquité dans les séries chronologiques multivariées

Titre de l'article : Apprentissage de la représentation informative pour la prévision de séries chronologiques multivariées soucieuse de l'équité : une perspective basée sur un groupe
Adresse de téléchargement : https://arxiv.org/pdf/2301.11535.pdf

1. L'équité des séries chronologiques multivariées

Le problème de l'équité est un concept macro dans le domaine de l'apprentissage automatique. Une compréhension de l'équité dans l'apprentissage automatique est la cohérence de l'effet d'ajustement d'un modèle sur différents échantillons. Si un modèle fonctionne bien sur certains échantillons et mal sur d’autres, alors le modèle est moins juste. Par exemple, un scénario courant est que dans un système de recommandation, l'effet de prédiction du modèle sur les échantillons de tête est meilleur que celui des échantillons de queue, ce qui reflète l'injustice de l'effet de prédiction du modèle sur différents échantillons.

De retour au problème de prédiction de séries chronologiques multivariées, l'équité fait référence à la question de savoir si le modèle a un meilleur effet de prédiction sur chaque variable. Si l’effet de prédiction du modèle sur différentes variables est très différent, alors ce modèle de prévision de séries chronologiques multivariées est injuste. Par exemple, dans l'exemple de la figure ci-dessous, la première ligne du tableau représente la variance du MAE des effets de prédiction de différents modèles sur chaque variable. On peut voir qu'il existe un certain degré d'injustice dans différents modèles. La séquence dans l'image ci-dessous est un exemple. Certaines séquences sont meilleures pour prédire, tandis que d'autres sont moins bonnes.

Sur la question de léquité dans les séries chronologiques multivariées

2. Causes et solutions à l'injustice

Pourquoi l'injustice se produit-elle ? Qu'il s'agisse de séries chronologiques multivariées ou d'autres domaines d'apprentissage automatique, l'une des principales raisons des grandes différences dans les effets de prédiction des différents échantillons est que différents échantillons ont des caractéristiques différentes et que le modèle peut être dominé par les caractéristiques de certains échantillons pendant le processus de formation. , ce qui entraîne que le modèle prédit bien sur les échantillons qui dominent l'entraînement, mais mal sur les échantillons non dominés.

Dans les séries chronologiques multivariées, différentes variables peuvent avoir des modèles de séquence très différents. Par exemple, dans l’exemple ci-dessus, la plupart des séquences sont stationnaires, ce qui domine le processus de formation du modèle. Cependant, un petit nombre de séquences présentent une volatilité différente des autres séquences, ce qui entraîne un mauvais effet de prédiction du modèle sur ces séquences.

Comment résoudre l'injustice dans les séries temporelles multivariées ? Une façon de penser est que, puisque l'injustice est causée par les différentes caractéristiques des différentes séquences, si les points communs entre les séquences et les différences entre les séquences peuvent être décomposés et modélisés indépendamment, les problèmes mentionnés ci-dessus peuvent être atténués.

Cet article est basé sur cette idée. L'architecture globale consiste à utiliser la méthode de clustering pour regrouper des séquences multi-variables et à obtenir les caractéristiques communes de chaque groupe ; informations, obtenir des informations publiques. Grâce au processus ci-dessus, les informations publiques et les informations spécifiques à la séquence sont séparées, et la prédiction finale est effectuée sur la base de ces deux parties d'informations.

Sur la question de léquité dans les séries chronologiques multivariées

3. Détails de mise en œuvre

La structure globale du modèle comprend principalement 4 modules : apprentissage des relations de séquence multivariables, réseau de relations spatio-temporelles, regroupement de séquences et apprentissage par décomposition.

Apprentissage des relations de séquences multivariées

L'un des points clés des séries chronologiques multivariées est d'apprendre la relation entre chaque série. Cet article utilise la méthode spatio-temporelle pour apprendre cette relation. Étant donné que les séries chronologiques multivariées ne sont pas comme de nombreuses tâches de prédiction spatio-temporelle, la relation entre diverses variables peut être définie à l'avance, c'est pourquoi la méthode d'apprentissage automatique de la matrice de contiguïté est utilisée ici. La logique de calcul spécifique consiste à générer une intégration initialisée de manière aléatoire pour chaque variable, puis à utiliser le produit interne de l'intégration et un post-traitement pour calculer la relation entre les deux variables en tant qu'éléments aux positions correspondantes de la matrice de contiguïté. La formule est la suivante :

Sur la question de léquité dans les séries chronologiques multivariées

Cette méthode d'apprentissage automatique des matrices de contiguïté est très couramment utilisée dans la prédiction spatio-temporelle, comme le montre Connecting the Dots: Multivariate Time Series Forecasting with Graph Neural Networks (KDD 2020), REST: Reciprocal Framework for La prévision couplée spatio-temporelle (WWW 2021) et d’autres articles ont adopté cette approche. J'ai présenté en détail le principe de mise en œuvre du modèle concerné dans l'article Planet KDD2020, modèle de prédiction espace-temps classique, analyse du code MTGNN. Les étudiants intéressés peuvent lire plus loin.

Réseau de relations spatio-temporelles

Avec la matrice de contiguïté, l'article utilise un modèle de prédiction de séries chronologiques graphiques pour encoder spatio-temporellement la série temporelle multivariable afin d'obtenir la représentation de chaque séquence variable. La structure spécifique du modèle est très similaire à DCRNN Basé sur GRU, le module GCN est introduit dans le calcul de chaque unité. On peut comprendre que dans le processus de calcul de chaque unité du GRU normal, le vecteur du nœud voisin est introduit pour faire un GCN afin d'obtenir une représentation mise à jour. Concernant le principe du code d'implémentation du DCRNN, vous pouvez vous référer à l'article Analyse du code source du modèle DCRNN.

Regroupement de séquences

Après avoir obtenu la représentation de chaque série temporelle variable, l'étape suivante consiste à regrouper ces représentations pour obtenir le regroupement de chaque séquence variable, puis à extraire les informations uniques de chaque groupe de variables. La fonction de perte suivante est introduite dans cet article pour guider le processus de regroupement, où H représente la représentation de chaque séquence variable et F représente l'affiliation de chaque séquence variable à K catégories.

Sur la question de léquité dans les séries chronologiques multivariées

Le processus de mise à jour de cette fonction de perte nécessite l'utilisation de l'algorithme EM, c'est-à-dire la fixation de la séquence pour représenter H, l'optimisation de F, et la fixation de F, l'optimisation de H. La méthode adoptée dans cet article consiste à utiliser SVD pour mettre à jour la matrice F une fois après avoir entraîné plusieurs séries de modèles pour obtenir la représentation H.

Apprentissage de la décomposition

Le cœur du module d'apprentissage de la décomposition est de distinguer la représentation publique et la représentation privée de chaque variable de catégorie. La représentation publique fait référence aux caractéristiques partagées par la séquence de variables dans chaque cluster, et la représentation privée fait référence aux caractéristiques partagées par la séquence de variables dans chaque cluster. les caractéristiques au sein de chaque cluster. Caractéristiques propres aux séquences variables. Afin d'atteindre cet objectif, l'article adopte les idées d'apprentissage par décomposition et d'apprentissage contradictoire pour séparer la représentation de chaque cluster de la représentation séquentielle originale. La représentation en cluster représente les caractéristiques de chaque classe et la représentation supprimée représente le point commun de toutes les séquences. L'utilisation de cette représentation commune pour la prédiction peut garantir l'équité dans la prédiction de chaque variable.

L'article utilise l'idée del'apprentissage contradictoire pour calculer directement la distance L2 entre la représentation publique et la représentation privée (c'est-à-dire la représentation de chaque cluster obtenue par clustering), comme une optimisation inverse de perte, de sorte que la représentation publique et la représentation privée L'écart est le plus grand possible. De plus, une contrainte orthogonale sera ajoutée pour rendre le produit interne de la représentation publique et de la représentation privée proche de 0.

4. Résultats expérimentaux

Les expériences présentées dans cet article comparent principalement sous deux aspects : l'équité et l'effet de prédiction. Les modèles comparés incluent des modèles de prédiction de séries chronologiques de base (LSTNet, Informer), des modèles de prédiction de séries chronologiques graphiques, etc. En termes d'équité, la variance des résultats de prédiction de différentes variables est utilisée. Grâce à la comparaison, l'équité de cette méthode est considérablement améliorée par rapport à d'autres modèles (comme le montre le tableau ci-dessous).

Sur la question de léquité dans les séries chronologiques multivariées

En termes d'effet de prédiction, le modèle proposé dans cet article peut fondamentalement obtenir des résultats équivalents à SOTA :

Sur la question de léquité dans les séries chronologiques multivariées

5Résumé

Comment garantir l'équité du modèle est un problème auquel sont confrontés de nombreux scénarios. de l'apprentissage automatique. Cet article introduit cette dimension des problèmes dans la prédiction de séries chronologiques multivariées et utilise des méthodes de prédiction spatio-temporelle et d'apprentissage contradictoire pour mieux la résoudre.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration

Cet article est reproduit dans:. en cas de violation, veuillez contacter admin@php.cn Supprimer

Article connexe

De la friction à la flux: comment l'IA est de remodeler le travail juridiqueMay 09, 2025 am 11:29 AM

La révolution de la technologie juridique prend de l'ampleur, poussant les professionnels du droit à adopter activement des solutions d'IA. La résistance passive n'est plus une option viable pour ceux qui visent à rester compétitifs. Pourquoi l'adoption de la technologie est-elle cruciale? Professionnel du droit

C'est ce que AI pense de toi et sait pour toiMay 09, 2025 am 11:24 AM

Beaucoup supposent que les interactions avec l'IA sont anonymes, un contraste frappant avec la communication humaine. Cependant, l'IA profile activement les utilisateurs à chaque chat. Chaque invite, chaque mot, est analysée et catégorisée. Explorons cet aspect critique de l'IA Revo

7 étapes pour construire une culture d'entreprise florissante et prête à l'AIMay 09, 2025 am 11:23 AM

Une stratégie d'intelligence artificielle réussie ne peut pas être séparée d'un fort soutien culturel d'entreprise. Comme l'a dit Peter Drucker, les opérations commerciales dépendent des gens, tout comme le succès de l'intelligence artificielle. Pour les organisations qui adoptent activement l'intelligence artificielle, la construction d'une culture d'entreprise qui s'adapte à l'IA est cruciale, et elle détermine même le succès ou l'échec des stratégies d'IA. West Monroe a récemment publié un guide pratique pour construire une culture d'entreprise florissante adaptée à l'IA, et voici quelques points clés: 1. Clarifier le modèle de réussite de l'IA: Tout d'abord, nous devons avoir une vision claire de la façon dont l'IA peut autonomiser les affaires. Une culture d'opération d'IA idéale peut réaliser une intégration naturelle des processus de travail entre les humains et les systèmes d'IA. L'IA est bonne dans certaines tâches, tandis que les humains sont bons en créativité et en jugement

Netflix Nouveau Scroll, Meta AI & # x27; s Changers de jeu, Neuralink d'une valeur de 8,5 milliards de dollarsMay 09, 2025 am 11:22 AM

Meta améliore la demande d'assistant AI, et l'ère de l'IA portable arrive! L'application, conçue pour rivaliser avec ChatGPT, propose des fonctionnalités d'IA standard telles que le texte, l'interaction vocale, la génération d'images et la recherche Web, mais a maintenant ajouté des capacités de géolocalisation pour la première fois. Cela signifie que Meta Ai sait où vous êtes et ce que vous consultez lorsque vous répondez à votre question. Il utilise vos intérêts, l'emplacement, le profil et les informations d'activité pour fournir les dernières informations situationnelles qui n'étaient pas possibles auparavant. L'application prend également en charge la traduction en temps réel, qui a complètement changé l'expérience de l'IA sur les lunettes Ray-Ban et a considérablement amélioré son utilité. L'imposition de tarifs sur les films étrangers est un exercice nu du pouvoir sur les médias et la culture. S'il est mis en œuvre, cela s'accélérera vers l'IA et la production virtuelle

Prenez ces mesures aujourd'hui pour vous protéger contre l'IA cybercriminalitéMay 09, 2025 am 11:19 AM

L'intelligence artificielle révolutionne le domaine de la cybercriminalité, ce qui nous oblige à acquérir de nouvelles compétences défensives. Les cybercriminels utilisent de plus en plus de puissantes technologies d'intelligence artificielle telles que la contrefaçon profonde et les cyberattaques intelligentes à la fraude et à la destruction à une échelle sans précédent. Il est rapporté que 87% des entreprises mondiales ont été ciblées pour la cybercriminalité de l'IA au cours de la dernière année. Alors, comment pouvons-nous éviter de devenir victimes de cette vague de crimes intelligents? Explorons comment identifier les risques et prendre des mesures de protection au niveau individuel et organisationnel. Comment les cybercriminels utilisent l'intelligence artificielle À mesure que la technologie progresse, les criminels recherchent constamment de nouvelles façons d'attaquer les individus, les entreprises et les gouvernements. L'utilisation généralisée de l'intelligence artificielle peut être le dernier aspect, mais son préjudice potentiel est sans précédent. En particulier, l'intelligence artificielle

Une danse symbiotique: naviguer dans des boucles de perception artificielle et naturelleMay 09, 2025 am 11:13 AM

La relation complexe entre l'intelligence artificielle (IA) et l'intelligence humaine (NI) est mieux comprise comme une boucle de rétroaction. Les humains créent une IA, les formant sur les données générées par l'activité humaine pour améliorer ou reproduire les capacités humaines. Cette AI

Le plus grand secret de l'IA - les créateurs ne le comprennent pas, les experts se divisentMay 09, 2025 am 11:09 AM

La récente déclaration d'Anthropic, mettant en évidence le manque de compréhension entourant les modèles d'IA de pointe, a déclenché un débat houleux parmi les experts. Cette opacité est-elle une véritable crise technologique, ou simplement un obstacle temporaire sur le chemin de plus de soph

Bulbul-V2 par Sarvam AI: Inde & # 039; s MEILLEUR MODÈLE TTSMay 09, 2025 am 10:52 AM

L'Inde est un pays diversifié avec une riche tapisserie de langues, faisant de la communication transparente entre les régions un défi persistant. Cependant, Bulbul-V2 de Sarvam aide à combler cette lac

See all articles

Outils d'IA chauds

Undresser.AI Undress

Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover

Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool

Images de déshabillage gratuites

Clothoff.io

Dissolvant de vêtements AI

Video Face Swap

Échangez les visages dans n'importe quelle vidéo sans effort grâce à notre outil d'échange de visage AI entièrement gratuit !

Afficher plus

Article chaud

Comment réparer KB5055523 ne parvient pas à s'installer dans Windows 11?

4 Il y a quelques semainesByDDD

Comment réparer KB5055518 ne parvient pas à s'installer dans Windows 10?

4 Il y a quelques semainesByDDD

<🎜>: Grow A Garden - Guide de mutation complet

3 Il y a quelques semainesByDDD

<🎜>: Bubble Gum Simulator Infinity - Comment obtenir et utiliser les clés royales

3 Il y a quelques semainesBy尊渡假赌尊渡假赌尊渡假赌

Comment réparer KB5055612 ne parvient pas à s'installer dans Windows 10?

3 Il y a quelques semainesByDDD

Afficher plus

Outils chauds

Version crackée d'EditPlus en chinois

Petite taille, coloration syntaxique, ne prend pas en charge la fonction d'invite de code

SublimeText3 Linux nouvelle version

Dernière version de SublimeText3 Linux

mPDF

mPDF est une bibliothèque PHP qui peut générer des fichiers PDF à partir de HTML encodé en UTF-8. L'auteur original, Ian Back, a écrit mPDF pour générer des fichiers PDF « à la volée » depuis son site Web et gérer différentes langues. Il est plus lent et produit des fichiers plus volumineux lors de l'utilisation de polices Unicode que les scripts originaux comme HTML2FPDF, mais prend en charge les styles CSS, etc. et présente de nombreuses améliorations. Prend en charge presque toutes les langues, y compris RTL (arabe et hébreu) et CJK (chinois, japonais et coréen). Prend en charge les éléments imbriqués au niveau du bloc (tels que P, DIV),

Navigateur d'examen sécurisé

Safe Exam Browser est un environnement de navigation sécurisé permettant de passer des examens en ligne en toute sécurité. Ce logiciel transforme n'importe quel ordinateur en poste de travail sécurisé. Il contrôle l'accès à n'importe quel utilitaire et empêche les étudiants d'utiliser des ressources non autorisées.

Dreamweaver Mac

Outils de développement Web visuel

Afficher plus

Sujets chauds

1664

1423

1317

1268

1242