-
Couche de planificationInterconnexion : découpler les modules système de plusieurs niveaux pour construire une plate-forme de planification d'interconnexion ouverte et standardisée, prendre en charge la planification des tâches entre plusieurs plates-formes informatiques privées hétérogènes
- Interconnexion intersites de la couche de transport : créez des composants de communication d'interconnexion intersites ouverts, prenez en charge plusieurs modes de transmission et plusieurs protocoles de communication, Peut s'adapter à la transmission de données entre plusieurs plates-formes informatiques de confidentialité hétérogènes, améliorez l'efficacité de la transmission et la stabilité du système
-
Interconnexion informatique hétérogène fédérale : Construction distribuée et en clair Tensor/DataFrame, DécouplageHE, MPC et d'autres protocoles de sécurité et protocoles d'algorithmes fédérés, aide interconnexion des moteurs de calcul hétérogènes fédérés
-
migration et expansion de l'algorithme de base, expérience et performances de développement d'algorithmes sont considérablement améliorées : utilisation d'un mode de programmation CiphertextTensor/Dataframe distribué et clair pour réaliser la migration et l'expansion de l'algorithme de base Amélioration des performances de l'algorithme de base : PSIAmélioration des performances de l'algorithme d'intersection de protection de la vie privée 1,8+ fois, fédération verticaleSSHE- LR les performances de l'algorithme sont améliorées 4,3+ fois et neurones fédérés verticaux les performances de l'algorithme de réseau sont améliorées 143 fois
FATE 2.0Schéma schématique de l'architecture globale d'interconnexion
-
FATE 2.0Caractéristiques en un coup d'oeil
FATE-Client 2.0 : Créer un DSL fédéré évolutif , prend en charge l'interconnexion de la couche d'application
1. Présentation d'un nouveau modèle évolutif. et DSL IR fédéré standardisé, c'est-à-dire un processus de modélisation fédéré, représentation de couche intermédiaire standardisée DSL
2. Conversion IR et d'autres protocoles, tels que
Conversion mutuelle du protocole BFIA d'interconnexion de l'Alliance de l'industrie financière de Pékin 5
Terminer la migration des fonctions Flow Cli et Flow SDK FATE-. Flow 2.0 :
Construire une plateforme de planification interconnectée ouverte et standardisée
1
. Adaptez-vous au DSL IR fédéral évolutif et standardisé FATE 2.02. Créez un cadre de couche de planification d'interconnexion et prenez en charge d'autres protocoles via des adaptateurs, tels que l'interface de couche de contrôle impliquée dans le "Document technique de l'API d'interopérabilité informatique de confidentialité".
3. Optimisez la planification des processus, le découplage et la logique de planification personnalisable, et ajoutez la planification prioritaire
4 Optimisez la planification des composants d'algorithme, prenez en charge le chargement d'algorithmes au niveau du conteneur et améliorez la prise en charge multiplateforme pour les éléments hétérogènes. scénarios
5. Optimisez l'enregistrement des composants d'algorithme multi-versions et prenez en charge l'enregistrement des modes de fonctionnement des composants
6 Amélioration de l'extension Federal DSL IR : prend en charge la planification asymétrique multipartite
. 7. Optimisez la logique d'authentification client et prenez en charge la gestion des autorisations de plusieurs clients
8 Optimisez l'interface RESTful pour rendre les champs et types de saisie, les champs de retour et les codes d'état plus clairs
9 .. Ajout du module OFX (Open Flow Exchange) : encapsule le client de planification, permettant la planification multiplateforme
10.Prend en charge le nouveau moteur de communication OSX tout en restant compatible avec tous les moteurs de FATE Flow 1.x
11 La couche système et la couche algorithme sont découplées et la configuration du système est déplacée du référentiel FATE vers le référentiel Flow
12 Le package FATE Flow est publié dans PyPI et un nouveau service pour la gestion des services. est ajouté Niveau CLI13. Terminer la migration des fonctions principales de 1.x
OSX (Open Site Exchange) 1.0 : Créer un composant de communication d'interconnexion inter-sites ouvert
-
Référence La « Documentation technique de l'API d'interopérabilité informatique de confidentialité de l'industrie financière » publiée par la Beijing Fintech Industry Alliance implémente l'interface de transmission interopérabilité, qui est compatible avec la version FATE 1.X et la version FATE 2.X
- prend en charge la transmission synchrone grpc et la transmission en streaming, prend en charge le protocole de transmission sécurisé TLS, compatible avec le composant rollsite FATE 1.X
- prend en charge Http 1. Les composants lapinmq et pulsar dans la logique de gestion des exceptions pendant la transmission fournissent une sortie de journal plus précise pour localiser rapidement les exceptions
- La configuration du routage est fondamentalement la même que celle du rollsite d'origine, ce qui réduit la difficulté de transplantation
-
Prend en charge l'interface http pour modifier la table de routage et fournit une vérification simple des autorisations
- Amélioration de la gestion des connexions réseau logique, réduisant le risque de fuite de connexion et améliorant l'efficacité de la transmission
- Utilisez différents ports pour traiter les demandes d'accès à l'intérieur et à l'extérieur du cluster, ce qui facilite l'adoption de différentes politiques de sécurité pour différents ports
- FATE-Arch 2.0 :
-
Construire une API unifiée et standardisée pour faciliter l'interconnexion des moteurs de calcul hétérogènes fédérés
-
Context : Introduit "Contexte" pour gérer des API conviviales pour les développeurs, telles que "l'informatique distribuée", "l'apprentissage fédéré", "l'algorithme de chiffrement", "l'opération tensorielle", les "métriques" et "Entrée et sortie gestion"
-
Tensor : Introduit la structure de données Tensor pour traiter les opérations matricielles locales et distribuées, prenant en charge l'accélération hétérogène intégrée ; optimisation de la couche d'abstraction PHETensor, utilisant une variété d'implémentations PHE sous-jacentes via des interfaces standard, commutation gratuite
- DataFrame : Présente la structure de données tabulaire bidimensionnelle "DataFrame" pour l'entrée et la sortie des données et l'ingénierie des fonctionnalités de base. Le nouveau gestionnaire de blocs de données prend en charge la gestion multi-types de colonnes et propose une logique anonyme ; ajoute plus de 30 interfaces opérateur telles que les statistiques, la comparaison, l'indexation, le regroupement et la transformation des données, etc.
-
Fédération reconstruite : fournit une fédération unifiée Interface de communication, comprenant un contrôle unifié de sérialisation/désérialisation et une API plus conviviale
-
Config : fournit des paramètres de configuration unifiés pour FATE, y compris la configuration de la sécurité, la configuration du système et la configuration de l'algorithme
- Refactor "logger" : Personnalisez les détails de la journalisation en fonction des différentes méthodes d'utilisation et des besoins
-
Launcher : Un outil d'exécution de programme fédéré simplifié, particulièrement adapté à l'exécution autonome et au débogage local
-
Couche de protocole : Prise en charge SSHE (hybride sécurisé protocole de calcul multipartite et de cryptage homomorphique), ECDH, protocole d'agrégation sécurisé
- Intégration de Deepspeed : prise en charge de la planification de la formation des clusters GPU distribués via Eggroll
- Intégration expérimentale de Crypten : prise en charge de SMPC, plus de protocoles et des fonctions seront ajoutées à l'avenir
FATE-Component 2.0 : Créer des composants d'algorithme standardisés pour s'adapter aux différents moteurs de planification
- Introduction de la boîte à outils de composants Encapsulate : la machine module d'apprentissage dans un programme exécutable standard
- Fournir une API claire via les spécifications et le chargeur pour faciliter l'expansion interne et l'intégration avec des systèmes externes
- Entrée et sortie : découpler davantage FATE-Flow et fournir un processus d'appel de boîte noire standardisé
- Définition des composants : prend en charge la définition basée sur le type, vérifie automatiquement les paramètres des composants, prend en charge plusieurs types d'entrées et de sorties de données et de modèles, ainsi que plusieurs entrées
FATE-ML 2.0 : Migration de l'algorithme de base et expansion, L'expérience et les performances de développement d'algorithmes sont considérablement améliorées
-
Adopter un modèle de programmation distribué, brut et chiffréTensor/Dataframepour réaliser la migration et l'expansion de l'algorithme de base :
-
Prétraitement des données : ajout du transformateur DataFrame, migration terminée de Reader, PSI, Union et DataSplit
- Ingénierie des fonctionnalités : migration terminée de HeteroFederatedBinning, HeteroFeatureSelection, DataStatistics, Sampling, FeatureScale et Pearson Correlation.
- Nouveau Fédéré Augmenté protocole d'algorithme de formation : SSHE-HeteroNN basé sur le protocole hybride de cryptage homomorphique et MPC
-
,
FedPASS-HeteroNN basé sur le protocole FedPASSAmélioration significative des performances
- PSI
Privacy Protect intersection ed : testé sur un ensemble de données de 100 millions d'ID, et le résultat de l'intersection est de 100 millions, les performances sont 1,8+ fois supérieures à celles de FATE-1.11-
Algorithme de regroupement fédéré longitudinal : dans 100 000 lignes invitées * caractéristiques à 30 dimensions, testées sur l'hôte 100 000 lignes*données de caractéristiques à 300 dimensions, les performances sont 1,5+ fois supérieures à celles de FATE-1.11
- Algorithme SSHE-LR fédéré verticalement : sur des invités de 100 000 lignes*caractéristiques à 300 dimensions, hébergez 100 000 lignes *Testé sur des données avec trois cent caractéristiques dimensionnelles, les performances sont 4,3+ fois supérieures à celles de FATE-1.11
- Algorithme LR du coordinateur de la ceinture fédérale longitudinale : invité 100 000 lignes*30 caractéristiques dimensionnelles, hôte 100 000 lignes*300 Testé sur des données avec des caractéristiques dimensionnelles, la performance est de 1,2 + fois celui de FATE-1.11
- Réseau neuronal fédéré longitudinal (basé sur le protocole FedPass) : invité 100 000 lignes*30 caractéristiques dimensionnelles, hôte 100 000 lignes*300 caractéristiques dimensionnelles Testées sur des données, les performances sont fondamentalement cohérentes avec les performances du texte en clair , et les performances sont 143 fois supérieures à celles de FATE-1.11
Eggroll 3.0 :
Les performances, la disponibilité et la fiabilité du système sont entièrement améliorées 1. JVM
Amélioration Reconstruction des composants de base : les composants du gestionnaire de cluster et du gestionnaire de nœuds sont entièrement reconstruits à l'aide du langage Java pour garantir l'uniformité et améliorer les performances
- Modification des composants de transmission : supprimer le composant de transmission rollsite, remplacé par des composants osx plus efficaces
- Améliorations de la gestion des processus : mise en œuvre d'une logique de gestion des processus plus avancée, réduisant considérablement le risque de fuite de processus
-
Amélioration de la logique de stockage des données : optimisation du mécanisme de stockage des données, amélioration des performances et de la fiabilité
- Améliorations du contrôle de concurrence : mise à niveau de la logique de contrôle de concurrence dans les composants d'origine pour améliorer les performances
- Composants visuels : ajoutez de nouveaux composants visuels pour faciliter la surveillance des informations de calcul
- Amélioration du journal : le système de journalisation est amélioré et la sortie est plus précise. Aide à détecter rapidement les anomalies
. -
2. Python
mise à niveau
-
roll_pair et egg_pair reconstruction : prend en charge les méthodes de sérialisation et de partitionnement contrôlées par l'appelant , la sécurité de la sérialisation est gérée uniformément par l'appelant
- nettoyage automatique des tables intermédiaires : résout le problème de fédération et de calcul Intermédiaire les tables sont automatiquement nettoyées sans qu'il soit nécessaire d'effectuer des opérations supplémentaires par l'appelant. Contrôle de configuration unifié : introduction d'un système de configuration flexible qui prend en charge le transfert direct, les fichiers de configuration et les variables d'environnement pour répondre à divers besoins. Installation du client PyPI : Eggroll 3.0.0 prend en charge le client facile. installation via PyPI
- Optimisation de la configuration du journal : les appelants peuvent personnaliser le format du journal selon leurs besoins
- Ajustement de la structure du code : la base de code est rationalisée, la structure et la logique sont plus claires et supprimées Beaucoup de code redondant
-
Rassembler la puissance de l'open source pour aider au développement de l'industrie informatique privée
- Intégration de données intersectorielles et interinstitutionnelles dans les domaines de la finance, des télécommunications, de la médecine, des affaires gouvernementales et du marketing publicitaire , les villes intelligentes et bien d’autres scénarios ont des besoins considérables. L’informatique confidentielle est devenue un outil puissant pour éliminer les barrières en matière de données entre les secteurs, et l’interconnexion est la pierre angulaire pour tirer pleinement parti de cet outil puissant. FATE 2.0 fournit un cadre open source pour réaliser l'interconnexion et l'interopérabilité, résolvant ainsi un problème majeur de l'industrie. La plupart des plates-formes informatiques de confidentialité peuvent atteindre l'objectif d'interagir et de s'intégrer à des systèmes hétérogènes en mettant en œuvre des interfaces d'interopérabilité ouvertes. Le lancement de
FATE 2.0 offre un soutien solide à l'interconnexion et à l'interopérabilité entre les plates-formes hétérogènes, et l'itération continue démontre l'engagement d'amélioration continue de la technologie. Il ne s’agit pas seulement de la protection de la confidentialité des données, mais aussi du développement de l’ensemble du secteur. Dans ce processus, les utilisateurs de l’industrie informatique privée et les partenaires technologiques ont davantage de possibilités de participer. Grâce aux efforts conjoints de la communauté, nous pouvons mieux relever les défis de la sécurité des données et de la protection de la vie privée, et jeter des bases solides pour construire une société numérique plus sûre et plus fiable. La sortie de FATE 2.0
est un nouveau chapitre de coopération industrielle et gagnant-gagnant. Nous attendons avec impatience que davantage d'innovateurs et de praticiens se joignent pour promouvoir conjointement le développement vigoureux de la technologie informatique de confidentialité.
[1] Bureau national des données : Avis du Bureau national des données et d'autres départements sur la publication des "Éléments de données [2]
Lv Ailin de l'Académie chinoise de l'information et Technologies de communication et autres : progrès et tendances dans la culture du marché des éléments de données dans mon pays[3]
"Financial Industry Privacy Computing Interoperability API Technical Documentation" v1.0 a été publiée. Hébergée dans le référentiel de la communauté FATE : https://github.com/FederatedAI/InterOp