KI ist von der gleichen Zentralisierung bedroht wie in früheren Ausgaben des Internets. Aber auch ein anderer Weg ist möglich, sagen Mahesh Ramakrishnan und Vinayak Kurup.
Dezentrale KI verspricht, die Datenverarbeitung zu demokratisieren, sie kleineren Entwicklern zugänglich zu machen und vor der Machtkonsolidierung durch einige wenige große Akteure zu schützen.
Ende Juli verfasste Mark Zuckerberg einen Brief, in dem er erklärte, warum „Open Source für eine positive KI-Zukunft notwendig ist“, in dem er sich poetisch über die Notwendigkeit einer Open-Source-KI-Entwicklung äußerte. Der einst nerdige Teenager-Gründer, der heute zum Wakeboard-, Goldketten-tragenden und Jiu-Jitsu-kämpfenden „Zuck“ geworden ist, wurde als Messias der Open-Source-Modellentwicklung gebrandmarkt.
Aber bisher haben er und das Meta-Team nicht viel darüber geäußert, wie diese Modelle eingesetzt werden. Da die Modellkomplexität die Rechenanforderungen erhöht, sind wir dann nicht einer ähnlichen Form der Zentralisierung erlegen, wenn die Modellbereitstellung von einer Handvoll Akteuren gesteuert wird?
Dezentrale KI verspricht, diese Herausforderung zu lösen, aber die Technologie erfordert Fortschritte bei branchenführenden kryptografischen Techniken und einzigartigen Hybridlösungen.
Dieser Kommentar ist Teil des neuen DePIN Vertical von CoinDesk, der die aufstrebende Branche der dezentralen physischen Infrastruktur abdeckt.
Im Gegensatz zu zentralisierten Cloud-Anbietern verteilt dezentrale KI (DAI) die Rechenprozesse für KI-Inferenz und -Training auf mehrere Systeme, Netzwerke und Standorte. Bei korrekter Implementierung bringen diese Netzwerke, eine Art dezentrales physisches Infrastrukturnetzwerk (DePIN), Vorteile in Bezug auf Zensurresistenz, Rechenzugriff und Kosten.
DAI est confronté à des défis dans deux domaines principaux : l'environnement de l'IA et l'infrastructure décentralisée elle-même. Par rapport aux systèmes centralisés, DAI nécessite des protections supplémentaires pour empêcher l'accès non autorisé aux détails du modèle ou le vol et la réplication d'informations exclusives. Pour cette raison, il existe une opportunité sous-explorée pour les équipes qui se concentrent sur les modèles open source, mais reconnaissent le désavantage potentiel en termes de performances des modèles open source par rapport à leurs homologues fermés.
Les systèmes décentralisés sont particulièrement confrontés à des obstacles en termes d'intégrité du réseau et de surcharge des ressources. La répartition des données client sur des nœuds distincts, par exemple, expose davantage de vecteurs d'attaque. Les attaquants pourraient faire tourner un nœud et analyser ses calculs, tenter d’intercepter les transmissions de données entre nœuds ou même introduire des biais qui dégradent les performances du système. Même dans un modèle d'inférence décentralisé et sécurisé, il doit exister des mécanismes pour auditer les processus de calcul. Les nœuds sont incités à économiser des ressources en présentant des calculs incomplets, et la vérification est compliquée par l'absence d'un acteur fiable et centralisé.
Preuves sans connaissance
Les preuves à connaissance nulle (ZKP), bien qu'actuellement trop coûteuses en termes de calcul, sont une solution potentielle à certains défis de la DAI. ZKP est un mécanisme cryptographique qui permet à une partie (le prouveur) de convaincre une autre partie (le vérificateur) de la véracité d'une déclaration sans divulguer aucun détail sur la déclaration elle-même, à l'exception de sa validité. La vérification de cette preuve est rapide à exécuter pour les autres nœuds et offre à chaque nœud un moyen de prouver qu'il a agi conformément au protocole. Les différences techniques entre les systèmes de preuve et leurs implémentations (nous y reviendrons en profondeur plus tard) sont importantes pour les investisseurs dans l'espace.
Le calcul centralisé rend la formation de modèles exclusive à une poignée de joueurs bien positionnés et dotés de ressources. Les ZKP pourraient contribuer à débloquer le calcul inactif sur le matériel grand public ; un MacBook, par exemple, pourrait utiliser sa bande passante de calcul supplémentaire pour aider à former un modèle en grand langage tout en gagnant des jetons pour l'utilisateur.
Le déploiement de formations ou d'inférences décentralisées avec du matériel grand public est au centre des préoccupations d'équipes comme Gensyn et Inference Labs ; contrairement à un réseau de calcul décentralisé comme Akash ou Render, le partage des calculs ajoute de la complexité, à savoir le problème de la virgule flottante. L'utilisation de ressources de calcul distribuées inutilisées permet aux petits développeurs de tester et de former leurs propres réseaux, à condition qu'ils aient accès à des outils qui résolvent les défis associés.
À l'heure actuelle, les systèmes ZKP sont apparemment quatre à six ordres de grandeur plus chers que l'exécution native du calcul, et pour les tâches qui nécessitent un calcul élevé (comme la formation de modèles) ou une faible latence (comme l'inférence de modèle), l'utilisation d'un ZKP est prohibitive. lent. À titre de comparaison, une baisse de six ordres de grandeur signifie qu'un système de pointe (comme le Jolt d'a16z) exécuté sur une puce M3 Max peut prouver qu'un programme est 150 fois plus lent que de l'exécuter sur une calculatrice graphique TI-84.
La capacité de l'IA à traiter de grandes quantités de données la rend compatible avec les preuves à connaissance nulle (ZKP), mais des progrès supplémentaires en cryptographie sont nécessaires avant que les ZKP puissent être largement utilisées. Le travail effectué par des équipes telles que Irreductible (qui a conçu le système de preuve et le système d'engagement Binius), Gensyn, TensorOpera, Hellas et Inference Labs, entre autres, constituera une étape importante dans la réalisation de cette vision. Les délais restent cependant trop optimistes, car la véritable innovation prend du temps et des progrès mathématiques.
En attendant, il convient de noter d’autres possibilités et solutions hybrides. HellasAI et d'autres développent de nouvelles méthodes de représentation de modèles et de calculs qui peuvent permettre un jeu de défi optimiste, autorisant uniquement un sous-ensemble de calculs qui doivent être traités sans connaissance. Les preuves optimistes ne fonctionnent que lorsqu'il y a un jalonnement, la capacité de prouver un acte répréhensible,
Das obige ist der detaillierte Inhalt vonWie dezentrale KI und wissensfreie Beweise die Datenverarbeitung demokratisieren werden. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!