Heim  >  Artikel  >  Technologie-Peripheriegeräte  >  Sechs Fallstricke, die Sie bei großen Sprachmodellen vermeiden sollten

Sechs Fallstricke, die Sie bei großen Sprachmodellen vermeiden sollten

王林
王林nach vorne
2023-05-12 13:01:351314Durchsuche

Von Sicherheits- und Datenschutzbedenken bis hin zu Fehlinformationen und Voreingenommenheit – große Sprachmodelle bringen Risiken und Chancen mit sich.

In letzter Zeit gab es unglaubliche Fortschritte in der künstlichen Intelligenz (KI), die größtenteils auf Fortschritte bei der Entwicklung großer Sprachmodelle zurückzuführen sind. Diese bilden den Kern von Text- und Codegenerierungstools wie ChatGPT, Bard und Copilot von GitHub.

Diese Modelle werden von allen Branchen übernommen. Aber wie sie erstellt und genutzt werden und wie sie missbraucht werden können, gibt weiterhin Anlass zur Sorge. Einige Länder haben beschlossen, einen drastischen Ansatz zu verfolgen und bestimmte große Sprachmodelle vorübergehend zu verbieten, bis entsprechende Vorschriften in Kraft sind.

Hier ist ein Blick auf einige der realen negativen Auswirkungen von auf großen Sprachmodellen basierenden Tools sowie auf einige Strategien zur Abschwächung dieser Auswirkungen.

1.Bösartige Inhalte

Große Sprachmodelle können die Produktivität in vielerlei Hinsicht verbessern. Ihre Fähigkeit, die Anfragen von Menschen zu interpretieren und ziemlich komplexe Probleme zu lösen, bedeutet, dass Menschen alltägliche, zeitaufwändige Aufgaben ihrem Lieblings-Chatbot überlassen und einfach die Ergebnisse überprüfen können.

Mit großer Kraft geht natürlich auch große Verantwortung einher. Während große Sprachmodelle nützliches Material erstellen und die Softwareentwicklung beschleunigen können, können sie auch schnell auf schädliche Informationen zugreifen, die Arbeitsabläufe böswilliger Akteure beschleunigen und sogar schädliche Inhalte wie Phishing-E-Mails und Malware generieren. Wenn die Eintrittsbarriere so niedrig ist wie das Schreiben einer gut konstruierten Chatbot-Eingabeaufforderung, bekommt der Begriff „Skript-Kiddie“ eine ganz neue Bedeutung.

Es gibt zwar Möglichkeiten, den Zugriff auf objektiv gefährliche Inhalte einzuschränken, diese sind jedoch nicht immer machbar oder effektiv. Wie bei gehosteten Diensten wie Chatbots kann die Inhaltsfilterung zumindest dazu beitragen, die Arbeit für unerfahrene Benutzer zu verlangsamen. Die Implementierung starker Inhaltsfilter sollte notwendig sein, aber sie sind nicht allmächtig.

2. Prompt-Injection

Speziell gestaltete Eingabeaufforderungen können große Sprachmodelle dazu zwingen, Inhaltsfilter zu ignorieren und illegale Ausgaben zu erzeugen. Dieses Problem ist allen LMs gemeinsam, wird jedoch verstärkt, wenn diese Modelle beispielsweise als Plugin für ChatGPT mit der Außenwelt verbunden werden. Dadurch könnte der Chatbot benutzergenerierten Code „auswerten“, was zur Ausführung beliebigen Codes führen würde. Aus Sicherheitsgründen ist die Ausstattung von Chatbots mit dieser Funktionalität äußerst problematisch.

Um diese Situation zu entschärfen, ist es wichtig, die Fähigkeiten Ihrer LLM-basierten Lösung zu verstehen und zu verstehen, wie sie mit externen Endpunkten interagiert. Stellen Sie fest, ob es mit einer API verbunden ist, ein Social-Media-Konto betreibt oder ohne Aufsicht mit Kunden interagiert, und bewerten Sie das Threading-Modell entsprechend.

Während die Hint-Injection in der Vergangenheit möglicherweise belanglos schien, können diese Angriffe jetzt sehr schwerwiegende Folgen haben, da sie beginnen, generierten Code auszuführen, in externe APIs zu integrieren und sogar Browser-Registerkarten zu lesen.

3. Datenschutzinformationen/Urheberrechtsverletzung

Das Training großer Sprachmodelle erfordert eine große Datenmenge, und einige Modelle verfügen über mehr als 500 Milliarden Parameter. Auf dieser Ebene ist es eine schwierige, wenn nicht unmögliche Aufgabe, Herkunft, Urheberschaft und Urheberrechtsstatus zu verstehen. Ungeprüfte Trainingssätze können dazu führen, dass Modelle private Daten preisgeben, Zitate fälschlicherweise zuordnen oder urheberrechtlich geschützte Inhalte plagiieren.

Datenschutzgesetze bezüglich der Verwendung großer Sprachmodelle sind ebenfalls sehr vage. Wie wir in den sozialen Medien erfahren haben: Wenn etwas kostenlos ist, ist die Wahrscheinlichkeit groß, dass die Benutzer das Produkt sind. Denken Sie daran: Wenn Leute den Chatbot bitten, Fehler in unserem Code zu finden oder vertrauliche Dokumente zu schreiben, senden wir diese Daten an Dritte, die sie letztendlich für Modellschulungen, Werbung oder Wettbewerbsvorteile verwenden können. KI-bedingte Datenschutzverletzungen können im Geschäftsumfeld besonders schädlich sein.

Da umfangreiche sprachmodellbasierte Dienste in Produktivitätstools am Arbeitsplatz wie Slack und Teams integriert werden, lesen Sie die Datenschutzrichtlinien des Anbieters sorgfältig durch, verstehen Sie, wie KI-Eingabeaufforderungen verwendet werden, und regeln Sie die Verwendung in großem Umfang entsprechend von Sprachmodellen am Arbeitsplatz ist von entscheidender Bedeutung. Wenn es um den Schutz des Urheberrechts geht, müssen wir den Zugriff und die Nutzung von Daten durch Opt-Ins oder spezielle Lizenzen regulieren, ohne das offene und weitgehend kostenlose Internet, das wir heute haben, zu beeinträchtigen.

4. Fehlermeldung

Während große Sprachmodelle überzeugend vorgeben können, intelligent zu sein, „verstehen“ sie nicht wirklich, was sie produzieren. Stattdessen sind probabilistische Beziehungen zwischen Wörtern ihre Währung. Sie sind nicht in der Lage, zwischen Tatsachen und Fiktion zu unterscheiden – einige Ergebnisse mögen völlig glaubwürdig erscheinen, erweisen sich jedoch als selbstbewusste Formulierungen, die unwahr sind. Ein Beispiel hierfür ist das Manipulieren von Zitaten und sogar ganzen Artikeln durch ChatGPT, wie ein Twitter-Nutzer kürzlich direkt herausfand.

Groß angelegte Sprachmodellwerkzeuge können sich bei einer Vielzahl von Aufgaben als äußerst nützlich erweisen, aber Menschen müssen in die Validierung der Genauigkeit, des Nutzens und der Gesamtplausibilität ihrer Antworten einbezogen werden.

Die Ergebnisse von LLM-Tools sind immer mit Vorsicht zu genießen. Diese Tools sind für eine Vielzahl von Aufgaben nützlich, aber Menschen müssen in die Validierung der Genauigkeit, des Nutzens und der allgemeinen Plausibilität ihrer Antworten einbezogen werden. Ansonsten werden wir enttäuscht sein.

5. Schädliche Ratschläge

Beim Online-Chatten wird es immer schwieriger zu erkennen, ob man mit einem Menschen oder einer Maschine spricht, und einige Unternehmen versuchen möglicherweise, dies auszunutzen. Beispielsweise gab ein Technologieunternehmen für psychische Gesundheit Anfang des Jahres zu, dass einige Benutzer, die Online-Beratung suchten, unwissentlich mit GPT3-basierten Bots statt mit menschlichen Freiwilligen interagierten. Dies wirft ethische Bedenken hinsichtlich der Verwendung großer Sprachmodelle in der psychiatrischen Versorgung und allen anderen Bereichen auf, die auf der Interpretation menschlicher Emotionen beruhen.

Derzeit gibt es kaum regulatorische Kontrolle, um sicherzustellen, dass Unternehmen KI nicht ohne die ausdrückliche Zustimmung des Endnutzers auf diese Weise nutzen können. Darüber hinaus können Angreifer überzeugende KI-Bots nutzen, um Spionage, Betrug und andere illegale Aktivitäten durchzuführen.

Künstliche Intelligenz hat keine Emotionen, aber ihre Reaktionen können die Gefühle der Menschen verletzen und sogar zu noch tragischeren Folgen führen. Es ist unverantwortlich anzunehmen, dass KI-Lösungen die emotionalen Bedürfnisse des Menschen vollständig interpretieren und verantwortungsvoll und sicher darauf reagieren können.

Die Verwendung großer Sprachmodelle im Gesundheitswesen und anderen sensiblen Anwendungen sollte streng reguliert werden, um jegliches Risiko einer Schädigung der Benutzer auszuschließen. LLM-basierte Dienstanbieter sollten Benutzer immer über den Umfang des KI-Beitrags zum Dienst informieren, und die Interaktion mit Bots sollte immer eine Option und nicht die Standardeinstellung sein.

6. Bias

KI-Lösungen sind nur so gut wie die Daten, auf denen sie trainiert werden. Diese Daten spiegeln häufig unsere Vorurteile gegenüber politischen Parteien, Rasse, Geschlecht oder anderen demografischen Merkmalen wider. Voreingenommenheit kann sich negativ auf betroffene Gruppen auswirken, wenn Modelle unfaire Entscheidungen treffen, und kann sowohl subtil als auch potenziell schwer zu beheben sein. Modelle, die auf unzensierten Internetdaten trainiert werden, spiegeln immer menschliche Vorurteile wider; Modelle, die kontinuierlich aus Benutzerinteraktionen lernen, sind auch anfällig für absichtliche Manipulationen.

Um das Risiko einer Diskriminierung zu verringern, müssen große Anbieter von Sprachmodelldiensten ihre Trainingsdatensätze sorgfältig auswerten, um Ungleichgewichte zu vermeiden, die zu negativen Folgen führen könnten. Auch Modelle für maschinelles Lernen sollten regelmäßig überprüft werden, um sicherzustellen, dass die Vorhersagen fair und genau bleiben.

Groß angelegte Sprachmodelle definieren die Art und Weise, wie wir mit Software interagieren, völlig neu und bringen unzählige Verbesserungen in unsere Arbeitsabläufe. Aufgrund des derzeitigen Mangels an sinnvollen Vorschriften für künstliche Intelligenz und der mangelnden Sicherheit von Modellen für maschinelles Lernen kann die weit verbreitete und übereilte Implementierung großer Sprachmodelle jedoch erhebliche Rückschläge mit sich bringen. Daher muss diese wertvolle Technologie schnell reguliert und geschützt werden. ?

Das obige ist der detaillierte Inhalt vonSechs Fallstricke, die Sie bei großen Sprachmodellen vermeiden sollten. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Dieser Artikel ist reproduziert unter:51cto.com. Bei Verstößen wenden Sie sich bitte an admin@php.cn löschen