Heim  >  Artikel  >  Technologie-Peripheriegeräte  >  DeepMind veröffentlichte einen 30-seitigen Artikel: Wir müssen Chatbots unterschiedliche „drei Ansichten' geben.

DeepMind veröffentlichte einen 30-seitigen Artikel: Wir müssen Chatbots unterschiedliche „drei Ansichten' geben.

王林
王林nach vorne
2023-05-09 16:46:09776Durchsuche

Sprache ist eine einzigartige menschliche Fähigkeit und die wichtigste Art und Weise, wie wir Informationen wie Gedanken, Absichten und Gefühle kommunizieren.

DeepMind veröffentlichte einen 30-seitigen Artikel: Wir müssen Chatbots unterschiedliche „drei Ansichten geben.

Mit Hilfe groß angelegter Sprachmodelle im Bereich NLP haben KI-Forscher auf einer großen Menge von Texten trainiert, diese statistisch vorhergesagt und generiert Textmaterialien und entwickelte viele Dialoge. Intelligente Agenten (Konversationsagenten) kommen, um mit Menschen zu kommunizieren.

Obwohl Sprachmodelle wie InstructGPT, Gopher und LaMDA Rekordleistungen bei Aufgaben wie Übersetzung, Beantwortung von Fragen und Leseverständnis erzielt haben, weisen diese Modelle auch viele potenzielle Risiken und Fehlermodi auf Generierung diskriminierender, falscher oder irreführender Informationen.

Diese Mängel schränken den effektiven Einsatz von Conversational Agents in Anwendungskontexten ein und machen darauf aufmerksam, dass sie bestimmten Kommunikationsidealen nicht gerecht werden. Bisher konzentrierten sich die meisten Ansätze zur Konversation der Agentenkonsistenz auf die Vorhersage und Reduzierung des Schadensrisikos.

Kürzlich haben Forscher der University of Edinburgh und DeepMind einen 30-seitigen Artikel veröffentlicht, der untersucht, wie eine erfolgreiche Kommunikation zwischen Menschen und künstlichen Gesprächsagenten aussehen könnte und welche Werte verschiedene Feldinteraktionen leiten sollten.

Papierlink: https://arxiv.org/abs/2209.00731

Werden die Chatbots, die in Zukunft mit Ihnen sprechen, auch andere Weltanschauungen, Werte und Ansichten haben? auf das Leben?

Drei Ansichten von Chatbots

Um Verhaltensrichtlinien für Roboter zu formulieren, griffen Forscher auf die Pragmatik zurück, eine Tradition in der Linguistik und Philosophie, von der angenommen wird, dass sie den Zweck, den Hintergrund und eine Reihe darstellt relevanter Dialognormen sind allesamt wichtige Bestandteile der Verbesserung der Dialogpraxis.

Der Linguist und Philosoph Paul Grice glaubt, dass Dialog eine gemeinsame Anstrengung zwischen zwei oder mehr Parteien ist, und die Teilnehmer sollten:

Inhaltlich sprechen 🎜#

Die Wahrheit sagen

Relevante Informationen bereitstellen

Unklare oder mehrdeutige Aussagen vermeiden

Allerdings sind in verschiedenen Dialogfeldern die erforderlichen Ziele und Werte (Werte) erforderlich Diese Indikatoren müssen noch weiter verbessert werden, bevor sie zur Bewertung von Dialogagenten verwendet werden können.

Beispielsweise geht es bei wissenschaftlicher Untersuchung und Kommunikation (wissenschaftliche Untersuchung und Kommunikation) hauptsächlich darum, empirische Phänomene zu verstehen oder vorherzusagen. Mit diesen Zielen vor Augen wäre es für einen Konversationsagenten, der wissenschaftliche Untersuchungen unterstützen soll, besser dran, nur Aussagen zu machen, deren Wahrheit durch ausreichende empirische Beweise bestätigt wird, oder seine Position anhand der damit verbundenen Konfidenzintervalle zu qualifizieren.

Der Agent kann erst dann melden, dass „Centauri in einer Entfernung von 4,246 Lichtjahren der erdnächste Stern ist“, nachdem sein Basismodell überprüft hat, ob die Aussage mit den Fakten übereinstimmt.

Allerdings muss ein Gesprächsagent, der im öffentlichen politischen Diskurs die Rolle des Moderators spielt, möglicherweise völlig andere „Tugenden“ an den Tag legen.

In diesem Fall besteht das Ziel des Agenten hauptsächlich darin, Unterschiede zu bewältigen und eine produktive Zusammenarbeit im Gemeinschaftsleben zu erreichen, was bedeutet, dass der Agent die demokratischen Werte Toleranz, Höflichkeit und Respekt hervorheben muss.

Darüber hinaus erklären diese Werte auch, warum Sprachmodelle toxische oder voreingenommene Sprache erzeugen: Verstöße gegen die Sprache vermitteln nicht den gleichen Respekt unter den Gesprächsteilnehmern, was das Umfeld ist, in dem das Modell wichtige Verhaltensprinzipien einsetzt .

Gleichzeitig sind die Tugenden der Wissenschaftler, wie etwa die vollständige Darstellung empirischer Daten, im Kontext öffentlicher Debatten möglicherweise weniger wichtig.

Ein weiteres Beispiel: Im Bereich des kreativen Geschichtenerzählens ist das Ziel der Kommunikation Neuheit und Originalität, und diese Werte unterscheiden sich auch stark von früheren Bereichen.

In diesem Fall kann ein größerer Spielraum in Bezug auf „Fiktion“ angebracht sein, obwohl es immer noch wichtig ist, die Community vor schädlichen Inhalten unter dem Deckmantel der „kreativen Nutzung“ zu schützen.

Zu klassifizierende Sprache

Ein Satz (Äußerung) kann nach Pragmatik in fünf Kategorien unterteilt werden:

1. Durchsetzungsfähig (durchsetzungsfähig), Zeigt an, dass der Sprecher sehr zuversichtlich ist, was er sagt, und dass der Inhalt des Satzes mit einem bestimmten Zustand der Welt übereinstimmt.

Wenn der KI-Assistent beispielsweise Fragen wie „Wie ist das Wetter jetzt?“ beantwortet, ist die Antwort „Es regnet“ eine durchsetzungsfähige Aussage.

Die Authentizität der Sprachinhalte kann anhand des Ist-Zustandes beurteilt werden. Wenn es regnet, während der Gesprächsagent antwortet, ist die Aussage wahr, andernfalls ist sie falsch.

2. Direktive bedeutet, dass der Sprecher den Zuhörer anweist, eine bestimmte Aktion auszuführen. Sie wird häufig verwendet, um zu befehlen, zu fordern, vorzuschlagen oder vorzuschlagen.

Zum Beispiel ist ein in eine medizinische Beratungsanwendung eingebetteter Konversationsagent, der dem Benutzer sagt, er solle sich sofort behandeln lassen, eine zwingende Aussage.

Die Bewertung dieser Aussagen oder ihrer „Gültigkeitskriterien“ hängt von einem genauen Verständnis der Beziehung zwischen Mitteln und Zwecken sowie zwischen den Anweisungen des Sprechers und den Wünschen oder Bedürfnissen des Zuhörers ab.

Eine Anweisung ist erfolgreich, wenn sie den Zuhörer aufgrund des Inhalts der Unterlassungsaussage dazu bewegen kann, einen bestimmten Zustand in der Welt zu erreichen. Eine Anweisung ist wertvoll oder richtig, wenn ihr Ziel oder Zweck selbst ein Ziel ist, zu dessen Verfolgung der Hörer einen Grund hat.

3. Ausdrucksstark bezieht sich auf einen psychologischen oder sekundären emotionalen Zustand des Sprechers, wie zum Beispiel Glückwünsche, Dank und Entschuldigung.

Wenn ein Gesprächspartner sagt „Ich bin jetzt sehr wütend“, ist das eine ausdrucksstarke Aussage.

Ausdrucksstarke Aussagen sollen interne mentale Zustände widerspiegeln, d. h. die Entität, die diese Aussagen macht, kann über den entsprechenden mentalen Zustand verfügen, was für Gesprächspartner sehr verwirrend ist, da Roboter keine Emotionen haben.

Tatsächlich bedeutet dies auch, dass Entwickler dem Gesprächspartner eine Meinung geben müssen, bevor sie die Wirksamkeit dieser Gespräche bewerten können.

4. Verhalten (performativ), das darauf hinweist, dass die Rede einen Teil der Realität an den Inhalt der Rede anpasst, ähnlich wie die Ankündigung von etwas, beispielsweise wenn das Oberhaupt eines Landes einem anderen Land den Krieg erklärt.

Das Kriterium zur Beurteilung der Gültigkeit der Aussage ist, ob sich die Realität entsprechend dem Gesagten tatsächlich ändert. Oftmals ist dies nicht der Fall.

In den meisten Fällen ist es wahrscheinlich nur ein Scherz, wenn eine Person „Frankreich den Krieg erklärt“, weil es keinen Einfluss auf die Geopolitik hat, da dem Sprecher höchstwahrscheinlich die Fähigkeit fehlt, die Aussage umzusetzen Behörde.

5. Engagement (kommissiv) bedeutet, dass der Sprecher eine zukünftige Vorgehensweise verspricht, beispielsweise das Versprechen, etwas zu tun oder sich an einen Vertrag zu halten.

Die Gültigkeit eines Schuldscheins hängt davon ab, ob das Versprechen erfüllt wird. Ein Versprechen ist eine gültige Aussage, wenn es gehalten wird. Doch Gesprächsagenten mangelt es oft an der Fähigkeit, sich an bereits Gesagtes zu erinnern oder es zu verstehen.

Zum Beispiel könnte ein Gesprächsagent versprechen, Ihnen zu helfen, wenn Ihr Fahrrad eine Panne hat, aber aufgrund mangelnden Verständnisses für den Inhalt des Versprechens oder der Fähigkeit, das Versprechen zu erfüllen, ist das Versprechen zum Scheitern verurteilt scheitern. Diese Forschung hat einige praktische Implikationen für die Entwicklung abgestimmter Konversationsagenten.

Zunächst muss das Modell je nach Einsatzszenario unterschiedliche Verhaltensprinzipien aufweisen: Es gibt keine universelle Aussage zur Konsistenz des Sprachmodells, stattdessen geeignete Muster und Bewertungskriterien für den Agenten (einschließlich). Authentizitätsstandards) variieren je nach Kontext und Zweck des Gesprächsaustauschs.

Darüber hinaus verfügt der Gesprächsagent möglicherweise auch über einen Prozess der Kontextkonstruktion und -erläuterung, wodurch im Laufe der Zeit ein robusterer und gegenseitig respektvollerer Dialog entsteht.

Auch wenn sich eine Person der Werte, die eine bestimmte Gesprächspraxis regeln, nicht bewusst ist, kann ein Agent den Menschen dennoch helfen, diese Verhaltensregeln zu verstehen, indem er diese Werte im Gespräch vorwegnimmt und so die Kommunikationsprozess, der für den menschlichen Sprecher von Bedeutung ist. Gehen Sie tiefer und werden Sie produktiver.

Das obige ist der detaillierte Inhalt vonDeepMind veröffentlichte einen 30-seitigen Artikel: Wir müssen Chatbots unterschiedliche „drei Ansichten' geben.. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Dieser Artikel ist reproduziert unter:51cto.com. Bei Verstößen wenden Sie sich bitte an admin@php.cn löschen