Heim  >  Artikel  >  Technologie-Peripheriegeräte  >  Deng Jiang, Vizepräsident von Zhongguancun Science and Technology: Praktische Anwendung der KI-Audio- und Videotechnologie in Finanzszenarien

Deng Jiang, Vizepräsident von Zhongguancun Science and Technology: Praktische Anwendung der KI-Audio- und Videotechnologie in Finanzszenarien

WBOY
WBOYnach vorne
2023-04-12 15:34:25926Durchsuche

Die traditionelle Finanzbranche ist mit Problemen wie ineffizienten Abläufen, schlechtem Risikomanagement und -kontrolle sowie hohen Kosten für die Kundenakquise konfrontiert. Die Lösung traditioneller Geschäftsprobleme und -schwierigkeiten durch die Integration von Finanzen und Technologie ist eine wichtige Unterstützung für die aktuelle innovative Entwicklung der Finanzbranche.

Vor ein paar Tagen hielt Deng Jiang, Vizepräsident von Zhongguancun Science and Technology, auf der AISummitGlobal Artificial Intelligence Technology Conference, die von 51CTO veranstaltet wurde, eine Grundsatzrede zum Thema „Anwendungspraxis von AI Audio“. und Videotechnologie in Finanzszenarien“ „Betrieb“, der die technische Anwendung und das Denken von Audio- und Videotechnologie und Finanzen auf drei Ebenen vorstellt: Anwendung, Technologie, Rolle und Wert.

In den letzten drei Jahren hatte die Epidemie große Auswirkungen auf die gesamte Wirtschaft und Gesellschaft. Finanzunternehmen, die stark auf Offline-Szenarien angewiesen sind, bilden da keine Ausnahme.

Anwendung von KI-Audio- und Videotechnologie in Finanzszenarien

Im Zusammenhang mit der Epidemie in den letzten Jahren wurde das Finanzgeschäft stark beeinträchtigt, und das Land hat außerdem eine Reihe von Managementmaßnahmen zur Förderung eingeführt Kontaktlose Finanzentwicklung.

Unter den Anforderungen der neuen Umgebung und angetrieben durch neue Technologien wurde das traditionelle manuell gesteuerte Servicemodell (manuell gesteuertes Offline-Servicemodell) in ein KI-gesteuertes intelligentes Servicemodell (Online- und Offline-Full-Service-Modell) iteriert ). Servicemodell des Kanals Mensch-Maschine-System. Im Rahmen des traditionellen, vom Menschen gesteuerten Servicemodells können nur persönliche Offline-, Text-, Telefon-, Audio- und Video-Servicemodi realisiert werden. Unter dem KI-Treiber können intelligente/unbemannte Verkaufsstellen und intelligente Kunden realisiert werden Service, intelligente IVR/ausgehende Anrufe und KI-Video, KI für virtuelle Mitarbeiter und andere Dienste.

Um Remote-Banking zu realisieren, gibt es laut Deng Jiang fünf Kerntechnologien, die den Fortschritt der gesamten Technologie vorantreiben. Zu den fünf Kerntechnologien gehören künstliche Intelligenz, Echtzeit-Computing, biometrische Identifizierung und Identitätsüberprüfung, Datenentscheidungsfindung und Datenverarbeitung sowie Datenschutz.

Im Implementierungsprozess gibt es drei Kernalgorithmen und vier technische Kernfunktionen, die die beiden anderen Teile der technischen Anforderungen im Prozess der Technologieimplementierung darstellen. Drei wichtige KI-Kernalgorithmen: Sprachtechnologie, Verarbeitung natürlicher Sprache und maschinelles Sehen. Vier technische Kernfunktionen: hochwertige Omnichannel-Audio- und Videokommunikationsfunktionen, Omnichannel-SDK-Paketierungs- und Anpassungsfunktionen, Audio- und Video-basierte KI-Algorithmen, tiefe Integrations- und Anwendungsfähigkeiten sowie flexible und visuelle Orchestrierungsfunktionen für Videodienstszenen.

Technische Implementierung der intelligenten Video-Cloud-Konstruktion in Finanzszenarien

Deng Jiang sagte, dass die intelligente Video-Cloud ein digitales Upgrade sei, das grundlegendes Video fördert und KI-Intelligenz und RPA-Prozessautomatisierung nutzt, um „Mensch-Maschine“ neu zu erstellen Video-Service-Modell für Zusammenarbeit und Mensch-Maschine-Selbstbedienung. Mit der Unterstützung grundlegender Cloud-Computing-Ressourcen baut die unterste Ebene eine Audio- und Videoplattform auf, die hohe Parallelität und schnelle Reaktion unterstützt, einschließlich ASR, TTS, NLP, OCR, Gesichtserkennung, Anti-Remake und Live-Erkennung usw. Auf der Business-Middle-End-Ebene implementiert es Kundenprozessmanagement, intelligente Warteschlangen bei hoher Parallelität, statistische Analyse relevanter Informationen, Auftragsverwaltung und eine Reihe von Middle-End-Unterstützung.

Deng Jiang, Vizepräsident von Zhongguancun Science and Technology: Praktische Anwendung der KI-Audio- und Videotechnologie in Finanzszenarien

Am Frontend stehen neben der Unterstützung von Multi-End-Interventionen auch eine Reihe multimodaler biometrischer Überprüfungen für gefälschte Identitäten, Kunden-Selbstbedienung und Kundendienst-Remote-Video zur Verfügung Echtzeitberechnung und -verarbeitung der Videoaufnahme vor Ort. Das Front-End ist das Ende des Geschäftsszenarios, das das zugehörige integrierte Online- und Offline-Prozessmanagement für eine Reihe von Unternehmen wie Finanzmanagement, Versicherungen, Treuhand usw. umfasst.

Auf der Grundlage eines starken Fundaments hat das Unternehmen fünf Kernprodukte entwickelt: multimodale Identitätsüberprüfung, KI-Videodienst vor Ort, KI-Selbstbedienungsvideodienst, KI-Remote-Videodienst und intelligente KI-Audio- und Videoqualität Inspektion. Außerdem wurde das Videodienstsystem der AI Video Cloud eingeführt, das Produktsystem abgebaut und Produktfunktionen, Prozessmanagement und Produktwert eingeführt.

Praktische Anwendung der KI-Audio- und Videotechnologie in Finanzszenarien – mobile Kredite

Bei herkömmlichen Finanzkreditinterviews gibt es sechs große Schwierigkeiten: # 🎜 🎜#

Angesichts von Informationssilos sind Interviewdaten unabhängig vom Risikokontrollsystem und ihr dynamischer Datenwert wird nicht vollständig von einem manuell gesteuerten Modell genutzt, von dem die Qualität stark abhängt Personalerfahrung und ungleichmäßiges Geschäft; geringe Effizienz, keine intelligente oder schwache intelligente Unterstützung, hoher Druck auf die Basis, geringe Effizienz, persönlicher Interviewmodus vor Ort, hohes Geschäftsvolumen; Engpässe, Geschäftsspitzen und -tiefs, schlechte Anpassung der dynamischen Expansion; manuelle Stichprobenprüfungen sind riskant, und manuelle Offline-Stichprobenprüfungen bergen ein hohes Risikopotenzial, unzureichende Aktualität des Feedbacks und hohen Arbeitsdruck für das Personal.

Nachdem Deng Jiang die Schwierigkeiten bei Vorstellungsgesprächen erläutert hatte, interpretierte er auch vier von der China Banking and Insurance Regulatory Commission herausgegebene „Branchenmitteilungen“ auf politischer Ebene. Deng Jiang sagte, dass das Hinterlassen von Audio- und Videospuren in der Banken-, Treuhand-, Versicherungs- und Wertpapierbranche zu einer zwingenden Anforderung geworden sei.

Deng Jiang, Vizepräsident von Zhongguancun Science and Technology: Praktische Anwendung der KI-Audio- und Videotechnologie in Finanzszenarien

In der Rede von Lehrer Deng Jiang teilte er vier Aspekte mobiler Kreditszenarien mit : Remote-Videointerview, Self-Service-Videointerview, Tür-zu-Tür-Interview des Account Managers und Vor-Ort-Interview am Schalter der Filiale. Gleichzeitig der gesamte Video-Risikokontrollprozess und die praktischen Ergebnisse von Zhongguancun Science and Technology in Richtung Bio-Fälschungsbekämpfung wurden eingeführt ist eine multimodale Bio-Fälschungs- und Sicherheitsplattform.

Die multimodale biologische Fälschungs- und Sicherheitsplattform unterstützt mehrere lebende Erkennungsmethoden wie Bewegung und Lesen und nutzt den leistungsstarken KI-Algorithmus auf dem Server Um mehr Funktionen zur genauen Identifizierung und Betrugsbekämpfung bereitzustellen, ist die Plattform in vier Schichten unterteilt, bestehend aus Zugriffsschicht, Kernschicht, Funktionsschicht und Szenenschicht.

Deng Jiang, Vizepräsident von Zhongguancun Science and Technology: Praktische Anwendung der KI-Audio- und Videotechnologie in Finanzszenarien

Die Zugriffsschicht besteht aus WeChat-Applet, APP, mobilem H5, It besteht aus Web, Kamera-Ports und Drittsystemen.

Die Kernschicht verfügt über drei Funktionsmodule, darunter Live-Fälschung, Betrugserkennung und biologischer Vergleich. Die Live-Fälschungserkennung besteht aus grundlegender und erweiterter Fälschungsschutzerkennung und Verhaltensrisikoerkennung. Die grundlegende Fälschungsschutzerkennung umfasst Gesichtspräsentationsangriffe, Stimmabdruckpräsentationsangriffe und die erweiterte Fälschungsschutzerkennung, einschließlich Sprachmigrationssynthese-Erkennung Nachahmungserkennung; Verhaltensrisikoüberwachung umfasst Gesichtshaltungserkennung, Lippenspracheerkennung, Audio- und Videosynchronisationserkennung und semantische Okklusionssegmentierung. Die Betrugserkennung umfasst die Erkennung von Ausweisfälschungen, die Erkennung von Unterschriften- und Siegelfälschungen, die Ähnlichkeit von Porträthintergrund und die Erkennung von Stimmabdruckgruppen. Der biologische Vergleich umfasst das Lernen durch kontradiktorische Stichproben, das Abrufen von Stimmabdruckvergleichen und das Abrufen von Gesichtsvergleichen.

Die Funktionsschicht besteht aus der Bewertung der Verifizierungsfähigkeit, der Bewertung des Verhaltensrisikos, der Richtlinienverwaltung, dem Zugriff auf Daten Dritter, dem föderierten Lernen, dem aktiven Abfangen von Angriffen, der verschlüsselten Speicherung und der sinnlosen Registrierung Zur Funktionsimplementierung werden 12 Module wie nicht-sensorische Aufzeichnung, nicht-sensorische Aktualisierung, Lebenszyklusmanagement und Sicherheitsaudit implementiert.

Die in der Szenarioebene enthaltenen Geschäftsszenarien umfassen mehrdimensionale Authentifizierung mit echtem Namen, Kreditverlängerung, Überwachung der Mitarbeitereinhaltung, Erkennung von Vermittlern, Erkennung elektronischer Überprüfungsbanden, CC-Beschwerdenverfolgung, Büroschreibtische sind sicher und wichtige Kunden haben Zugang.

Nach einer eingehenden Analyse der multimodalen biologischen Anti-Fälschungsplattform verfügt die Plattform über eine KI-intelligente Audio- und Videoqualitätsprüfung + manuelle Stichprobeninspektion und -überprüfung Mit Hilfe von KI-Vision und Sprachqualitätsprüfungstechnologie werden in Videodiensten Echtzeit-Qualitätsprüfungen, Echtzeit-Korrekturen (Textkorrektur, Sprachkorrektur) und Echtzeit-Erinnerungen an Benutzer und Unternehmensleiter durchgeführt Die erste Erfolgsquote ist höher und vermeidet das Problem hoher sekundärer Neuaufzeichnungskosten und schlechter Benutzererfahrung. Zu den wichtigsten beteiligten Technologien gehören intelligente Bilderkennung, intelligente biometrische Identifizierung, intelligente Spracherkennung, intelligente Aktionserkennung sowie Audio- und Videosynchronisationserkennung , usw.

Durch die Einführung von Smart Collection und Smart Return Visits können durch Smart Collection vollständig automatisierte Inkassovorgänge und anthropomorphe Kommunikation realisiert werden. Die Sprachfähigkeiten können flexibel an verschiedene überfällige Phasen und Kundentypen angepasst werden. Compliance-Risiken und Beschwerdeprobleme, die sich aus dem Kodex ergeben. Intelligente Rückbesuche können eine hohe Anrufeffizienz erzielen; die Kundenreichweite anhand von Hintergrundstatistiken ermitteln; die Kundenzufriedenheit senken und die Effizienz steigern;

Nachdem wir die Funktionen und Technologien der KI-intelligenten Video-Cloud analysiert haben, haben wir verwandte Fälle der KI-intelligenten Video-Cloud geteilt. Einzelheiten zu dem Fall finden Sie in der Videowiedergabe auf der offiziellen Website.

Fazit

In der KI-Audio- und Videotechnologie, sei es Gesicht, Stimmabdruck, Lippenlesen, Sprachsynthese und andere Technologien, gibt es in der Szene eine tiefgreifende Szenenanpassung. Als Technologieunternehmen geht es neben der Verbesserung der technischen Fähigkeiten vor allem darum, detaillierte Geschäftsszenarien zu erstellen, kundenzentriert zu sein, Kundenbedürfnisse zu verstehen, echte Schwachstellen im Kundengeschäft zu lösen und Tools sinnvoll nutzen zu können ist die Zukunft der Technologie. Letztendlich wird durch die tiefgreifende Anwendung von Technologie in Finanzszenarien das Niveau des gesamten Finanzgeschäfts verbessert und die Grenzen der groß angelegten Entwicklung des gesamten Finanzgeschäfts erweitert.

Deng Jiang, Vizepräsident von Zhongguancun Science and Technology: Praktische Anwendung der KI-Audio- und Videotechnologie in Finanzszenarien

Die Aufzeichnung der Konferenzrede und die PPT sind jetzt online. Besuchen Sie die offizielle Website, um die spannenden Inhalte anzusehen --> ​Offizielle Website der AISummit Global Artificial Intelligence Technology Conference​

Das obige ist der detaillierte Inhalt vonDeng Jiang, Vizepräsident von Zhongguancun Science and Technology: Praktische Anwendung der KI-Audio- und Videotechnologie in Finanzszenarien. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Dieser Artikel ist reproduziert unter:51cto.com. Bei Verstößen wenden Sie sich bitte an admin@php.cn löschen