Der Kern der künstlichen Intelligenz: 1. Computer Vision bezieht sich auf die Fähigkeit von Computern, Objekte, Szenen und Aktivitäten anhand von Bildern zu erkennen. 2. Maschinelles Lernen bezieht sich auf die Tatsache, dass Computersysteme keinen expliziten Programmanweisungen folgen müssen. Verarbeitung natürlicher Sprache; 4. Roboter; 5. Spracherkennung, hauptsächlich mit Schwerpunkt auf der automatischen und genauen Transkription menschlicher Sprache.
Die Betriebsumgebung dieses Artikels: Windows 7-System, Dell G3-Computer.
Der Kern der künstlichen Intelligenz:
1. Computer Vision
Computer Vision bezeichnet die Fähigkeit von Computern, Objekte, Szenen und Aktivitäten anhand von Bildern zu erkennen. Computer-Vision-Techniken nutzen Sequenzen von Bildverarbeitungsvorgängen und anderen Techniken, um Bildanalyseaufgaben in überschaubare Abschnitte zu zerlegen. Einige Techniken können beispielsweise die Kanten und Texturen von Objekten anhand von Bildern erkennen, und Klassifizierungstechniken können verwendet werden, um zu bestimmen, ob die identifizierten Merkmale eine dem System bekannte Klasse von Objekten darstellen.
Computer Vision hat ein breites Anwendungsspektrum, darunter: Die medizinische Bildanalyse wird zur Verbesserung der Krankheitsvorhersage, -diagnose und -behandlung verwendet. Die Gesichtserkennung wird von Facebook verwendet, um Personen auf Fotos automatisch zu identifizieren Verdächtige identifizieren Menschen; wenn es ums Einkaufen geht, können Verbraucher jetzt Fotos von Produkten mit ihren Smartphones machen, um mehr Kaufoptionen zu erhalten.
Machine Vision als verwandte Disziplin bezieht sich im Allgemeinen auf Vision-Anwendungen im Bereich der industriellen Automatisierung. Bei diesen Anwendungen identifizieren Computer Objekte wie Produktionsteile in stark eingeschränkten Fabrikumgebungen, was die Ziele einfacher macht als Computer Vision, die darauf abzielt, in uneingeschränkten Umgebungen zu arbeiten. Computer Vision ist eine laufende Forschung, während Machine Vision ein „gelöstes Problem“ ist, ein Thema der Systemtechnik und kein Thema auf Forschungsebene. Da die Anwendungen immer weiter zunehmen, haben einige Computer-Vision-Startups seit 2011 Hunderte Millionen Dollar an Risikokapital angezogen.
2. Maschinelles Lernen
Maschinelles Lernen bezeichnet die Fähigkeit eines Computersystems, seine Leistung zu verbessern, ohne expliziten Programmanweisungen zu folgen und sich nur auf Daten zu verlassen. Im Kern erkennt maschinelles Lernen automatisch Muster in Daten, und einmal entdeckte Muster können für Vorhersagen genutzt werden. Wenn einem maschinellen Lernsystem beispielsweise eine Datenbank mit Kreditkartentransaktionsinformationen wie Transaktionszeit, Händler, Standort, Preis und die Frage, ob die Transaktion legitim war, zur Verfügung gestellt wird, lernt das System Muster, die zur Vorhersage von Kreditkartenbetrug verwendet werden können. Je mehr Transaktionsdaten verarbeitet werden, desto genauer sind die Vorhersagen.
Maschinelles Lernen hat ein breites Anwendungsspektrum und hat das Potenzial, die Leistung fast aller Aktivitäten zu verbessern, die große Datenmengen generieren. Zu diesen Aktivitäten gehören neben der Betrugserkennung auch Verkaufsprognosen, Bestandsverwaltung, Öl- und Gasexploration sowie öffentliche Gesundheit. Die Technologie des maschinellen Lernens spielt auch in anderen Bereichen der kognitiven Technologie eine wichtige Rolle, beispielsweise in der Computer Vision, die ihre Fähigkeit, Objekte zu erkennen, durch kontinuierliches Training und Verbesserung visueller Modelle in riesigen Bildern verbessern kann.
Heute ist maschinelles Lernen zu einem der heißesten Forschungsfelder in der kognitiven Technologie geworden und hat zwischen 2011 und 2014 Risikokapital in Höhe von fast 1 Milliarde US-Dollar angezogen. Google gab 2014 außerdem 400 Millionen US-Dollar für die Übernahme von Deepmind aus, einem Unternehmen, das maschinelle Lerntechnologien erforscht.
3. Verarbeitung natürlicher Sprache
Unter Verarbeitung natürlicher Sprache versteht man die menschenähnlichen Textverarbeitungsfähigkeiten von Computern. Extrahieren Sie beispielsweise Bedeutungen aus Texten und interpretieren Sie sogar unabhängig Bedeutungen aus Texten, die lesbar, natürlich im Stil und grammatikalisch korrekt sind. Ein System zur Verarbeitung natürlicher Sprache versteht nicht die Art und Weise, wie Menschen Texte verarbeiten, kann Texte jedoch auf sehr komplexe und anspruchsvolle Weise geschickt verarbeiten. Identifizieren Sie beispielsweise automatisch alle in einem Dokument erwähnten Personen und Orte. Extrahieren Sie verschiedene Geschäftsbedingungen aus einem Stapel lesbarer Verträge und erstellen Sie eine Tabelle. Diese Aufgaben sind mit herkömmlicher Textverarbeitungssoftware, die nur einfache Textabgleiche und Muster durchführt, einfach nicht zu bewältigen.
Die Verarbeitung natürlicher Sprache integriert wie die Computer-Vision-Technologie verschiedene Technologien, die zur Erreichung des Ziels beitragen. Sprachmodelle werden erstellt, um die Wahrscheinlichkeitsverteilung von Sprachausdrücken vorherzusagen, beispielsweise die maximale Wahrscheinlichkeit, dass eine bestimmte Zeichen- oder Wortfolge eine bestimmte semantische Bedeutung ausdrückt. Die ausgewählten Merkmale können mit bestimmten Elementen im Text kombiniert werden, um einen Textabschnitt zu identifizieren. Durch die Identifizierung dieser Elemente können bestimmte Textarten von anderen Texten, beispielsweise Spam-E-Mails, unterschieden werden. Auf maschinellem Lernen basierende Klassifizierungsmethoden werden zu Filterkriterien für die Feststellung, ob es sich bei einer E-Mail um Spam handelt.
Da der Kontext so wichtig ist, um den Unterschied zwischen „Zeitfliegen“ und „Fruchtfliegen“ zu verstehen, sind die praktischen Anwendungen von Techniken zur Verarbeitung natürlicher Sprache relativ eng, einschließlich der Analyse von Kundenreaktionen auf ein bestimmtes Produkt und Service-Feedback, um bestimmte Bedeutungen in Zivilklagen automatisch aufzudecken oder staatliche Ermittlungen, automatisches Verfassen formelhafter Aufsätze zu Themen wie Unternehmenseinnahmen und Sport und mehr.
4. Roboter
integrieren kognitive Technologien wie maschinelles Sehen und automatische Planung in extrem kleine, aber leistungsstarke Sensoren, Aktoren und clever konzipierte Hardware. Dadurch ist eine neue Generation von Robotern entstanden Fähigkeit, mit Menschen zusammenzuarbeiten und verschiedene Aufgaben in verschiedenen unbekannten Umgebungen flexibel zu bewältigen. Zum Beispiel Drohnen, „Cobots“, die sich in der Werkstatt die Arbeit mit Menschen teilen können, etc.
5. Spracherkennung
Bei der Spracherkennung geht es hauptsächlich um die automatische und genaue Transkription menschlicher Sprache. Die Technologie muss mit einigen Problemen konfrontiert sein, die der Verarbeitung natürlicher Sprache ähneln, mit einigen Schwierigkeiten beim Umgang mit unterschiedlichen Akzenten, Hintergrundgeräuschen und der Unterscheidung von Homophonen/Synonymen („kaufen“ und „von“ klingen gleich) und gleichzeitig Sie müssen auch sein in der Lage, mit einer Geschwindigkeit zu arbeiten, die mit der normalen Sprechgeschwindigkeit mithalten kann. Spracherkennungssysteme verwenden einige der gleichen Techniken wie Systeme zur Verarbeitung natürlicher Sprache, ergänzt durch andere Techniken wie akustische Modelle, die Geräusche und ihre Wahrscheinlichkeit des Auftretens in bestimmten Sequenzen und Sprachen beschreiben. Zu den Hauptanwendungen der Spracherkennung gehören medizinisches Diktat, Sprachschreiben, Sprachsteuerung von Computersystemen, telefonischer Kundendienst usw. Beispielsweise hat Domino's Pizza kürzlich eine mobile APP auf den Markt gebracht, mit der Benutzer Bestellungen per Spracheingabe aufgeben können.
Weitere Informationen zu diesem Thema finden Sie in der Spalte „FAQ“!
Das obige ist der detaillierte Inhalt vonWas ist der Kern der künstlichen Intelligenz?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!