Heim > Artikel > Backend-Entwicklung > Anleitung zur grundlegenden OCR- und Bilderkennung mit PHP
Mit der kontinuierlichen Entwicklung auf dem Gebiet der künstlichen Intelligenz ist die Bilderkennungstechnologie immer ausgereifter und beliebter geworden. In praktischen Anwendungen ist die schnelle und effiziente Identifizierung von Bildinhalten für viele Entwickler und Forscher zu einem Problem geworden. Unter ihnen ist die OCR-Technologie (Optical Character Recognition) weit verbreitet, die Text in Bildern identifizieren und in ein bearbeitbares Textformat umwandeln kann, um die spätere Verarbeitung zu erleichtern.
In diesem Artikel wird erläutert, wie Sie mit PHP grundlegende OCR- und Bilderkennungsvorgänge ausführen.
Vorbereitung
Die Verwendung von PHP für OCR und Bilderkennung erfordert zunächst die Installation relevanter Bibliotheken und Erweiterungen. Hier nehmen wir Tesseract als Beispiel für die Installation.
tesseract ist eine Open-Source-OCR-Engine, die Text in mehreren Sprachen erkennen kann. In Linux-Systemen kann es über den folgenden Befehl installiert werden:
sudo apt-get install tesseract-ocr sudo apt-get install libtesseract-dev
Um Tesseract in PHP verwenden zu können, müssen wir die Erweiterung php-ocr installieren. In Linux-Systemen können Sie es mit dem folgenden Befehl installieren:
sudo apt-get install php-dev sudo apt-get install php-pear sudo apt-get install libtesseract-dev sudo pecl install ocr-alpha
Nach Abschluss der Installation fügen Sie die folgende Konfiguration in die Datei php.ini ein:
extension=ocr.so
Verwendung
Folgendes ist ein einfaches Anwendungsbeispiel für die OCR-Erkennung mit Tesseract:
<?php $img_file = 'test.png'; $text = (new OCRTesseractOCR($img_file)) ->run(); echo $text; ?>
Im obigen Code definieren wir zunächst eine Bilddatei test.png und verwenden dann Tesseract, um die Erkennung durchzuführen und das Ergebnis auszugeben.
Wenn Sie das Bild verarbeiten und dann erkennen müssen, können Sie dazu PHP und die GD-Bibliothek verwenden.
Das Folgende ist ein Beispiel für die Verarbeitung von Bildern und die Durchführung der OCR-Erkennung:
<?php $img_file = 'test.png'; $img = imagecreatefrompng($img_file); // 图像处理操作 $width = imagesx($img); $height = imagesy($img); $gray_img = imagecreatetruecolor($width, $height); for($i = 0; $i < $width; ++$i) { for($j = 0; $j < $height; ++$j) { $rgb = imagecolorat($img, $i, $j); $r = ($rgb >> 16) & 0xFF; $g = ($rgb >> 8) & 0xFF; $b = $rgb & 0xFF; $gray = intval(0.30 * $r + 0.59 * $g + 0.11 * $b); imagesetpixel($gray_img, $i, $j, ($gray << 16) | ($gray << 8) | $gray); } } $gray_file = 'gray.png'; imagepng($gray_img, $gray_file); $text = (new OCRTesseractOCR($gray_file)) ->run(); echo $text; ?>
Im obigen Code verwenden wir zuerst die Funktion imagecreatefrompng der GD-Bibliothek, um das Bild zu lesen, und führen dann Bildverarbeitungsvorgänge durch. Hier konvertieren wir das Bild in ein Graustufenbild umwandeln. Verwenden Sie nach Abschluss der Verarbeitung Tesseract für die OCR-Erkennung.
Zusammenfassung
Mit PHP für OCR und Bilderkennung können Bildinhalte problemlos in ein bearbeitbares Textformat konvertiert werden, wodurch grundlegende Daten für die anschließende Verarbeitung und Analyse bereitgestellt werden. In diesem Artikel wird die Methode zur Verwendung von Tesseract und der GD-Bibliothek zur einfachen Bilderkennung und -verarbeitung vorgestellt, die der Leser entsprechend den tatsächlichen Anforderungen weiterentwickeln kann.
Das obige ist der detaillierte Inhalt vonAnleitung zur grundlegenden OCR- und Bilderkennung mit PHP. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!