Heim >Backend-Entwicklung >PHP-Tutorial >Wie extrahiere ich Text aus PDF-Dokumenten mit PHP ohne externe Tools oder Root-Zugriff?

Wie extrahiere ich Text aus PDF-Dokumenten mit PHP ohne externe Tools oder Root-Zugriff?

Barbara Streisand
Barbara StreisandOriginal
2024-10-30 05:17:28192Durchsuche

How to Extract Text from PDF Documents Using PHP without External Tools or Root Access?

Text aus PDF-Dokumenten mit PHP extrahieren

Frage:

Wie kann ich Text extrahieren? aus einem PDF-Dokument mit PHP, ohne auf externe Tools oder Root-Zugriff angewiesen zu sein?

Lösung:

Um Text aus einem PDF-Dokument mit PHP zu extrahieren, können Sie die Klasse verwenden .pdf2text.php-Bibliothek.

Schritte:

  1. Laden Sie die class.pdf2text.php-Bibliothek von https://pastebin.com/dvwySU1a herunter.
  2. Fügen Sie die Bibliothek mit dem folgenden Code in Ihr PHP-Skript ein:

    <code class="php">include('class.pdf2text.php');</code>
  3. Erstellen Sie eine Instanz der PDF2Text-Klasse und geben Sie die PDF-Datei an, die Sie extrahieren möchten Text aus:

    <code class="php">$a = new PDF2Text();
    $a->setFilename('filename.pdf'); </code>
  4. Dekodieren Sie das PDF-Dokument, um seinen Text zu extrahieren:

    <code class="php">$a->decodePDF();</code>
  5. Greifen Sie auf den extrahierten Text zu, indem Sie die Ausgabe aufrufen ()-Methode:

    <code class="php">echo $a->output(); </code>

Zusätzliche Hinweise:

  • Diese Bibliothek kann Unicode-Zeichen effektiv verarbeiten.
  • Wenn die Bibliothek class.pdf2text.php Ihren Anforderungen nicht entspricht, können Sie auch die PDF-Parser-Bibliothek ausprobieren.
  • Weitere Informationen zu class.pdf2text.php finden Sie in der Projekthomepage: https:// sourceforge.net/projects/pdflib/.

Das obige ist der detaillierte Inhalt vonWie extrahiere ich Text aus PDF-Dokumenten mit PHP ohne externe Tools oder Root-Zugriff?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn