Heim > Artikel > Computer-Tutorials > Warum zeigen mit dem PDF-Viewer geöffnete PDF-Dateien verstümmelte Zeichen an?
Ich verwende CAJViewer
CAJViewer5.5_OCR v5.5.0 Build 4030
Beschreibung: Mit der OCR-Erkennung und dem Mehrsprachenpaket unterstützt die OCR-Erkennung die Erkennung von Chinesisch und Englisch. Größe: 32,911 MB
1) Teilweise Texterkennung: Verwenden Sie direkt die OCR des Caj-Browsers
Speichern Sie die Druckdatei im MDI-Format und öffnen Sie die Datei dann mit Microsoft Office Document Image. Wählen Sie im Menü „Extras“ die Option „OCR zum Erkennen von Text verwenden“, um Textinhalte zu identifizieren. Wählen Sie nach Abschluss der Erkennung im Menü „Extras“ die Option „Text an Word senden“, um die Erkennungsergebnisse der gesamten PDF-Datei in eine Word-Datei auszugeben.
Bitte beachten Sie: Microsoft Office Document Image kann chinesische, englische und tabellarische Inhalte sehr genau erkennen und konvertieren. Allerdings können Grafiken nicht direkt in ein Word-Dokument ausgegeben werden. Stattdessen werden alle Grafiken in der Datei in unabhängige Bilddateien umgewandelt und im selben Ordner mit demselben Ordnernamen wie die Originaldatei abgelegt. Daher können Sie diese Grafikdateien mit der Snagit-Software öffnen, kopieren und in Word einfügen. (Es ist zu beachten, dass jede Erkennungssoftware das Problem der Mustererkennung nicht gut bewältigen kann und die Verarbeitungsmethode von Microsoft Office Document Image derzeit bereits eine der besten Lösungen zur Lösung dieses Problems ist.)
Empfohlene Schnellmethode:
Bevor Sie Text aus CAJ-Dateien extrahieren, sind folgende Vorbereitungen erforderlich: Stellen Sie zunächst sicher, dass der CAJ-Dateibrowser 5.5 und Office2003 installiert sind und das Office-Tool Microsoft Office Document Imaging vollständig installiert ist. Sobald die Installation abgeschlossen ist, sehen Sie den Microsoft Office Document Image Writer-Drucker in der Druckerliste. Mit Microsoft Office Document Image können Sie chinesische, englische, Tabellen- und andere Dokumentinhalte mit hoher Genauigkeit erkennen und konvertieren. Diese Vorbereitungen können sicherstellen, dass Sie die Textinformationen in der CAJ-Datei erfolgreich extrahieren können.
CAJ-Dateierkennung:
(1) Laden Sie zunächst die Datendatei im CAJ-Format aus dem Internet herunter und speichern Sie sie auf Ihrer lokalen Festplatte.
(2) Starten Sie dann das CAJViewer-Browserprogramm und öffnen Sie die CAJ-Formatdatei, die Sie gerade im Programm gespeichert haben. Schließen Sie das CAJ-Browserprogramm nicht, nachdem Sie die Datei bis zur letzten Seite durchsucht haben.
(3) Wählen Sie im CAJ-Browserprogrammfenster „Datei“ → „Drucken“ und wählen Sie den Drucker als Microsoft Office Document Image Writer-Drucker aus, aktivieren Sie die Option „In Datei drucken“ und bestimmen Sie die Anzahl der zu druckenden Seiten.
(4) Speichern Sie die Druckdatei (*.prn) am entsprechenden Ort. Nachdem Sie auf den Abschluss des Druckvorgangs gewartet haben, öffnet Microsoft Office Document Image automatisch die soeben gespeicherte Druckdatei.
(5) Wählen Sie im Microsoft Office-Dokumentbildfenster im Menü „Seite“ den Menüpunkt „Alle Seiten auswählen“ und dann im Menü „Extras“ die Option „OCR zur Texterkennung verwenden“, um Text zu extrahieren.
(6) Wählen Sie unter „Extras“ „Text an Word senden“ und schließlich wird die gesamte CAJ-Dateierkennung in die Word-Datei ausgegeben.
Manchmal stellen Sie beim Öffnen eines Word-Dokuments fest, dass das Dokument aus einer Ansammlung verstümmelter Zeichen besteht. Machen Sie sich keine Sorgen, Sie können die folgenden zwei Methoden ausprobieren, um Ihre Dateien zu speichern.
1. Ersatzformatmethode .heike123.com
Speichern Sie das beschädigte Word-Dokument in einem anderen Format.
1. Öffnen Sie das beschädigte Dokument und klicken Sie auf das Menü „Datei/Speichern unter“. Wählen Sie in der Liste „Speichertyp“ „RTF-Format“ aus, klicken Sie dann auf die Schaltfläche „Speichern“ und schließen Sie Word.
2. Öffnen Sie die gerade gespeicherte RTF-Formatdatei und speichern Sie sie erneut mit „Speichern unter“ als „Word-Dokument“. Öffnen Sie nun die Word-Datei und Sie werden feststellen, dass die Datei wiederhergestellt wurde.
Wenn die Datei nach der Konvertierung in das RTF-Format immer noch nicht wiederhergestellt werden kann, können Sie die Datei erneut in das Nur-Text-Format (*.txt) konvertieren und sie dann wieder in das Word-Format konvertieren. Natürlich gehen die Bilder und andere Informationen bei der Konvertierung in eine TXT-Datei verloren.
Einige PDF-Dateien werden bei der Konvertierung in Word-Dokumente verstümmelt. Ich habe viele Konvertierungsprogramme verwendet, aber der Text ist immer noch verstümmelt. Um dieses Problem zu lösen, habe ich die folgende dumme Methode verwendet:
1. Doppelklicken Sie, um die PDF-Datei zu öffnen. Natürlich müssen Sie den PDF-Konverter vorher herunterladen und installieren
2. Konvertieren Sie chinesischen Text im PDF-Format in ein bearbeitbares Word-Dokument. Die Methode ist: (In der geöffneten PDF-Datei) klicken Sie auf „Datei – Speichern unter“ und wählen Sie nach „Speichern unter“: „TXT-Datei (*.txt)“. , wählen Sie „Desktop“ nach „Speichern in“, klicken Sie auf „Speichern“, öffnen Sie das TXT-Dokument auf dem Desktop (mit demselben Namen wie das PDF), wählen Sie den Text aus, kopieren Sie ihn und fügen Sie ihn in das Word-Dokument ein.3. Kopieren Sie die Bilder im PDF in das Word-Dokument. Die Methode ist: (in der geöffneten PDF-Datei) klicken Sie auf: Extras-Schnappschuss (wenn das Bild größer ist, klicken Sie bitte auf das Werkzeug „Verkleinern“ in der zweiten Zeile Sie können das gesamte Bild sehen), wählen Sie das Bild aus (halten Sie die linke Maustaste in der oberen linken Ecke des Bildes gedrückt, ziehen Sie es in die untere rechte Ecke. Zu diesem Zeitpunkt sollte ein gepunktetes Kästchen erscheinen. Lassen Sie es los Maus) und klicken Sie im geöffneten Word-Dokument auf die entsprechende Schaltfläche „Einfügen an Position“ (Strg+V).
4. Zu diesem Zeitpunkt können Sie den Text im Word-Dokument nach Ihren Wünschen bearbeiten. Natürlich können die darin enthaltenen Bilder nur formatiert, aber nicht bearbeitet werden.
Die oben genannten 2 können auch so durchgeführt werden: (in der geöffneten PDF-Datei) klicken Sie auf: Extras-Textbetrachter (der Text im PDF liegt bereits in Textform vor), dann klicken Sie mit der rechten Maustaste auf „Alle auswählen“ – „Kopieren“ Zum Wort klicken Sie einfach auf „Einfügen“. Obwohl diese Methode seitenweise erfolgt, kann sie dem Originallayout im Word-Dokument ähneln. Klicken Sie dann auf: Extras-Textanzeige (Sie können auch wiederholt auf Alt+9 klicken), um die PDF-Reader-Schnittstelle (oder Textschnittstelle) aufzurufen.
Schritte zur Verwendung des Online-PDF-zu-Word-Konverters:
Schritt eins: Laden Sie die zu konvertierende PDF-Datei hoch. Es wird angezeigt, dass die hochgeladene Datei erfolgreich ist.
Schritt 2: Warten Sie auf die Serververarbeitung
Schritt 3: Laden Sie das Word-Dokument herunter und speichern Sie es auf Ihrem Computer.
Das obige ist der detaillierte Inhalt vonWarum zeigen mit dem PDF-Viewer geöffnete PDF-Dateien verstümmelte Zeichen an?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!