Maison  >  Article  >  tutoriels informatiques  >  Pourquoi les fichiers PDF ouverts à l'aide de la visionneuse PDF affichent-ils des caractères tronqués ?

Pourquoi les fichiers PDF ouverts à l'aide de la visionneuse PDF affichent-ils des caractères tronqués ?

WBOY
WBOYavant
2024-01-17 16:18:051144parcourir

Pourquoi les fichiers PDF ouverts à laide de la visionneuse PDF affichent-ils des caractères tronqués ?

Pourquoi les fichiers PDF ouverts par la visionneuse PDF sont-ils tous tronqués ?

J'utilise CAJViewer

CAJViewer5.5_OCR v5.5.0 Construire 4030

Description : Avec la reconnaissance OCR et le package multilingue, la reconnaissance OCR prend en charge la reconnaissance du chinois et de l'anglais. Taille : 32,911 Mo

1) Reconnaissance de texte partielle : utilisez directement l'ocr du navigateur caj

Enregistrez le fichier d'impression au format MDI, puis ouvrez le fichier à l'aide de Microsoft Office Document Image. Sélectionnez « Utiliser l'OCR pour reconnaître le texte » dans le menu Outils pour identifier le contenu du texte. Une fois la reconnaissance terminée, sélectionnez « Envoyer le texte vers Word » dans le menu Outils pour exporter les résultats de la reconnaissance de l'intégralité du fichier PDF vers un fichier Word.

Remarque : Microsoft Office Document Image peut reconnaître et convertir le contenu chinois, anglais et tabulaire avec une grande précision. Cependant, il ne peut pas directement générer des graphiques dans un document Word. Au lieu de cela, il forme tous les graphiques du fichier en fichiers image indépendants et les place dans le même dossier portant le même nom de dossier que le fichier d'origine. Par conséquent, vous pouvez utiliser le logiciel Snagit pour ouvrir ces fichiers graphiques et les copier et coller dans Word. (Il convient de noter que tous les logiciels de reconnaissance ne peuvent pas bien gérer le problème de la reconnaissance de formes, et la méthode de traitement de Microsoft Office Document Image est déjà l'une des meilleures solutions pour résoudre ce problème à l'heure actuelle.)

Méthode rapide recommandée :

Avant d'extraire le texte des fichiers CAJ, les préparations suivantes sont requises : Tout d'abord, assurez-vous que le navigateur de fichiers CAJ 5.5 et Office2003 sont installés et que l'outil Office Microsoft Office Document Imaging est entièrement installé. Une fois l'installation terminée, vous verrez l'imprimante Microsoft Office Document Image Writer dans la liste des imprimantes. Avec Microsoft Office Document Image, vous pouvez reconnaître et convertir le contenu de documents chinois, anglais, de tableaux et autres avec une grande précision. Ces préparations peuvent garantir que vous pouvez extraire avec succès les informations textuelles dans le fichier CAJ.

Reconnaissance de fichiers CAJ :

(1) Tout d'abord, téléchargez le fichier de données au format CAJ depuis Internet et enregistrez-le sur votre disque dur local.

(2) Ensuite, démarrez le programme de navigation CAJViewer et ouvrez le fichier au format CAJ que vous venez d'enregistrer dans le programme. Après avoir parcouru le fichier jusqu'à la dernière page, ne fermez pas le programme de navigation CAJ.

(3) Dans la fenêtre du programme du navigateur CAJ, sélectionnez "Fichier" → "Imprimer" et sélectionnez l'imprimante comme imprimante Microsoft Office Document Image Writer, cochez l'option d'impression dans un fichier et déterminez le nombre de pages à imprimer.

(4) Enregistrez le fichier d'impression (*.prn) à l'emplacement approprié. Après avoir attendu la fin de l'impression, Microsoft Office Document Image ouvre automatiquement le fichier d'impression que vous venez d'enregistrer.

(5) Dans la fenêtre Microsoft Office Document Image, sélectionnez l'élément de menu « Sélectionner toutes les pages » dans le menu « Page », puis sélectionnez « Utiliser l'OCR pour reconnaître le texte » dans le menu « Outils » pour extraire le texte.

(6) Sélectionnez « Envoyer le texte vers Word » sous « Outils », et enfin l'intégralité de la reconnaissance du fichier CAJ sera sortie dans le fichier Word.

Comment réparer un document Word tronqué lors de son ouverture dans wps

Parfois, lorsque vous ouvrez un document Word, vous constaterez peut-être que le document est devenu un tas de caractères tronqués. Ne vous inquiétez pas, vous pouvez essayer les deux méthodes suivantes pour enregistrer vos fichiers.

1. Méthode de formatage de remplacement .heike123.com

Enregistrez le document Word endommagé dans un autre format.

1. Ouvrez le document endommagé et cliquez sur le menu « Fichier/Enregistrer sous ». Dans la liste « Type d'enregistrement », sélectionnez « Format RTF », puis cliquez sur le bouton « Enregistrer » et fermez Word.

2. Ouvrez le fichier au format RTF que vous venez d'enregistrer et utilisez à nouveau « Enregistrer sous » pour enregistrer le fichier en tant que « Document Word ». Ouvrez maintenant le fichier Word et vous constaterez que le fichier a été restauré.

Si le fichier ne peut toujours pas être récupéré après l'avoir converti au format RTF, vous pouvez à nouveau convertir le fichier au format texte brut (*.txt), puis le reconvertir au format Word. Bien entendu, les images et autres informations seront perdues lors de la conversion en fichiers txt.

Comment résoudre le problème des caractères tronqués lors de la conversion d'un PDF en document Word

Certains fichiers PDF seront tronqués lorsqu'ils seront convertis en documents Word. J'ai utilisé de nombreux logiciels de conversion, mais le texte est toujours tronqué. Afin de résoudre ce problème, j'ai utilisé la méthode stupide suivante :

1. Double-cliquez pour ouvrir le fichier PDF. Bien sûr, vous devez télécharger et installer le convertisseur PDF au préalable

.

2. Convertissez le texte chinois au format PDF en document Word modifiable : (dans le fichier PDF ouvert) cliquez sur : Fichier-Enregistrer sous, et après « Enregistrer sous le type », sélectionnez : « Fichier TXT (*.txt) ». , sélectionnez "Bureau" après "Enregistrer dans", cliquez sur "Enregistrer", ouvrez le document txt sur le bureau (du même nom que le PDF), sélectionnez le texte, copiez-le et collez-le dans le document Word.

3. Copiez les images du PDF dans le document Word. La méthode est la suivante : (dans le fichier PDF ouvert) cliquez sur : Outils-Instantané (si l'image est plus grande, veuillez cliquer sur l'outil "Réduire" dans la deuxième ligne jusqu'à ce que vous pouvez le voir sur l'image entière), sélectionnez l'image (appuyez et maintenez le bouton gauche de la souris dans le coin supérieur gauche de l'image, faites glisser vers le coin inférieur droit, une boîte en pointillé devrait apparaître à ce moment, relâchez le bouton. souris), puis cliquez sur le bouton approprié dans le document Word ouvert Coller en position (Ctrl+V).

4. À ce stade, vous pouvez modifier le texte du document Word comme vous le souhaitez. Bien sûr, les images qu'il contient ne peuvent être que formatées mais pas modifiées.

Les 2 ci-dessus peuvent également être effectués comme ceci : (dans le fichier PDF ouvert), cliquez sur : Outils-Visionneuse de texte (le texte dans le PDF est déjà sous forme de texte), puis cliquez avec le bouton droit sur "Sélectionner tout" - "Copier". au mot Cliquez simplement sur "Coller". Bien que cette méthode soit page par page, elle peut être similaire à la mise en page originale du document Word. Cliquez ensuite sur : Outils-Visionneuse de texte (vous pouvez également cliquer sur Alt+9 à plusieurs reprises) pour accéder à l'interface du lecteur PDF (ou à l'interface texte).

Étapes pour utiliser le convertisseur PDF en Word en ligne :

Première étape : Téléchargez le fichier PDF qui doit être converti. Cela montrera que le fichier que vous avez téléchargé a réussi.

Étape 2 : Attendez le traitement du serveur ;

Étape 3 : Téléchargez le document Word et enregistrez-le sur votre ordinateur.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Cet article est reproduit dans:. en cas de violation, veuillez contacter admin@php.cn Supprimer