首页  >  文章  >  电脑教程  >  为什么使用pdf查看器打开的pdf文件都显示乱码呢?

为什么使用pdf查看器打开的pdf文件都显示乱码呢?

WBOY
WBOY转载
2024-01-17 16:18:051144浏览

为什么使用pdf查看器打开的pdf文件都显示乱码呢?

为什么使用pdf查看器打开的pdf文件都显示乱码呢??

我用的是CAJViewer

CAJViewer5.5_OCR v5.5.0 Build 4030

说明:带OCR识别,带多语言包,OCR识别支持中英文识别。 大小:32.911 MB

1)局部文字识别:直接使用caj浏览器的ocr

将打印文件保存为MDI格式,然后使用Microsoft Office Document Image打开该文件。在工具菜单下选择“使用OCR识别文本”来识别文本内容。完成识别后,在工具菜单下选择“将文本发送到Word”,将整个PDF文件的识别结果输出到Word文件中。

请注意:Microsoft Office Document Image可以非常准确地识别和转换中文、英文和表格内容。然而,它无法直接将图形输出到Word文档中,而是将文件中的所有图形单独形成独立的图片文件,并放置在同一文件夹中,文件夹名称与原文件相同。因此,您可以使用Snagit软件打开这些图形文件,并将其复制粘贴到Word中。(需要注意的是,所有的识别软件都无法很好地处理图形识别问题,Microsoft Office Document Image的处理方法已经是目前解决这个问题的最佳方案之一。)

推荐快速方法:

在从CAJ文件中提取文本之前,需要进行以下准备工作:首先,确保已安装CAJ文件浏览器5.5和Office2003,并完全安装Office工具Microsoft Office Document Imaging。安装完成后,您将在打印机列表中看到Microsoft Office Document Image Writer打印机。借助Microsoft Office Document Image,您可以高度准确地识别和转换中文、英文以及表格等文件内容。这些准备工作能够确保您成功提取CAJ文件中的文本信息。

CAJ文件的识别:

(一)首先,从网上下载CAJ格式的资料文件保存到本地硬盘上。

(二)然后,启动CAJViewer浏览器程序,并在该程序中打开刚才保存的CAJ格式的文件。浏览文件到最后一页后,不要关闭CAJ浏览器程序。

(三)在CAJ浏览器程序窗口中,选择“文件”→“打印”,并选择打印机为Microsoft Office Document Image Writer打印机,勾选打印到文件选项和确定打印页数。

(四)保存打印文件(*.prn)到适当位置。等待打印完成后,Microsoft Office Document Image 自动打开刚才保存的打印文件。

(五)在Microsoft Office Document Image窗口中,选择“页面”菜单中的“选择所有页面”菜单项,然后选择“工具”菜单中的“使用OCR识别文本”提取文本。

(六)选择“工具”下的 “将文本发送到word”,最后将把整个CAJ文件识别输出到word文件中。

wps打开word文档乱码怎么修复工具

有时候打开Word文档可能会看见文档变成了一堆乱码。不用着急,可以试着通过下面的两个方法来挽救你的文件。

一、替换格式法 .heike123.com

就是把损坏的Word文档存为另一种格式。

1、打开被损坏的文档单击“文件/另存为”菜单,在 “保存类型”列表中,选择“RTF格式”,然后单击“保存”按钮,并关闭word。

2、打开刚才保存的RTF格式文件,再次使用 “另存为”将文件重新保存为“Word文档”,现在打开这个word文件就可以发现文件已经被恢复过来了。

如果在转换成rtf格式后文件仍然不能被恢复,可以将文件再次转换为纯文本格式(*.txt),再转换回Word格式。当然在转换为txt文件的时候其图片等信息会丢失掉。

如何解决PDF转换成word文档时出现乱码

有的PDF文件转换成word文档时会出现乱码,我用了好多转换软件,结果文字还是乱码。为了解决这个问题,我用了如下的笨办法:

1、双击打开PDF文件,当然事先得下载并安装好PDF转换器

2、把PDF中文字转换成可编辑的word文档,方法是:(在打开的PDF文件中)点击:文件-另存为,在“保存类型”后选择:“TXT文件(*.txt)”,在“保存在”后选择“桌面”,点“保存”,打开桌面上的txt文档(与PDF同名),选择文本,复制,粘贴到word文档中。

3、把PDF中的图片复制到word文档中,方法是:(在打开的PDF文件中)点击:工具-快照(如果图片较大,请点击第二行的“缩小”工具,到可以看到全图为止),选中图片(在图片的左上角按住鼠标的左键,向右下角拖,这时应该有个虚线框出现,松开鼠标即可),在打开的word文档中的适当位置粘贴(Ctrl+V)。

4、这时你可以编辑word文档中的文字到你想要的,当然其中的图片只能设置格式不能进行编辑。

上述2也可以这样:(在打开的PDF文件中),点击:工具-文本查看器(PDF中的文字,已经是文本形式了),再右击“全选”-“复制”,到word中“粘贴”即可。此法虽是一页一页的,但在word文档中可跟原来的版式相似。再点击:工具-文本查看器(也可以反复点按Alt+9)进入PDF阅读器界面(或文本界面)。

在线PDF转换成Word转换器使用步骤:

第一步:上传需要转换的PDF文件,显示你上传的文件成功,点击生成word文档;

第二步:等待服务器处理;

第三步:下载word文档另存为自己的电脑上面。

以上是为什么使用pdf查看器打开的pdf文件都显示乱码呢?的详细内容。更多信息请关注PHP中文网其他相关文章!

声明:
本文转载于:docexcel.net。如有侵权,请联系admin@php.cn删除