ホームページ  >  記事  >  コンピューターのチュートリアル  >  pdfビューアでpdfファイルを開くと文字化けしてしまうのはなぜですか?

pdfビューアでpdfファイルを開くと文字化けしてしまうのはなぜですか?

WBOY
WBOY転載
2024-01-17 16:18:051144ブラウズ

pdfビューアでpdfファイルを開くと文字化けしてしまうのはなぜですか?

pdfビューアで開いたpdfファイルが文字化けしてしまうのはなぜですか?

CAJViewerを使用しています

CAJViewer5.5_OCR v5.5.0 ビルド 4030

説明: OCR 認識と多言語パッケージにより、OCR 認識は中国語と英語の認識をサポートします。サイズ: 32.911 MB

1) 部分テキスト認識: caj ブラウザの ocr を直接使用します

印刷ファイルを MDI 形式で保存し、Microsoft Office ドキュメント イメージを使用してファイルを開きます。テキストの内容を識別するには、[ツール] メニューの [OCR を使用してテキストを認識する] を選択します。認識完了後、ツールメニューの「テキストをWordに送信」を選択すると、PDFファイル全体の認識結果がWordファイルに出力されます。

注意: Microsoft Office Document Image は、中国語、英語、および表のコンテンツを非常に正確に認識して変換できます。ただし、グラフィックを Word 文書に直接出力することはできず、ファイル内のすべてのグラフィックを独立した画像ファイルとして作成し、元のファイルと同じフォルダー名で同じフォルダーに配置します。したがって、Snagit ソフトウェアを使用してこれらのグラフィック ファイルを開いてコピーし、Word に貼り付けることができます。 (すべての認識ソフトウェアはパターン認識の問題をうまく処理できるわけではなく、Microsoft Office Document Image の処理方法はすでにこの問題を解決する最良のソリューションの 1 つであることに注意してください。)

推奨される簡単な方法:

CAJ ファイルからテキストを抽出する前に、次の準備が必要です。まず、CAJ ファイル ブラウザ 5.5 と Office2003 がインストールされていること、および Office ツール Microsoft Office Document Imaging が完全にインストールされていることを確認します。インストールが完了すると、プリンター リストに Microsoft Office Document Image Writer プリンターが表示されます。 Microsoft Office Document Image を使用すると、中国語、英語、表、その他の文書コンテンツを高精度に認識して変換できます。これらの準備により、CAJ ファイル内のテキスト情報を正常に抽出できるようになります。

CAJ ファイルの識別:

(1) まず、CAJ 形式のデータファイルをインターネットからダウンロードし、ローカルのハードディスクに保存します。

(2) 次に、CAJViewer ブラウザプログラムを起動し、プログラム内に保存した CAJ 形式ファイルを開きます。ファイルを最後のページまで閲覧した後は、CAJ ブラウザ プログラムを閉じないでください。

(3) CAJ ブラウザ プログラム ウィンドウで、[ファイル] → [印刷] を選択し、Microsoft Office Document Image Writer プリンタとしてプリンタを選択し、ファイルに出力オプションをチェックして、印刷するページ数を決定します。

(4) 印刷ファイル (*.prn) を適切な場所に保存します。印刷が完了するのを待った後、Microsoft Office Document Image によって、保存したばかりの印刷ファイルが自動的に開きます。

(5) Microsoft Office ドキュメント イメージ ウィンドウで、[ページ] メニューの [すべてのページを選択] メニュー項目を選択し、[ツール] メニューで [OCR を使用してテキストを認識する] を選択してテキストを抽出します。

(6) 「ツール」の「テキストをワードに送信」を選択すると、最後にCAJファイル認識全体がワードファイルに出力されます。

wpsでWord文書を開いた時の文字化けを直す方法

Word 文書を開くと、文書が文字化けしている場合があります。心配しないで、次の 2 つの方法を試してファイルを保存してください。

1. 置換形式メソッド .heike123.com

破損した Word 文書を別の形式で保存します。

1. 破損した文書を開き、[ファイル/名前を付けて保存] メニューをクリックし、[保存の種類] リストで [RTF 形式] を選択し、[保存] ボタンをクリックして Word を閉じます。

2. 先ほど保存した RTF 形式のファイルを開き、再度「名前を付けて保存」を使用して「Word 文書」として保存し、Word ファイルを開くと、ファイルが復元されていることがわかります。

rtf 形式に変換してもファイルを復元できない場合は、ファイルを再度プレーン テキスト形式 (*.txt) に変換してから、Word 形式に戻すことができます。もちろん、txt ファイルに変換すると、写真やその他の情報は失われます。

PDFをWord文書に変換する際に文字化けが発生する問題を解決する方法

一部の PDF ファイルを Word 文書に変換すると文字化けが発生します。多くの変換ソフトを使用しましたが、結果は依然として文字化けのままです。この問題を解決するために、私は次の愚かな方法を使用しました:

1. ダブルクリックして PDF ファイルを開きます。もちろん、事前に PDF コンバーターをダウンロードしてインストールする必要があります

2. PDF 内の中国語テキストを編集可能な Word 文書に変換します。方法は次のとおりです: (開いた PDF ファイルで) [ファイル] - [名前を付けて保存] をクリックし、[ファイルの種類] の後に [TXT ファイル (*.txt)] を選択します。 )」を選択し、「保存する場所」の後に「デスクトップ」を選択し、「保存」をクリックし、デスクトップ上のtxt文書(PDFと同じ名前)を開き、テキストを選択してコピーし、ワード文書に貼り付けます。

3. PDF 内の画像を Word 文書にコピーします。方法は次のとおりです: (開いている PDF ファイルで) [ツール]-[スナップショット] をクリックします (画像が大きい場合は、2 行目の [縮小] ツールをクリックしてください)画像全体が表示されるまで)、画像を選択します (画像の左上隅でマウスの左ボタンを押したまま、右下隅までドラッグします。点線のボックスが表示されたらマウスを放します) 、開いている Word 文書内の所定の位置に貼り付けます (Ctrl V)。

4. この時点では、Word 文書内のテキストを必要に応じて編集できますが、当然ながら、文書内の画像は書式設定のみが可能であり、編集することはできません。

上記 2 は、次のように実行することもできます: (開いている PDF ファイルで)、[ツール]-[テキスト ビューアー] (PDF 内のテキストはすでにテキスト形式になっています) をクリックし、右クリックして [すべて選択]-"コピー」して、Word に「貼り付ける」だけです。この方法はページごとに行われますが、Word 文書の元のレイアウトと同様にすることができます。次に、[ツール]-[テキスト ビューア] をクリックして (Alt 9 を繰り返しクリックすることもできます)、PDF リーダー インターフェイス (またはテキスト インターフェイス) に入ります。

オンライン PDF to Word コンバーターを使用する手順:

ステップ 1: 変換する必要がある PDF ファイルをアップロードします。アップロードしたファイルが成功したことが表示されます。クリックして Word ドキュメントを生成します。

ステップ 2: サーバーの処理を待ちます;

ステップ 3: Word 文書をダウンロードして、コンピューターに保存します。

以上がpdfビューアでpdfファイルを開くと文字化けしてしまうのはなぜですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事はdocexcel.netで複製されています。侵害がある場合は、admin@php.cn までご連絡ください。