1. ダウンロード
まずは情報をダウンロードしましょう。
中国語に変換する必要がない場合は、xpdf-bin-linux-3.03.tar をダウンロードするだけです。中国語に変換する必要がある場合でも、xpdf-chinese-simplified が必要です。 tar
2. インストール
ダウンロードが完了したので、インストールできます。
[root@localhost ~]# mkdir -p /lcf/upan
[root@localhost ~]# mkdir -p /lcf/cdrom
[root@localhost ~]# mkdir -p /lcf/ xpdf
[root@localhost ~]# cd /lcf/upan/
[root@localhost upan]# cp xpdf/* ../xpdf/ (ダウンロードしたファイルは /lcf/xpdf ディレクトリに配置されます)
[root@localhost upan]# cd ../xpdf/
[root@localhost xpdf]# tar -zxvf xpdfbin-linux-3.03.tar.gz
[root@localhost xpdf]# cd xpdfbin -linux -3.03
[root@localhost xpdfbin-linux-3.03]# cat INSTALL
[root@localhost xpdfbin-linux-3.03]# cd bin32/
[root@localhost bin32]# cp ./ * / usr/local/bin/
[root@localhost bin32]# cd ../doc/
[root@localhost doc]# mkdir -p /usr/local/man/man1
[root @localhost doc]# mkdir -p /usr/local/man/man5
[root@localhost doc]# cp *.1 /usr/local/man/man1
[root@localhost doc]# cp * .5 /usr/local/man/man5
中国語を読む必要がない場合は、ここで終了できます。必要な場合は続けてください。
[root@localhost doc]# cp sample-xpdfrc /usr /local/etc/xpdfrc
[root@localhost xpdf]# cd /lcf/xpdf
[root@localhost xpdf]# tar -zxvf xpdf-chinese-simplified.tar.gz
[root @localhost xpdf]# cd xpdf-簡体字中国語
[root@localhost xpdf]# mkdir -p/usr/local/share/xpdf/簡体字中国語
[root@localhost xpdf]# cd xpdf-中国語-simplified /
[root@localhost xpdf-chinese-simplified]# cp Adobe-GB1.cidToUnicode ISO-2022-CN.unicodeMap EUC-CN.unicodeMap GBK.unicodeMap CMAP /usr/local/share/xpdf/chinese- simplified/
add-to-xpdfrc ファイルの内容を簡体字中国語で /usr/local/etc/xpdfrc ファイルにコピーします。内部のパスは正しい必要があることに注意してください。 (ここでの簡体字中国語パッケージには ISO-2022-CN、EUC-CN、GBK の 3 つの形式が含まれていることに注意してください。UTF-8 はサポートされていないことをよく見てください。最初に GBK に変換してからエスケープできます)
3. 機能の実装
この時点で、すべての設定が完了し、使用を開始します。
単純な PDF の読み取りの場合は、次のステートメントを使用します。
$content =shell_exec('/usr/local/bin/pdftotext '.$filename.' -');
中国語に変換する必要がある場合は、次のようなパラメータを追加します。
$content =shell_exec('/usr/local/bin/pdftotext -layout -enc GBK '.$filename.' -');
もちろん、パラメータを追加しても英語の変換には影響しません。ご自由にお使いください。ここで転送されるのは GBK エンコードであることに注意してください。現在、多くの Web サイトでは文字化けを回避したい場合は、UTF-8 を再度エスケープする必要があります。
$content = mb_convert_encoding($content, 'UTF-8','GBK');
これで作業は完了です。読み取ったコンテンツをどのように使用し、それを処理するコードを作成しますか。
最後に、全員用の pdftotext のパラメータの説明を追加します。
主なパラメータは次のとおりです:
オプション
次のオプションの多くは、構成ファイル コマンドで設定できます。
これらは角括弧内にリストされています。
対応するコマンド ライン オプションの説明を付けます。
-f 数値
変換する最初のページを指定します。
変換する最後のページを指定します。
テキストの元の物理レイアウトを (可能な限り) 維持します。デフォルトでは、物理レイアウト (列、
ハイフネーションなど) を「元に戻し」、テキストを読み上げ順に出力します。 🎜>- 固定数値
指定された文字幅 (ポイント単位) の固定ピッチ (または表形式) テキストを想定します。
-raw テキストをコンテンツ ストリームに保持します。これは物理レイアウト モードを強制します。
列の書式設定などを頻繁に「元に戻す」ハックです。
-htmlmeta
単純な HTML ファイルを生成します。
これは、テキストを
で囲み、<br>-enc エンコーディング名<br> を先頭に追加します。 <br>

ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

AI Hentai Generator
AIヘンタイを無料で生成します。

人気の記事

ホットツール

SublimeText3 中国語版
中国語版、とても使いやすい

AtomエディタMac版ダウンロード
最も人気のあるオープンソースエディター

VSCode Windows 64 ビットのダウンロード
Microsoft によって発売された無料で強力な IDE エディター

ゼンドスタジオ 13.0.1
強力な PHP 統合開発環境

DVWA
Damn Vulnerable Web App (DVWA) は、非常に脆弱な PHP/MySQL Web アプリケーションです。その主な目的は、セキュリティ専門家が法的環境でスキルとツールをテストするのに役立ち、Web 開発者が Web アプリケーションを保護するプロセスをより深く理解できるようにし、教師/生徒が教室環境で Web アプリケーションを教え/学習できるようにすることです。安全。 DVWA の目標は、シンプルでわかりやすいインターフェイスを通じて、さまざまな難易度で最も一般的な Web 脆弱性のいくつかを実践することです。このソフトウェアは、
