docx ファイルの読み取り
docx ファイルは実際には多数の XML ファイルで構成されており、その内容はワード/ドキュメント内に存在します。 .xml が入っています。
docx ファイルを見つけて、zip ファイルを使用して開きます (または、docx サフィックス名を zip に変更して解凍します) (推奨学習: PHP ビデオ チュートリアル )
Word ディレクトリに document.xml があり、docx ファイルの内容が document.xml に存在します。このファイルを読み取るだけです。
コードは次のとおりです。次のように:
function parseWord($file) { $content = ""; $zip = new ZipArchive ( ); if ($zip->open ($file) === TRUE ) { for($i = 0; $i < $zip->numFiles; $i ++) { $entry = $zip->getNameIndex ( $i ); if (pathinfo ($entry,PATHINFO_BASENAME) == "document.xml") { $zip->extractTo (pathinfo ($file, PATHINFO_DIRNAME ) . "/" . pathinfo ($file, PATHINFO_FILENAME ), array ( $entry ) ); $filepath = pathinfo ($file, PATHINFO_DIRNAME ) . "/" . pathinfo ( $file, PATHINFO_FILENAME ) . "/" . $entry; $content = strip_tags ( file_get_contents ( $filepath ) ); break; } } $zip->close (); return $content; } else { echo 'no'; } }
注目に値します:
最初の $file ファイルを現在のコードと同じディレクトリ ファイルに置くことはできません。$file は別のフォルダーに保存されます
以上がPHP を使用して docx のコンテンツを取得する方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。