ホームページ  >  記事  >  バックエンド開発  >  PHP を使用して docx のコンテンツを取得する方法

PHP を使用して docx のコンテンツを取得する方法

(*-*)浩
(*-*)浩オリジナル
2019-09-04 14:09:374471ブラウズ

PHP を使用して docx のコンテンツを取得する方法

docx ファイルの読み取り

docx ファイルは実際には多数の XML ファイルで構成されており、その内容はワード/ドキュメント内に存在します。 .xml が入っています。

docx ファイルを見つけて、zip ファイルを使用して開きます (または、docx サフィックス名を zip に変更して解凍します) (推奨学習: PHP ビデオ チュートリアル )

Word ディレクトリに document.xml があり、docx ファイルの内容が document.xml に存在します。このファイルを読み取るだけです。

コードは次のとおりです。次のように:

function parseWord($file) {
    $content = "";
    $zip = new ZipArchive ( );
    if ($zip->open ($file) === TRUE ) { 
        for($i = 0; $i < $zip->numFiles; $i ++) {
            $entry = $zip->getNameIndex ( $i ); 
            if (pathinfo ($entry,PATHINFO_BASENAME) == "document.xml") { 
                $zip->extractTo (pathinfo ($file, PATHINFO_DIRNAME ) . "/" . pathinfo ($file, PATHINFO_FILENAME ), array (
                        $entry
                ) );
                $filepath = pathinfo ($file, PATHINFO_DIRNAME ) . "/" . pathinfo ( $file, PATHINFO_FILENAME ) . "/" . $entry; 
                $content = strip_tags ( file_get_contents ( $filepath ) );
                break;
            }
        }
        $zip->close ();
         return $content;
    } else {
        echo &#39;no&#39;;
    }
}

注目に値します:

最初の $file ファイルを現在のコードと同じディレクトリ ファイルに置くことはできません。$file は別のフォルダーに保存されます

以上がPHP を使用して docx のコンテンツを取得する方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。