Rumah  >  Artikel  >  pembangunan bahagian belakang  >  PHP怎么获取docx里面内容

PHP怎么获取docx里面内容

(*-*)浩
(*-*)浩asal
2019-09-04 14:09:374485semak imbas

PHP怎么获取docx里面内容

docx文件的读取

docx文件其实是由很多XML文件组成,其中内容就存在于word/document.xml里面。

我们找到一个docx文件,使用zip文件打开(或者把docx后缀名改为zip,然后解压)(推荐学习:PHP视频教程

在word目录下有document.xml,docx文件的内容就存在于document.xml里面,我们读取这个文件就可以了.

代码如下:

function parseWord($file) {
    $content = "";
    $zip = new ZipArchive ( );
    if ($zip->open ($file) === TRUE ) { 
        for($i = 0; $i < $zip->numFiles; $i ++) {
            $entry = $zip->getNameIndex ( $i ); 
            if (pathinfo ($entry,PATHINFO_BASENAME) == "document.xml") { 
                $zip->extractTo (pathinfo ($file, PATHINFO_DIRNAME ) . "/" . pathinfo ($file, PATHINFO_FILENAME ), array (
                        $entry
                ) );
                $filepath = pathinfo ($file, PATHINFO_DIRNAME ) . "/" . pathinfo ( $file, PATHINFO_FILENAME ) . "/" . $entry; 
                $content = strip_tags ( file_get_contents ( $filepath ) );
                break;
            }
        }
        $zip->close ();
         return $content;
    } else {
        echo &#39;no&#39;;
    }
}

值得注意的是:

第一 $file文件不能与当前代码在同一目录文件下,$file存放在单独的文件夹

Atas ialah kandungan terperinci PHP怎么获取docx里面内容. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn