Rumah  >  Artikel  >  pembangunan bahagian belakang  >  Bagaimana untuk menyelesaikan masalah aksara Cina yang kacau dalam perkataan membaca PHP

Bagaimana untuk menyelesaikan masalah aksara Cina yang kacau dalam perkataan membaca PHP

藏色散人
藏色散人asal
2021-12-09 09:50:032933semak imbas

Penyelesaian kepada PHP membaca aksara Cina yang kacau dalam perkataan: 1. Semak versi PHP 2. Ubah suai php.ini dan mulakan semula pelayan 3. Lulus "iconv('GB2312', 'UTF-8', $test );" Selesaikan sahaja masalah aksara bercelaru semasa proses membaca.

Bagaimana untuk menyelesaikan masalah aksara Cina yang kacau dalam perkataan membaca PHP

Persekitaran pengendalian artikel ini: sistem Windows 7, PHP versi 7.4, komputer Dell G3.

Bagaimana untuk menyelesaikan masalah aksara Cina yang kacau apabila PHP membaca perkataan?

Apabila php membaca fail perkataan, aksara bercelaru Bagaimana cara menyelesaikannya?

1 Mula-mula, sahkan versi php, sebaik-baiknya lebih tinggi daripada 5.6

2 Sambungan com

// 将以下两行代码放入php.ini中, 并且重启服务器
// 开启扩展
extension=php_com_dotnet.dll
// COM扩展里自带的,只需将前面的;去掉就可以了
com.allow_dcom = true

3. Kodnya adalah seperti berikut:

    public function readWord($url)
    {
        $word = new COM("word.application") or die("Unable to instantiate Word");

        // 打开路径为URL的word,doc或docx都可以
        $word->Documents->OPen($url);

        // 读取内容
        $test= $word->ActiveDocument->content->Text;

        // 统计字数
        // $num = strlen($test);

        // 解决读取过程中乱码问题
        $content= iconv('GB2312', 'UTF-8', $test);

        // 查看版本
        // $word_wersion = $word->Version;

        // 是否要打开文件,0代表否,1代表是
        $word->Visible = 0;

        // 关闭word句柄
        $word->Quit();

        // 释放对象
        $word = null;

        return [
            // 'num' => $num / 2,
            // 'word_wersion' => $wordWersion,
            'content' => $content
        ];
    }

Nota:

Soalan 1:

Ada tempat di url fail yang memerlukan perhatian , iaitu, url yang anda masukkan mestilah bukan alamat mutlak, seperti D:WWW Ia mestilah alamat penghalaan rangka kerja anda sendiri, seperti localhost/..., jika tidak, ralat akan berlaku, kerana alamat mutlak digunakan untuk membaca kandungan perkataan Ia hanya boleh dibaca sekali, kemudian perkataan itu akan dikunci, dan kemudian ia tidak boleh dibaca.

Soalan 2:

Walaupun menggunakan kaedah ini menyelesaikan masalah membaca kandungan Word yang bercelaru, ia hanya terhad kepada membaca Word teks biasa, dan ia tidak mempunyai gaya. Jika anda perlu mendapatkan kandungan dokumen Word termasuk gaya, gambar, fon, dsb., kaedah ini tidak sesuai.

Cara kami menanganinya adalah dengan Aspos. Saya membuat perkhidmatan peringkat bawah menggunakan Java untuk menukar dokumen Word yang dimuat naik ke dalam format HTML Jika terdapat gambar dalam dokumen, gambar akan diekstrak ke direktori tahap yang sama selepas penukaran dan <img> akan ditinggalkan dalam HTML yang dijana. fail. Dengan cara ini, fon dan gaya dalam dokumen Word menjadi kod HTML, mengekalkan gaya dokumen asal sepenuhnya.

Pembelajaran yang disyorkan: "Tutorial Video PHP"

Atas ialah kandungan terperinci Bagaimana untuk menyelesaikan masalah aksara Cina yang kacau dalam perkataan membaca PHP. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn