cari
Rumahpembangunan bahagian belakangtutorial phpBagaimana untuk mengekstrak teks daripada Word, Excel, dan Fail PowerPoint dalam PHP?

How to Extract Text from Word, Excel, and PowerPoint Files in PHP?

Cara Mengekstrak Teks daripada Fail Word .doc, .docx, .xlsx, .pptx dalam PHP

Mengekstrak teks daripada dokumen Word yang dimuat naik adalah penting untuk tugas seperti mencari dalam dokumen, terutamanya dalam senario yang melibatkan CV/resume. Artikel ini menyediakan penyelesaian menyeluruh untuk masalah biasa ini.

Pengeluaran Fail Doc/Docx

Fail Doc/Docx ialah gumpalan binari. Untuk fail .doc, anda boleh menggunakan fungsi fopen, manakala untuk fail .docx, anda boleh menggunakan fungsi zip_open. Ini kerana fail docx pada asasnya ialah fail ZIP yang mengandungi fail XML.

Excel File Extraction

Untuk mengekstrak teks daripada fail XLSX, kami menumpukan pada fail XML tertentu, xl/sharedStrings.xml. Kami mengekstrak kandungan daripada fail ini dan menanggalkan teg HTML untuk teks biasa.

Pengeluaran Fail PowerPoint

Fail PPTX mengikut pendekatan yang sama. Kami mengulangi fail XML slaid, mengekstrak dan menggabungkan kandungannya.

Pelaksanaan Kelas

Kami menyediakan kelas PHP bernama DocxConversion yang merangkumi pengekstrakan ini kaedah. Kelas menerima laluan fail sebagai hujah dan mempunyai fungsi berikut:

  • read_doc(): Mengendalikan pengekstrakan fail .doc.
  • read_docx (): Mengendalikan pengekstrakan fail .docx.
  • xlsx_to_text(): Mengendalikan pengekstrakan fail .xlsx.
  • pptx_to_text(): Mengendalikan pengekstrakan fail .pptx.
  • convertToText(): Memilih kaedah pengekstrakan yang sesuai berdasarkan sambungan fail.

Penggunaan

Untuk menggunakan kelas ini, nyatakannya dengan laluan fail dan panggil kaedah convertToText(). Kaedah ini mengembalikan teks yang diekstrak sebagai rentetan.

Contoh:

$docObj = new DocxConversion("test.docx");
$docText = $docObj->convertToText();
echo $docText;

Skrip ini akan mengekstrak teks daripada fail .docx yang ditentukan dan memaparkannya.

Atas ialah kandungan terperinci Bagaimana untuk mengekstrak teks daripada Word, Excel, dan Fail PowerPoint dalam PHP?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn
Apakah perbezaan antara unset () dan session_destroy ()?Apakah perbezaan antara unset () dan session_destroy ()?May 04, 2025 am 12:19 AM

ThedifferenceBetweenUnset () andSession_destroy () isThatunset () clearsspecificSessionVariableswhileKeepingTheSessionActive, sedangkan assesion_destroy () terminatestheentiressies.1)

Apakah Sesi Sticky (Affinity Sesi) dalam konteks pengimbangan beban?Apakah Sesi Sticky (Affinity Sesi) dalam konteks pengimbangan beban?May 04, 2025 am 12:16 AM

StickySessionseSenseSerRequestSarerOutedTotheseServerForSessionDataConsistency.1) sessionentificationassignsuserverserversusingciesorurlmodifications.2) consistentroutingdirectssubsequentrequeststotheserver.3) loadbalansingdistributesNewuser

Apakah sesi yang berbeza menyimpan pengendali yang terdapat di PHP?Apakah sesi yang berbeza menyimpan pengendali yang terdapat di PHP?May 04, 2025 am 12:14 AM

Phpoffersvarioussessionsavehandlers: 1) Fail: lalai, SimpleButmayBottLeneckonHigh-Trafficsites.2) Memcached: berprestasi tinggi, idealforspeed-kritikalapplications.3) Redis: similartomemcached

Apakah sesi dalam PHP, dan mengapa mereka digunakan?Apakah sesi dalam PHP, dan mengapa mereka digunakan?May 04, 2025 am 12:12 AM

Sesi dalam PHP adalah mekanisme untuk menyimpan data pengguna di sisi pelayan untuk mengekalkan keadaan antara pelbagai permintaan. Khususnya, 1) sesi dimulakan oleh fungsi session_start (), dan data disimpan dan dibaca melalui array super global $ _Session; 2) data sesi disimpan dalam fail sementara pelayan secara lalai, tetapi boleh dioptimumkan melalui pangkalan data atau storan memori; 3) Sesi ini boleh digunakan untuk merealisasikan fungsi pengesan status pengguna dan fungsi keranjang belanja; 4) Perhatikan pengoptimuman penghantaran dan prestasi yang selamat bagi sesi untuk memastikan keselamatan dan kecekapan permohonan.

Terangkan kitaran hayat sesi PHP.Terangkan kitaran hayat sesi PHP.May 04, 2025 am 12:04 AM

PHPSSsionsStartWithSesion_start (), yang manageneratesauniqueidAndreateSererVerVerFile; tHePersisTacrossRequestSandCanBeManualEltersenedWithSession_destroy ()

Apakah perbezaan antara masa tamat sesi mutlak dan terbiar?Apakah perbezaan antara masa tamat sesi mutlak dan terbiar?May 03, 2025 am 12:21 AM

Timeout sesi mutlak bermula pada masa penciptaan sesi, sementara waktu tamat sesi terbiar bermula pada masa operasi pengguna. Tamat masa sesi mutlak sesuai untuk senario di mana kawalan ketat kitaran hayat sesi diperlukan, seperti aplikasi kewangan; Timeout sesi terbiar sesuai untuk aplikasi yang mahu pengguna menyimpan sesi mereka aktif untuk masa yang lama, seperti media sosial.

Apakah langkah yang akan anda ambil jika sesi tidak berfungsi di pelayan anda?Apakah langkah yang akan anda ambil jika sesi tidak berfungsi di pelayan anda?May 03, 2025 am 12:19 AM

Kegagalan sesi pelayan boleh diselesaikan dengan mengikuti langkah -langkah: 1. Semak konfigurasi pelayan untuk memastikan sesi ditetapkan dengan betul. 2. Sahkan kuki klien, sahkan bahawa penyemak imbas menyokongnya dan hantar dengan betul. 3. Periksa perkhidmatan penyimpanan sesi, seperti Redis, untuk memastikan bahawa mereka beroperasi secara normal. 4. Semak kod aplikasi untuk memastikan logik sesi yang betul. Melalui langkah -langkah ini, masalah perbualan dapat didiagnosis dengan berkesan dan diperbaiki dan pengalaman pengguna dapat diperbaiki.

Apakah kepentingan fungsi session_start ()?Apakah kepentingan fungsi session_start ()?May 03, 2025 am 12:18 AM

session_start () iscrucialinphpformanaginguserSessions.1) itinitiatesanewsessionifnoneexists, 2) resumeSanexistingsession, dan3) setSasessionCookieforcontinuityAcrossrequests, enableingApplicationeUseUshenticationandPersonalConizedConizedContentContentContentContentContentContentContentContentContentContentContentC.

See all articles

Alat AI Hot

Undresser.AI Undress

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Clothoff.io

Penyingkiran pakaian AI

Video Face Swap

Video Face Swap

Tukar muka dalam mana-mana video dengan mudah menggunakan alat tukar muka AI percuma kami!

Alat panas

SublimeText3 Linux versi baharu

SublimeText3 Linux versi baharu

SublimeText3 Linux versi terkini

Hantar Studio 13.0.1

Hantar Studio 13.0.1

Persekitaran pembangunan bersepadu PHP yang berkuasa

PhpStorm versi Mac

PhpStorm versi Mac

Alat pembangunan bersepadu PHP profesional terkini (2018.2.1).

mPDF

mPDF

mPDF ialah perpustakaan PHP yang boleh menjana fail PDF daripada HTML yang dikodkan UTF-8. Pengarang asal, Ian Back, menulis mPDF untuk mengeluarkan fail PDF "dengan cepat" dari tapak webnya dan mengendalikan bahasa yang berbeza. Ia lebih perlahan dan menghasilkan fail yang lebih besar apabila menggunakan fon Unicode daripada skrip asal seperti HTML2FPDF, tetapi menyokong gaya CSS dsb. dan mempunyai banyak peningkatan. Menyokong hampir semua bahasa, termasuk RTL (Arab dan Ibrani) dan CJK (Cina, Jepun dan Korea). Menyokong elemen peringkat blok bersarang (seperti P, DIV),

Muat turun versi mac editor Atom

Muat turun versi mac editor Atom

Editor sumber terbuka yang paling popular