Rumah  >  Artikel  >  hujung hadapan web  >  Tukar fail HTML kepada format TXT

Tukar fail HTML kepada format TXT

王林
王林asal
2024-02-18 13:23:261277semak imbas

Tukar fail HTML kepada format TXT

HTML ke TXT: Contoh Kod

HTML ialah bahasa penanda yang digunakan untuk membuat halaman web, manakala fail TXT ialah format fail teks biasa. Kadangkala kita mungkin perlu menukar fail HTML kepada format TXT untuk digunakan dalam senario tertentu. Artikel ini akan memperkenalkan anda cara menukar HTML kepada TXT dan memberikan contoh kod khusus.

1. Gunakan Python untuk menukar HTML kepada TXT

Python ialah bahasa pengaturcaraan yang digunakan secara meluas dengan banyak perpustakaan dan alatan yang boleh menukar HTML kepada TXT dengan mudah. Berikut ialah contoh kod yang menggunakan Python untuk menukar fail HTML kepada fail TXT:

from bs4 import BeautifulSoup

def html_to_txt(html_file, txt_file):
    with open(html_file, 'r') as file:
        html_content = file.read()

    soup = BeautifulSoup(html_content, 'html.parser')
    txt_content = soup.get_text()

    with open(txt_file, 'w') as file:
        file.write(txt_content)

html_to_txt('example.html', 'example.txt')

Kod di atas menggunakan pustaka pihak ketiga BeautifulSoup untuk menghuraikan fail HTML. Mula-mula, buka fail TXT dalam mod tulis melalui fungsi open()函数读取HTML文件中的内容,并使用BeautifulSoup库进行解析。然后,使用soup.get_text()方法从解析后的HTML中提取纯文本内容。最后,使用open() dan tulis kandungan teks biasa yang diekstrak ke dalam fail.

2. Gunakan alatan dalam talian untuk menukar HTML kepada TXT

Jika anda tidak biasa dengan pengaturcaraan atau tidak mahu menggunakan Python untuk melaksanakan operasi HTML kepada TXT, anda juga boleh menggunakan alatan dalam talian untuk penukaran. Berikut ialah dua alat HTML ke TXT dalam talian yang biasa digunakan:

  1. [https://www.html-to-txt.com/](https://www.html-to-txt.com/)
  2. [ https://www.aconvert.com/cn/document/html-to-txt/](https://www.aconvert.com/cn/document/html-to-txt/)

Gunakan alatan dalam talian ini , anda hanya perlu memuat naik fail HTML ke tapak web dan klik butang tukar untuk menukar fail HTML kepada format TXT.

Ringkasan:

Artikel ini memperkenalkan dua kaedah menukar HTML kepada TXT: pengaturcaraan dalam Python dan menggunakan alatan dalam talian. Jika anda biasa dengan pengaturcaraan Python atau mempunyai keperluan yang berkaitan, anda boleh menggunakan kaedah dalam contoh kod untuk menukar. Jika anda baru dalam pengaturcaraan atau hanya perlu menukar sekali-sekala, anda boleh cuba menggunakan alatan dalam talian. Tidak kira kaedah yang anda gunakan, anda boleh menukar fail HTML kepada format TXT dengan mudah untuk memenuhi keperluan yang berbeza.

Atas ialah kandungan terperinci Tukar fail HTML kepada format TXT. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn