首頁 >後端開發 >Python教學 >python去除html標籤

python去除html標籤

高洛峰
高洛峰原創
2016-10-18 10:20:181564瀏覽

python去除html標籤,自己寫的,若有不足請指正:

#! /usr/bin/env python
#coding=utf-8
# blueel 2013-01-19
from HTMLParser import HTMLParser
  
class MLStripper(HTMLParser):
    def __init__(self):
        self.reset()
        self.fed = []
    def handle_data(self, d):
        self.fed.append(d)
    def get_data(self):
        return ''.join(self.fed)
  
def strip_tags(html):
    s = MLStripper()
    s.feed(html)
    return s.get_data()

   

調用:

html = ' sem jurosprint strip_tags(html)

陳述:
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn