ホームページ  >  記事  >  バックエンド開発  >  PythonはHTMLタグを削除します

PythonはHTMLタグを削除します

高洛峰
高洛峰オリジナル
2016-10-18 10:20:181500ブラウズ

Python は HTML タグを削除します。自分で書いたものです。不備があれば修正してください:

#! /usr/bin/env python
#coding=utf-8
# blueel 2013-01-19
from HTMLParser import HTMLParser
  
class MLStripper(HTMLParser):
    def __init__(self):
        self.reset()
        self.fed = []
    def handle_data(self, d):
        self.fed.append(d)
    def get_data(self):
        return ''.join(self.fed)
  
def strip_tags(html):
    s = MLStripper()
    s.feed(html)
    return s.get_data()

Call:

html = 'ou X de sem juros'


printstrip_tags(html)


声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。