• 技术文章 >后端开发 >Python教程

    python怎么去除html标签

    藏色散人藏色散人2021-04-28 11:00:54原创453

    python去除html标签的方法:1、“pattern.sub('',html)”方法;2、“BeautifulSoup(html,'html.parser')”方法;3、“response.xpath('string(.)')”方法。

    本文操作环境:windows7系统、python3.6.4版,DELL G3电脑。

    python去除html标签的几种方法

    import re
    from bs4 import BeautifulSoup
    from lxml import etree
     
    html = '<p>你好</p><br/><font>哈哈</font><b>大家好</b>'
     
    # 方法一
    pattern = re.compile(r'<[^>]+>',re.S)
    result = pattern.sub('', html)
    print(result)
     <br># 方法二
    soup = BeautifulSoup(html,'html.parser')
    print(soup.get_text())
     
    # 方法三
    response = etree.HTML(text=html)
    # print(dir(response))
    print(response.xpath('string(.)'))
     
     
    # 你好哈哈大家好
    # 你好哈哈大家好
    # 你好哈哈大家好

    【推荐:python视频教程

    以上就是python怎么去除html标签的详细内容,更多请关注php中文网其它相关文章!

    声明:本文原创发布php中文网,转载请注明出处,感谢您的尊重!如有疑问,请联系admin@php.cn处理
    专题推荐:python
    上一篇:Python如何配置清华镜像源 下一篇:如何用爬虫破解滑动验证码
    线上培训班

    相关文章推荐

    • 详解python中的求和函数sum()• Python中如何求列表list的平均数• 一张图带你了解python• python如何修改Dataframe列名• Python如何配置清华镜像源

    全部评论我要评论

  • 取消发布评论发送
  • 1/1

    PHP中文网