>  기사  >  백엔드 개발  >  怎样在富文本中给一些过滤条件得到纯文本?

怎样在富文本中给一些过滤条件得到纯文本?

WBOY
WBOY원래의
2016-06-06 20:40:081066검색

比如一个含html标签的长文章中得到400个字符文本,过滤内容条件是,只留下:<code>超链接,<code><code>标签,<code>加粗标签,<code>斜体标签。
剩下的标签只留下纯文本。
删除换行符和img标签。见到两个空格以上替换为一个空格。
400个字符内如果<code><code>,加粗,斜体标签没有闭合的情况下 过滤剩下的内容闭合标签。
400个字符内如果超链接没有闭合 等到超链接闭合完结束。
网上找了好多示例都不符合。所以在sf上提问了。希望别删除问题。望有能力的编程师给予帮助。

回复内容:

比如一个含html标签的长文章中得到400个字符文本,过滤内容条件是,只留下:<code>超链接,<code><code>标签,<code>加粗标签,<code>斜体标签。
剩下的标签只留下纯文本。
删除换行符和img标签。见到两个空格以上替换为一个空格。
400个字符内如果<code><code>,加粗,斜体标签没有闭合的情况下 过滤剩下的内容闭合标签。
400个字符内如果超链接没有闭合 等到超链接闭合完结束。
网上找了好多示例都不符合。所以在sf上提问了。希望别删除问题。望有能力的编程师给予帮助。

目测要写正则根据条件分别匹配替换了。
建议先找个正则的教程看一遍,然后把需求拆成多个步骤,各个击破吧。

更新:

解决题主的需求除了字符串处理,其实也可以理解为对 DOM 的处理,用 js 来处理 DOM 更合适。

以前用过simple_html_dom这个库 ,可以像jquery一样操作html,希望对你有用

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.