首页  >  文章  >  web前端  >  如何使用 JavaScript 从 HTML 中提取纯文本?

如何使用 JavaScript 从 HTML 中提取纯文本?

Linda Hamilton
Linda Hamilton原创
2024-10-31 19:34:02379浏览

How to Extract Plain Text from HTML with JavaScript?

使用 JavaScript 删除 HTML 元素以进行纯文本提取

在处理 HTML 内容时,有些情况下您可能需要提取纯文本不带 HTML 元素标签的文本。 JavaScript 提供了一种便捷的方法来实现此目的。

问题陈述:

您有一个 HTML 文档,其中有一个按钮和包含在

中的文本。元素。单击该按钮后,您希望从该

文本中删除所有 HTML 元素标记。元素,仅保留纯文本。

解决方案:

要实现此目的,请使用 JavaScript 按照以下步骤操作:

<code class="javascript">function get_content() {
  // Get the element by its ID
  var element = document.getElementById('txt');

  // Extract the plain text using either innerText or textContent
  // Depending on the browser support and specific requirements, you can use either of these methods.
  var text = element.innerText || element.textContent;

  // Replace HTML elements with the pure text
  element.innerHTML = text;
}</code>

通过使用此函数,当用户单击该按钮时,

内的 HTML 标记将被显示。元素将被删除,只留下纯文本。

innerText 与 textContent:

innerText 和 textContent 之间的选择取决于您的要求。 insideText 模仿可见文本,包括任何空格、换行符和隐藏文本。另一方面,textContent 会去除所有格式或隐藏元素。

兼容性:

innerText 与旧版 IE 浏览器具有更好的兼容性,但可能不适合复杂的 HTML结构。建议使用 textContent 来实现跨浏览器的更稳健和一致的行为。

以上是如何使用 JavaScript 从 HTML 中提取纯文本?的详细内容。更多信息请关注PHP中文网其他相关文章!

声明:
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn