使用 JavaScript 删除 HTML 元素以进行纯文本提取
在处理 HTML 内容时,有些情况下您可能需要提取纯文本不带 HTML 元素标签的文本。 JavaScript 提供了一种便捷的方法来实现此目的。
问题陈述:
您有一个 HTML 文档,其中有一个按钮和包含在
中的文本。元素。单击该按钮后,您希望从该
文本中删除所有 HTML 元素标记。元素,仅保留纯文本。
解决方案:
要实现此目的,请使用 JavaScript 按照以下步骤操作:
<code class="javascript">function get_content() { // Get the element by its ID var element = document.getElementById('txt'); // Extract the plain text using either innerText or textContent // Depending on the browser support and specific requirements, you can use either of these methods. var text = element.innerText || element.textContent; // Replace HTML elements with the pure text element.innerHTML = text; }</code>
通过使用此函数,当用户单击该按钮时,
内的 HTML 标记将被显示。元素将被删除,只留下纯文本。
innerText 与 textContent:
innerText 和 textContent 之间的选择取决于您的要求。 insideText 模仿可见文本,包括任何空格、换行符和隐藏文本。另一方面,textContent 会去除所有格式或隐藏元素。
兼容性:
innerText 与旧版 IE 浏览器具有更好的兼容性,但可能不适合复杂的 HTML结构。建议使用 textContent 来实现跨浏览器的更稳健和一致的行为。
以上是如何使用 JavaScript 从 HTML 中提取纯文本?的详细内容。更多信息请关注PHP中文网其他相关文章!