從 HTML 檔案中提取文字的行為本質上相當於將網站內容複製並貼上到記事本上。這聽起來可能很簡單,但如果您必須從數百萬個 HTML 檔案(網頁)中提取文本,那就不會那麼令人愉快了。
讓我們深入研究本文,以便更好地了解如何從文字格式的 HTML 標籤中提取文字。
從 HTML 標記中提取文字
HTML 中的許多元素可用於賦予文字特定的意義。為了獲得更多關於從文字格式的 HTML 標籤中提取文字的想法,讓我們看看以下範例。
範例
在以下範例中,我們執行腳本以從 HTML 標記中提取文字。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 | <!DOCTYPE html>
<html>
<body>
<script>
function gettext(html){
var tempDivElement = document.createElement( "div" );
tempDivElement.innerHTML = html;
return tempDivElement.textContent || tempDivElement.innerText || "" ;
}
var sentence= "<div><h1>Welcome to Tutorialspoint</h1></div>" ;
document.write(gettext(sentence));
</script>
</body>
</html>
|
登入後複製
當腳本執行時,它將產生由從上述腳本獲取的資料組成的輸出,並將其顯示在網頁上。
範例
考慮以下範例,我們正在執行腳本以從 HTML 標記取得文字。
1 2 3 4 5 6 7 8 9 10 | <!DOCTYPE html>
<html>
<body>
<script>
var statement= "<div><h1>TutorialsPoint</h1><p> is the Best E-Learning</p></div>" ;
var result = statement.replace(/<[^>]+>/g, '' );
document.write(result)
</script>
</body>
</html>
|
登入後複製
在執行上述腳本時,將彈出輸出窗口,其中包含透過執行網頁上顯示的腳本提取的文字。
以上是如何以文字格式從HTML標籤中擷取文字?的詳細內容。更多資訊請關注PHP中文網其他相關文章!