首頁  >  文章  >  後端開發  >  Golang html.Parse重寫href查詢字串以包含&

Golang html.Parse重寫href查詢字串以包含&

王林
王林轉載
2024-02-09 23:42:081161瀏覽

Golang html.Parse重写href查询字符串以包含&

php小編子墨在這裡為大家介紹一個有關Golang的小技巧。在使用html.Parse解析HTML時,有時我們需要重寫href的查詢字串,以包含&符號。這個技巧可以幫助我們在處理HTML連結時更有彈性方便,提升開發效率。接下來,我們將詳細講解如何使用該技巧,並且給出範例程式碼,希望對大家有所幫助。

問題內容

我有以下程式碼:

package main

import (
    "os"
    "strings"

    "golang.org/x/net/html"
)

func main() {
    myhtmldocument := `<!doctype html>
<html>
<head>
</head>
<body>
    <a href="http://www.example.com/input?foo=bar&baz=quux">wtf</a>
</body>
</html>`

    doc, _ := html.parse(strings.newreader(myhtmldocument))
    html.render(os.stdout, doc)
}

html.render 函數產生以下輸出:

<!DOCTYPE html><html><head>

</head>
<body>
    <a href="http://www.example.com/input?foo=bar&baz=quux">WTF</a>

</body></html>

為什麼要重寫查詢字串並將 & 轉換為 & (在 bar 和 baz 之間)?

有辦法避免這種行為嗎?

我正在嘗試進行模板轉換,但我不希望它破壞我的網址。

解決方法

html.parse 想要產生有效的html,並且html 規範規定href 屬性中的與號碼必須進行編碼。

https://www.w3.org/tr/xhtml1/guidelines .html#c_12

在 sgml 和 xml 中,與字元(“&”)聲明實體引用的開始(例如,® 表示註冊商標符號“®”)。不幸的是,許多 html 使用者代理程式都默默地忽略了 html 文件中 & 符號的錯誤用法 - 將看起來不像實體引用的 & 符號視為文字 & 符號。基於 xml 的使用者代理程式不會容忍這種不正確的使用,並且任何錯誤使用 & 符號的文檔都將不是“有效的”,因此將不符合此規範。為了確保文件與歷史 html 使用者代理程式和基於 xml 的使用者代理程式相容,文件中使用的被視為文字字元的 & 符號必須將其自身表示為實體引用(例如「&」)。 例如,a元素的href屬性引用帶參數的cgi腳本時,必須表示為http://my.site.dom/cgi-bin/myscript.pl?class=guest& name=user 而不是http://my.site.dom/cgi-bin/myscript.pl?class=guest&name=user

在這種情況下,go 實際上使您的 html 更好、更有效

話雖這麼說- 瀏覽器將對其進行轉義,因此如果單擊它,生成的url 仍然是正確的(沒有&,只有&

console.log(document.queryselector('a').href)
 <a href="http://www.example.com/input?foo=bar&baz=quux">WTF</a>

以上是Golang html.Parse重寫href查詢字串以包含&的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文轉載於:stackoverflow.com。如有侵權,請聯絡admin@php.cn刪除