網頁編碼英文譯為web page encoding,是在網頁中指定其特定的字元編碼格式的函式庫。
GBK是國家標準GB2312基礎上擴容後相容GB2312的標準。 GBK的文字編碼是用雙字節來表示的,即不論中、英文字符均使用雙字節來表示,為了區分中文,將其最高位都設定成1。 GBK包含全部中文字符,是國家編碼,通用性比UTF8差,不過UTF8佔用的資料庫比GBK大。
UTF-8:Unicode TransformationFormat-8bit,允許含BOM,但通常不含BOM。是用以解國際上字元的一種多位元組編碼,它對英文使用8位元(即一個位元組),中文使用24為(三個位元組)來編碼。 UTF-8包含全世界所有國家需要用到的字符,是國際編碼,通用性強。 UTF-8編碼的文字可以在各國支援UTF8字元集的瀏覽器上顯示。如果是UTF8編碼,則在外國人的英文IE上也能顯示中文,他們無需下載IE的中文語言支援包。
UTF-8版本雖然具有良好的國際相容性,但中文需要比GBK/BIG5版本多佔用50%的資料庫儲存空間,因此並非建議使用,僅供對國際相容性有特殊要求的使用者使用。簡單來說:對於中文較多的網站,適合用GBK編碼節省資料庫空間。對於英文較多的網站,適合用UTF-8節省資料庫空間。
GBK、GB2312等與UTF8如何轉換? GBK、GB2312等與UTF8之間都必須透過Unicode編碼才能相互轉換:GBK、GB2312——Unicode——UTF8;UTF8——Unicode——GBK、GB2312。使用Windows記事本的“另存為”,可以在GBK、Unicode、Unicode big endian和UTF-8這幾種編碼方式間相互轉換。
如何讓瀏覽器正確辨識網頁編碼?一般在網頁中都要有如下一句:锛