首頁 >後端開發 >php教程 >靈芝孢子粉的功效與作用及食用方法 在任意字元集下正常顯示網頁的方法二(續)

靈芝孢子粉的功效與作用及食用方法 在任意字元集下正常顯示網頁的方法二(續)

WBOY
WBOY原創
2016-07-29 08:36:561326瀏覽

轉:coolcode.cn
前幾天寫了一篇在任意字符集下正常顯示網頁的方法,裡面介紹的很簡單,就是把前128個字符以外的字符集都用 NCR 來表示,但是具體怎麼轉化我沒有介紹,因為當時我覺得太簡單了。但是後來發現有人問這個問題,這裡就詳細說明。
首先第一步是要把原始字元集的字串轉換為 UTF-16 字元集,做這一步是因為 UTF-16 字元集中的每個字元都是兩個位元組,後面處理起來很容易,而如果在原始字元集上直接做處理則很複雜。原始碼集可以從原始網頁中的 meta 標籤中取得,也可以單獨指定,我的程式是讓使用者在表單中指定原始字元集,因為我無法保證使用者提交的檔案就一定是 HTML 檔案(其他檔案也是可以的,例如這個 WordPress 的漢化包源文件是個 po 文件,它裡面的內容也可以這樣處理),而且即使是 HTML 文件,裡面也不一定就有用於指定字符集的 meta 標籤,所以通過表單單獨指定字符集比較保險。你可能會覺得將一種字元集轉換為另一種字元集很複雜,確實如此,如果自己來實現的話,確實非常麻煩,但是用 PHP 來做卻很容易,因為它裡面已經包含這樣的函數了,你可以透過 iconv 函數很容易的來實現各種字符集之間的轉化,如果你的機器上沒有安裝 iconv 擴展,你也可以使用 mb_convert_encoding 函數,如果 Multibyte String 擴展也沒有安裝,那就沒辦法了,因為你要自己實現那麼多種編碼的轉換基本上是不可能的,除非你是頂級大牛!推薦使用 iconv,因為這個效率高,支援的字元集也更多。
做完上面那一步之後,接下來是以每兩個位元組為單位來處理字串。這兩個位元組直接轉換成數字就是 xxxx; 中的 xxxxx,如果這個數字小於 128 就直接使用這個字元(注意這裡就變成單字節了),否則就使用 xxxx; 的形式。這裡有一點要注意,就是當這個數字是 65279(16 進制的 0xFEFF)時,請把它忽略掉,因為這個是 Unicode 編碼中的傳輸控製字符,而我們現在的字串已經只有 iso-8859- 1 編碼中的前 128 個字元了,所以我們不需要它了。
好了,基本想法就是這樣,以下是實現的程式:
下載: nochaoscode.php

複製程式碼 程式碼如下:


function nochaoscode($encode, $str) { 
    $str = iconv($encode, "UTF-16BE", $str); 
    for ($i = 0; $i         $code = ord($str{$i}) * 256 + ord($str{$i + 1}); 
        if ($code             $output .= chr($code); 
        } else if ($code != 65279) { 
            $output .= "".$code.";"; 
        } 
    } 
    return $output; 

?>


函數的參數中,$encode 是原始字元集,$str 是需要轉換的字串。回傳結果是轉換以後字串。
補充:今天 Legend 告訴我更簡單的方法,就是直接利用 mb_convert_encoding 函數。因為 mb_convert_encoding 支援一種叫做 HTML-ENTITIES 的編碼格式,也就是 NCR 編碼。用它就更簡單了。

以上就介紹了靈芝孢子粉的功效與作用及食用方法在任意字符集下正常顯示網頁的方法二(續),包括了靈芝孢子粉的功效與作用及食用方法方面的內容,希望對PHP教程有興趣的朋友有幫助。

陳述:
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn