iconv — Convert string to requested character encoding(PHP 4 >= 4.0.5, PHP 5)
mb_convert_encoding — Convert character encoding(PHP 4 >= 4.0.6, PHP 5)
. [, mixed from_encoding] )
需要先啟用mbstring 擴充函式庫,在php.ini裡將; extension=php_mbstring.dll 前面的; 去掉
string iconv ( string in_charset, string out_charset, string string )參數,除了可以指定要轉換到的編碼以外,還可以增加兩個後綴://TRANSLIT 和//IGNORE,
其中:
//TRANSLIT 會自動將不能直接轉換的字元變成一個或多個近似的字符,
//IGNORE 會忽略掉不能轉換的字符,而預設效果是從第一個非法字符截斷。
Returns the converted string or FALSE on failure.
使用:
1. 發現iconv在轉換字元"-"到gb2312時會出錯,如果沒有ignore參數,所有該字元後面的字串都無法被儲存。不管怎麼樣,這
個"-"都無法轉換成功,無法輸出。另外mb_convert_encoding沒有這個bug.
2. mb_convert_encoding 可以指定多種輸入編碼,它會根據內容自動識別,但是執行效率比iconv差太多;如:$str =
mb_convert_encoding($str,"euc-jp", "ASCII,JIS,EUC-JP,SJIS,UTF- 8");“ASCII,JIS,EUC-JP,SJIS,UTF-8”的順序不同效果也有
差異
3. 一般情況下用iconv,只有當遇到無法確定原編碼是何種編碼,或iconv轉換後無法正常顯示時才用mb_convert_encoding 函式
.
from_encoding is specified by character code name before conversion. it can be array or string - comma seated list it is not specified, the internal encoding will be used.
$str = mb_convert_encoding($str, "UCS-2LE", "JIS, eucjp-win, sjis-win");
$str = mb_convert_encoding( EUC-JP', "auto");
範例:
$content = iconv("GBK", "UTF-8", $content);
$content = mb_convert_encoding($content, "UTF-8", "GBK ");
以上就介紹了conversionpattern php 轉換字串編碼 iconv與mb_convert_encoding的區別說明,包括了conversionpattern方面的內容,希望對PHP教程有興趣的朋友有所幫助。