字元(Character)是各種文字和符號的總稱,包括各國家文字、標點符號、圖形符號、數字等。 字元集(Character set)是多個字元的集合,字元集種類較多,每個字元集包含的字元個數不同,常見字元集名稱:ASCII字元集、GB2312字元集、BIG5字元集、 GB18030字元集、Unicode字元集等。電腦要準確的處理各種字元集文字,需要進行字元編碼,以便電腦能夠辨識和儲存各種文字。中文文字數目大,而且還分為簡體中文和繁體中文兩種不同書寫規則的文字,而計算機最初是按英語單字節字符設計的,因此,對中文字符進行編碼,是中文信息交流的技術基礎。
本文主要介紹了PHP透過iconv將字串從GBK轉換為UTF8字元集。具有很好的參考價值,下面跟著小編一起來看下吧
PHP透過iconv將字串從GBK轉換為UTF8字元集。
1. iconv()介紹
iconv函數可以將一種已知的字元集檔案轉換成另一種已知的字符集檔。例如:從GB2312轉換為UTF-8。
iconv函數在php5中內置,GB字元集預設為開啟。
2. iconv()錯誤
iconv在轉換字元」—」到gb2312時會出錯,解決方法是在需要轉成的編碼後加上「/ /IGNORE”,也就是iconv函數第二個參數後.如下:
iconv("UTF-8", "GB2312//IGNORE", $data)
#ignore的意思是忽略轉換時的錯誤,如果沒有ignore參數,所有該字元後面的字串都無法被儲存。
3. iconv()範例
<?php echo $str= ‘你好,这里是卖咖啡!'; echo '<br />'; echo iconv('GB2312', 'UTF-8', $str); //将字符串的编码从GB2312转到UTF-8 echo '<br />'; echo iconv_substr($str, 1, 1, 'UTF-8'); //按字符个数截取而非字节 print_r(iconv_get_encoding()); //得到当前页面编码信息 echo iconv_strlen($str, 'UTF-8'); //得到设定编码的字符串长度 ?>
以上是php 轉換字符集的方法的詳細內容。更多資訊請關注PHP中文網其他相關文章!