首頁  >  文章  >  後端開發  >  php 轉換字符集的方法

php 轉換字符集的方法

怪我咯
怪我咯原創
2017-07-12 11:25:363598瀏覽

字元(Character)是各種文字和符號的總稱,包括各國家文字、標點符號、圖形符號、數字等。 字元集(Character set)是多個字元的集合,字元集種類較多,每個字元集包含的字元個數不同,常見字元集名稱:ASCII字元集、GB2312字元集、BIG5字元集、 GB18030字元集、Unicode字元集等。電腦要準確的處理各種字元集文字,需要進行字元編碼,以便電腦能夠辨識和儲存各種文字。中文文字數目大,而且還分為簡體中文和繁體中文兩種不同書寫規則的文字,而計算機最初是按英語單字節字符設計的,因此,對中文字符進行編碼,是中文信息交流的技術基礎。

本文主要介紹了PHP透過iconv將字串從GBK轉換為UTF8字元集。具有很好的參考價值,下面跟著小編一起來看下吧

PHP透過iconv將字串從GBK轉換為UTF8字元集。

1. iconv()介紹

iconv函數可以將一種已知的字元集檔案轉換成另一種已知的字符集檔。例如:從GB2312轉換為UTF-8。

iconv函數在php5中內置,GB字元集預設為開啟。

2. iconv()錯誤

iconv在轉換字元」—」到gb2312時會出錯,解決方法是在需要轉成的編碼後加上「/ /IGNORE”,也就是iconv函數第二個參數後.如下:

iconv("UTF-8", "GB2312//IGNORE", $data)

#ignore的意思是忽略轉換時的錯誤,如果沒有ignore參數,所有該字元後面的字串都無法被儲存。

3. iconv()範例

<?php 
  echo $str= ‘你好,这里是卖咖啡!&#39;; 
  echo &#39;<br />&#39;; 
  echo iconv(&#39;GB2312&#39;, &#39;UTF-8&#39;, $str); //将字符串的编码从GB2312转到UTF-8 
  echo &#39;<br />&#39;; 
  echo iconv_substr($str, 1, 1, &#39;UTF-8&#39;); //按字符个数截取而非字节 
  print_r(iconv_get_encoding()); //得到当前页面编码信息 
  echo iconv_strlen($str, &#39;UTF-8&#39;); //得到设定编码的字符串长度 
?>

以上是php 轉換字符集的方法的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn