ホームページ  >  記事  >  バックエンド開発  >  PHPで文字セットを変換する方法

PHPで文字セットを変換する方法

怪我咯
怪我咯オリジナル
2017-07-12 11:25:363599ブラウズ

文字とは、さまざまな国の文字、句読点、図記号、数字などを含む、さまざまな文字や記号の総称です。 文字セット (文字セット) は、複数の文字の集合です。各文字セットには、異なる数の文字が含まれています: ASCII 文字セット、GB2312 文字セット、 GB18030 文字セット、Unicode 文字セットなどコンピューターがさまざまな文字セットのテキストを正確に処理するには、コンピューターがさまざまなテキストを認識して保存できるように文字エンコーディングが必要です。中国語の文字は数多くあり、その表記規則が異なる簡体字中国語と繁体字中国語の2種類に分けられます。コンピュータはもともと英語の半角文字をベースに設計されているため、中国語の文字をエンコードすることが技術的な要素となります。中国の情報交換の拠点です。

この記事では、iconvを介してstringをGBKからUTF8文字セットに変換するPHPを主に紹介します。非常に優れた参考値です。以下のエディターで見てみましょう

PHP は、iconv を通じて文字列を GBK から UTF8 文字セットに変換します。

1. iconv() の概要

iconv 関数 は、既知の文字セット ファイルを別の既知の文字セット ファイルに変換できます。例: GB2312 から UTF-8 に変換します。

iconv関数はphp5に組み込まれており、デフォルトでGB文字セットがオンになっています。

2. iconv() エラー

iconv は文字「-」を gb2312 に変換するときにエラーを起こします。解決策は、変換する必要があるエンコーディングの後に「//IGNORE」を追加することです。 iconv 関数のパラメータ After:

iconv("UTF-8", "GB2312//IGNORE", $data)

ignore は、変換中にエラーを無視することを意味します。ignore パラメータがないと、この文字に続くすべての文字列を保存できません。

3. iconv() の例

<?php 
  echo $str= ‘你好,这里是卖咖啡!&#39;; 
  echo &#39;<br />&#39;; 
  echo iconv(&#39;GB2312&#39;, &#39;UTF-8&#39;, $str); //将字符串的编码从GB2312转到UTF-8 
  echo &#39;<br />&#39;; 
  echo iconv_substr($str, 1, 1, &#39;UTF-8&#39;); //按字符个数截取而非字节 
  print_r(iconv_get_encoding()); //得到当前页面编码信息 
  echo iconv_strlen($str, &#39;UTF-8&#39;); //得到设定编码的字符串长度 
?>

以上がPHPで文字セットを変換する方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。