>  기사  >  백엔드 개발  >  PHP에서 문자셋을 변환하는 방법

PHP에서 문자셋을 변환하는 방법

怪我咯
怪我咯원래의
2017-07-12 11:25:363655검색

문자란 다양한 국가의 문자, 구두점, 그래픽 기호, 숫자 등을 포함한 다양한 문자 및 기호를 총칭하는 용어입니다. 문자 세트(문자 세트)는 다양한 문자 세트의 모음입니다. 각 문자 세트에는 서로 다른 문자 수가 포함됩니다. 일반적인 문자 세트 이름: ASCII 문자 세트, GB2312 문자 세트, GB18030 문자 세트, 유니코드 문자 세트 등 컴퓨터가 다양한 문자 집합의 텍스트를 정확하게 처리하기 위해서는 컴퓨터가 다양한 텍스트를 인식하고 저장할 수 있도록 문자 인코딩이 필요합니다. 한자는 종류가 많고 쓰기 규칙이 다른 한자 간체와 번체 두 종류로 나누어집니다. 컴퓨터는 원래 영어 1바이트 문자를 기반으로 설계되었습니다. 따라서 한자를 인코딩하는 것이 기술적입니다. 중국정보교류의 기초.

이 글에서는 iconv를 통해 string을 GBK에서 UTF8문자 집합으로 변환하는 PHP를 주로 소개합니다. 매우 좋은 참조 값을 가지고 있습니다. 아래 편집기를 사용하여 살펴보겠습니다.

PHP는 iconv를 통해 문자열을 GBK에서 UTF8 문자 집합으로 변환합니다.

1. iconv() 소개

iconv 함수는 알려진 문자 세트 파일을 알려진 다른 문자 세트 파일로 변환할 수 있습니다. 예: GB2312에서 UTF-8로 변환합니다.

iconv 기능은 php5에 내장되어 있으며 기본적으로 GB 문자 집합이 켜져 있습니다.

2.iconv() error

iconv는 "-" 문자를 gb2312로 변환할 때 오류가 발생합니다. 해결 방법은 변환해야 하는 인코딩 뒤에 "//IGNORE"를 추가하는 것입니다. iconv 함수의 매개변수는 다음과 같습니다.

iconv("UTF-8", "GB2312//IGNORE", $data)

ignore는 변환 중 오류를 무시한다는 의미입니다. 무시 매개변수가 없으면 이 문자 뒤에 오는 모든 문자열을 저장할 수 없습니다.

3.iconv() 예제

<?php 
  echo $str= ‘你好,这里是卖咖啡!&#39;; 
  echo &#39;<br />&#39;; 
  echo iconv(&#39;GB2312&#39;, &#39;UTF-8&#39;, $str); //将字符串的编码从GB2312转到UTF-8 
  echo &#39;<br />&#39;; 
  echo iconv_substr($str, 1, 1, &#39;UTF-8&#39;); //按字符个数截取而非字节 
  print_r(iconv_get_encoding()); //得到当前页面编码信息 
  echo iconv_strlen($str, &#39;UTF-8&#39;); //得到设定编码的字符串长度 
?>

위 내용은 PHP에서 문자셋을 변환하는 방법의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.