>  기사  >  웹 프론트엔드  >  웹 개발 시 발생하는 UTF-8 인코딩 문제 요약

웹 개발 시 발생하는 UTF-8 인코딩 문제 요약

黄舟
黄舟원래의
2016-12-16 15:45:101140검색

5가지 주요 측면이 있습니다:

1. HTML 페이지를 UTF-8 인코딩으로 변환하는 문제

2. PHP 페이지를 UTF-8 인코딩으로 변환하는 문제

3. MYSQL 데이터베이스에서 UTF-8 인코딩 문제

4. JS 관련 UTF-8 인코딩 문제

5. FLASH 관련 UTF-8 인코딩 문제

1. UTF-8 인코딩으로의 HTML 페이지 변환 문제

1.

뒤와 앞에 한 줄을 추가합니다: <p>4a796029701f193e630c543908b7e911 태그 앞에 추가해야 합니다. 그렇지 않으면 b2386ffb911b14667cb8f0f91ea547a7 사이에 한자가 있으면 표시됩니다. 왜곡될 수 있습니다! </p> <p>2.html 파일 인코딩 문제: </p> <p>편집기 메뉴 클릭: "파일" -> "다른 이름으로 저장", 현재 파일의 인코딩을 볼 수 있습니다. 파일 인코딩이 다음과 같은지 확인하세요. : UTF -8, ANSI인 경우 인코딩을 UTF-8로 변경해야 합니다. </p> <p>3. HTML 파일 헤더 BOM 문제: </p> <p>파일을 다른 인코딩에서 UTF-8 인코딩으로 변환할 때 BOM 태그가 파일 시작 부분에 추가되는 경우가 있습니다. 브라우저에서 한자를 표시할 때 문자가 깨져서 표시되도록 합니다. </p> <p>BOM 태그 삭제 방법: </p> <p>1. Dreamweaver로 파일을 열고 다시 저장하여 BOM 태그를 제거할 수 있습니다! </p> <p>2. EditPlus로 파일을 열고 "기본 설정"->"파일"->"UTF-8 서명" 메뉴에서 "항상 서명 제거"로 설정하세요. 그런 다음 파일을 저장하십시오. 즉, BOM 라벨을 제거할 수 있습니다! </p> <p>4. 웹 서버 UTF-8 인코딩 문제: </p> <p>위에 나열된 단계를 수행했지만 여전히 중국어 깨짐 문제가 있는 경우 사용 중인 웹 서버의 인코딩을 확인하세요. 질문</p> <p>Apache를 사용하는 경우 구성 파일의 문자 집합을 utf-8로 설정하세요(여기에는 방법만 나열되어 있으며 특정 형식은 Apache 구성 파일을 참조하세요). </p> <p>Nginx를 사용하는 경우 nginx.conf의 charset을 utf-8로 설정하고 특히 "charset"을 찾으세요. gb2312;" 또는 이와 유사한 명령문을 "charset utf-8;"으로 변경합니다.</p> <p><br></p> <p></p> <p><br></p> <p>2 .PHP 페이지를 UTF-8 인코딩 문제로 변환</p> <p>1. 코드 시작 부분에 한 줄을 추가합니다: </p> <p>header("Content-Type: text/html;charset=utf-8 ");</p> <p>2. PHP 파일 인코딩 문제</p> <p>편집기 메뉴 클릭: "파일" -> "다른 이름으로 저장", 현재 파일의 인코딩을 볼 수 있습니다. 인코딩: UTF-8, ANSI인 경우 인코딩을 UTF-8로 변경해야 합니다. </p> <p>3. PHP 파일 헤더 BOM 문제: </p> <p>PHP 파일에는 BOM이 없어야 합니다. 그렇지 않으면 세션이 작동하지 않으며 유사한 프롬프트가 있습니다: </p> <p>경고: session_start() [function.session-start]: 세션 캐시를 보낼 수 없습니다. 리미터 - 헤더가 이미 전송되었습니다</p> <p>이것은 session_start()가 실행될 때 발생하기 때문입니다. 의 경우 페이지 전체를 출력할 수 없지만 이전 PHP 페이지에 BOM 태그가 존재하기 때문에 PHP는 BOM 태그를 출력으로 처리하므로 오류가 발생합니다! </p> <p>따라서 PHP 페이지는 BOM 태그를 삭제해야 합니다. </p> <p>이 BOM 태그를 삭제하는 방법: </p> <p>1 Dreamweaver로 파일을 열고 다시 저장할 수 있습니다. BOM 태그를 제거할 수 있습니다! </p> <p>2. EditPlus로 파일을 열고 "기본 설정"->"파일"->"UTF-8 서명" 메뉴에서 "항상 서명 제거"로 설정하세요. 그런 다음 파일을 저장하십시오. 즉, BOM 라벨을 제거할 수 있습니다! </p> <p>4. PHP가 파일을 첨부 파일로 저장할 때 UTF-8 인코딩 문제: </p> <p>PHP는 파일을 첨부 파일로 저장하며 파일 이름은 GB2312로 인코딩되어야 합니다. 잘못된 문자가 표시됩니다: </p> <p>PHP 자체가 UTF-8 인코딩 형식의 파일인 경우 파일 이름 변수를 UTF-8에서 GB2312로 변환해야 합니다: </p> <p>iconv(" UTF-8", "GB2312", "$filename");</p> <p>5. 기사 제목을 자르고 표시할 때 잘못된 문자나 "?" 물음표가 나타납니다. </p> <p>일반 기사 제목은 다음과 같습니다. 매우 긴 경우 제목의 일부가 표시되고 기사 제목이 잘립니다. UTF-8 인코딩 형식의 한자는 너비의 3자를 차지하므로 제목이 가로채면 때로는 1자 또는 1자만 표시됩니다. 2자 너비의 문자가 가로채어집니다. 가로채기가 완료되지 않으면 문자가 깨지거나 "?"가 표시되어 제목을 가로채는데 문제가 없습니다. 🎜></p> 3. MYSQL 데이터베이스는 UTF-8 인코딩을 사용합니다. 질문 <pre class="brush:php;toolbar:false">function get_brief_str($str, $max_length) { echo strlen($str) ."<br>"; if(strlen($str) > $max_length) { $check_num = 0; for($i=0; $i < $max_length; $i++) { if (ord($str[$i]) > 128) $check_num++; } if($check_num % 3 == 0) $str = substr($str, 0, $max_length)."..."; else if($check_num % 3 == 1) $str = substr($str, 0, $max_length + 2)."..."; else if($check_num % 3 == 2) $str = substr($str, 0, $max_length + 1)."..."; } return $str; }</pre><p>1. phpmyadmin을 사용하여 데이터베이스 및 데이터 테이블을 생성합니다. </p> <p>데이터베이스를 생성할 때 "조직"을 " utf8_general_ci" 또는 문 실행: </p> <p></p>데이터 테이블 생성 시: 필드에 중국어가 저장되어 있는 경우 "Organization"을 "utf8_general_ci"로 설정해야 합니다. <pre class="brush:php;toolbar:false">CREATE DATABASE `dbname` DEFAULT CHARACTER SET utf8 COLLATE utf8_general_ci;</pre>필드에 영어 또는 숫자, 기본값은 괜찮습니다. <p><br>해당 SQL 문(예: </p> <p></p>2. PHP를 사용하여 데이터베이스 읽기 및 쓰기 <pre class="brush:sql;toolbar:false">CREATE TABLE `test` ( `id` INT NOT NULL , `name` VARCHAR( 10 ) CHARACTER SET utf8 COLLATE utf8_general_ci NOT NULL , PRIMARY KEY ( `id` ) ) ENGINE = MYISAM ;</pre><p>데이터베이스에 연결한 후: </p> <p> </p>두 줄을 ​​합치면 <pre class="brush:php;toolbar:false">$connection = mysql_connect($host_name, $host_user, $host_pass);</pre><p></p> MYSQL 데이터베이스를 정상적으로 읽고 쓸 수 있습니다. <pre class="brush:php;toolbar:false">mysql_query("set character set &#39;utf8&#39;");//读库 mysql_query("set names &#39;utf8&#39;");//写库</pre><p></p> <p><br>4. JS 관련 UTF-8 인코딩 문제 </p> <p>1. JS가 쿠키를 읽을 때 중국어가 왜곡되는 문제 </p> <p>PHP가 쿠키를 쓰는 경우가 있습니다. 한자를 이스케이프 인코딩해야 합니다. 그렇지 않으면 JS가 쿠키에서 읽은 한자가 깨질 수 있습니다. </p> <p>但php本身没有escape函数,我们新写一个escape函数:</p><pre class="brush:php;toolbar:false">function escape($str) { preg_match_all("/[\x80-\xff].|[\x01-\x7f]+/",$str,$r); $ar = $r[0]; foreach($ar as $k=>$v) { if(ord($v[0]) < 128) $ar[$k] = rawurlencode($v); else $ar[$k] = "%u".bin2hex(iconv("UTF-8","UCS-2",$v)); } return join("",$ar); }</pre><p>JS读cookie的时候,用unescape解码,然后就解决cookie中有中文乱码的问题了。</p> <p>2.外部JS文件UTF-8编码问题</p> <p>当一个HTML页面或则PHP页面包含一个外部的JS文件时,如果HTML页面或则PHP页面是UTF-8编码格式的文件,外部的JS文件同样要转成UTF-8的文件,否则将出现,没有包含不成功,调用函数时没有反应的情况。</p> <p>点击编辑器的菜单:“文件”->“另存为”,可以看到当前文件的编码,确保文件编码为:UTF-8,如果是ANSI,需要将编码改成:UTF-8。</p> <p><br></p> <p></p> <p><br></p> <p>五.FLASH相关的UTF-8编码问题</p> <p>FLASH内部对所有字符串,默认都是以UTF-8处理</p> <p>1.FLASH读文普通本文件(txt,html)</p> <p>要将文本文件的编码存为UTF-8</p> <p>点击编辑器的菜单:“文件”->“另存为”,可以看到当前文件的编码,确保文件编码为:UTF-8,如果是ANSI,需要将编码改成:UTF-8。</p> <p>2.FLASH读XML文件</p> <p>要将XML文件的编码存为UTF-8</p> <p>点击编辑器的菜单:“文件”->“另存为”,可以看到当前文件的编码,确保文件编码为:UTF-8,如果是ANSI,需要将编码改成:UTF-8。</p> <p>在XML第1行写:</p><pre class="brush:php;toolbar:false"><?xml version="1.0" encoding="utf-8"?></pre><p> <br></p> <p>3.FLASH读PHP返回数据</p> <p>如果PHP编码本身是UTF-8的,直接echo就可以了。</p> <p>如果PHP编码本身是GB2312的,可以将PHP转存成UTF-8编码格式的文件,直接echo就可以了</p> <p>如果PHP编码本身是GB2312的,而且不允许改文件的编码格式,用下面的语句将字符串转换成UTF-8的编码格式</p><pre class="brush:php;toolbar:false">$new_str = iconv("GB2312", "UTF-8", "$str");</pre><p>再echo就可以了</p> <p>4.FLASH读数据库(MYSQL)的数据</p> <p>FLASH要通过PHP读取数据库中的数据,PHP本身的编码不重要,关键是如果数据库的编码是GB2312的话,需要用下面的语句将字符串转换成UTF-8的编码格式。</p><pre class="brush:php;toolbar:false">$new_str = iconv("GB2312", "UTF-8", "$str");</pre><p>5.FLASH通过PHP写数据</p> <p>一句话,FLASH传过来的字符串是UTF-8格式的,要转换成相应的编码格式,再操作(写文件、写数据库、直接显示等等),还是用iconv函数转换。</p> <p>6.FLASH使用本地编码(理论上不推荐使用)</p> <p>如果想让FLASH不使用UTF-8编码,而是使用本地编码。对于中国大陆地区而言,本地编码是GB2312或GBK</p> <p>AS程序内,可以添加以下代码:</p><pre class="brush:php;toolbar:false">System.useCodepage = true;</pre><p>那么FLASH内所有字符都是使用GB2312的编码了,所有导入到FLASH或者从FLASH导出的数据,都应该做相应的编码转换。</p> <p>因为使用本地编码,会造成使用繁体中文地区的用户产生乱码,所以不推荐使用。</p> <p> 以上就是Web 开发中遇到的UTF-8编码的问题总结的内容,更多相关文章请关注PHP中文网(www.php.cn)! </p> <p><br></p>
성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.