Heim  >  Artikel  >  Web-Frontend  >  Zusammenfassung der bei der Webentwicklung aufgetretenen UTF-8-Kodierungsprobleme

Zusammenfassung der bei der Webentwicklung aufgetretenen UTF-8-Kodierungsprobleme

黄舟
黄舟Original
2016-12-16 15:45:101140Durchsuche

Es gibt fünf Hauptaspekte:

1. Das Problem der Konvertierung von HTML-Seiten in die UTF-8-Kodierung

2. Das Problem der Konvertierung von PHP-Seiten in die UTF-8-Kodierung

3. Probleme bei der Verwendung der UTF-8-Kodierung in der MYSQL-Datenbank

4. UTF-8-Kodierungsprobleme im Zusammenhang mit FLASH

1. Probleme bei der HTML-Seitenkonvertierung in UTF-8

1. Fügen Sie nach 93f0f5c25f18dab9d176bd4f6de5d30e eine Zeile hinzu:

59c1213c0ca034e419da5859aaa92a97

muss vor dem Tag b2386ffb911b14667cb8f0f91ea547a7 eingefügt werden. Andernfalls wird der angezeigte Titel angezeigt kann verstümmelt sein!

2.html-Dateikodierungsproblem:

Klicken Sie auf das Editor-Menü: „Datei“ -> „Speichern unter“. Sie können die Kodierung der aktuellen Datei sehen. Stellen Sie sicher, dass die Dateikodierung korrekt ist : UTF-8, wenn es ANSI ist, muss die Kodierung geändert werden in: UTF-8.

3. HTML-Datei-Header-Stücklistenproblem:

Beim Konvertieren von Dateien von anderen Kodierungen in die UTF-8-Kodierung wird manchmal ein BOM-Tag am Anfang der Datei hinzugefügt Der Browser zeigt bei der Anzeige chinesischer Schriftzeichen verstümmelte Zeichen an.

So löschen Sie dieses Stücklisten-Tag:

1 Sie können die Datei mit Dreamweaver öffnen und erneut speichern, um das Stücklisten-Tag zu entfernen!

2. Sie können die Datei mit EditPlus öffnen und im Menü „Einstellungen“->„Datei“->„UTF-8-Signatur“ auf „Signatur immer entfernen“ einstellen Speichern Sie dann die Datei, das heißt, das Stücklistenetikett kann entfernt werden!

4. Problem mit der UTF-8-Kodierung des WEB-Servers:

Wenn Sie die oben aufgeführten Schritte ausführen und immer noch Probleme mit der chinesischen Verstümmelung haben, überprüfen Sie bitte die Kodierung des von Ihnen verwendeten WEB-Servers. Frage

Wenn Sie Apache verwenden, stellen Sie bitte den Zeichensatz in der Konfigurationsdatei auf: utf-8 ein (hier werden nur die Methoden aufgeführt, das spezifische Format finden Sie in der Apache-Konfigurationsdatei).

Wenn Sie Nginx verwenden, setzen Sie bitte: Zeichensatz in nginx.conf auf utf-8, suchen Sie insbesondere nach „Zeichensatz“ gb2312;“ oder eine ähnliche Anweisung, ändern Sie sie in: „charset utf-8;“.



2 .Konvertieren der PHP-Seite in UTF-8-Kodierungsproblem

1. Fügen Sie am Anfang des Codes eine Zeile hinzu:

header("Content-Type: text/html;charset=utf-8 ");

2. PHP-Dateikodierungsproblem

Klicken Sie auf das Editor-Menü: „Datei“ -> „Speichern unter“, Sie können die Kodierung der aktuellen Datei sehen, stellen Sie sicher, dass die Datei Kodierung ist: UTF-8. Wenn es sich um ANSI handelt, müssen Sie die Kodierung in UTF-8 ändern. Problem mit dem PHP-Dateiheader:

PHP-Dateien dürfen kein BOM haben Tags, sonst funktioniert die Sitzung nicht und es gibt ähnliche Eingabeaufforderungen:

Warnung: session_start() [function.session-start]: Sitzungscache kann nicht gesendet werden Limiter – Header bereits gesendet

Dies liegt daran, dass session_start() ausgeführt wird Wenn , kann nicht die gesamte Seite ausgegeben werden, aber da das BOM-Tag auf der vorherigen PHP-Seite vorhanden ist, behandelt PHP das BOM-Tag als Ausgabe, sodass ein Fehler auftritt!

Die PHP-Seite muss also das BOM-Tag löschen

So löschen Sie dieses BOM-Tag:

1 Sie können die Datei mit Dreamweaver öffnen und erneut speichern, d. h. Sie können das BOM-Tag entfernen!

2. Sie können die Datei mit EditPlus öffnen und im Menü „Einstellungen“->„Datei“->„UTF-8-Signatur“ auf „Signatur immer entfernen“ einstellen Speichern Sie dann die Datei. Das heißt, das Stücklistenetikett kann entfernt werden!

4. Wenn PHP Dateien als Anhänge speichert, gibt es Probleme mit der UTF-8-Kodierung:

PHP speichert Dateien als Anhänge und der Dateiname muss GB2312-kodiert sein. Es werden verstümmelte Zeichen angezeigt:

Wenn Ihr PHP selbst eine Datei im UTF-8-Kodierungsformat ist, müssen Sie die Dateinamenvariable von UTF-8 in GB2312 konvertieren:

iconv(" UTF-8", "GB2312", "$filename");

5. Beim Abschneiden und Anzeigen von Artikeltiteln erscheinen verstümmelte Zeichen oder „?“-Fragezeichen:

Allgemeine Artikeltitel sind sehr lang Wenn ein Teil des Titels angezeigt und der Artikeltitel abgeschnitten wird, da ein chinesisches Zeichen im UTF-8-Kodierungsformat 3 Zeichen Breite einnimmt, manchmal nur 1 Zeichen oder 1 Zeichen, wenn der Titel abgefangen wird eines chinesischen Zeichens wird abgefangen. Wenn das Abfangen nicht vollständig ist, werden verstümmelte Zeichen oder „?“ angezeigt, um den Titel abzufangen, und es wird kein Problem geben 🎜>

3. MYSQL-Datenbank verwendet UTF-8-Kodierung. Fragen

1. Verwenden Sie phpmyadmin, um Datenbanken und Datentabellen zu erstellen.

Beim Erstellen der Datenbank stellen Sie bitte „Organisation“ auf: „ utf8_general_ci“ oder führen Sie die Anweisung aus:
function get_brief_str($str, $max_length) 
{ 
echo strlen($str) 
."<br>"; 
if(strlen($str) > $max_length) 
{ 
$check_num = 0; 
for($i=0; $i < $max_length; $i++) 
{ 
if (ord($str[$i]) > 128) 
$check_num++; 
} 

if($check_num % 3 == 0) 
$str = substr($str, 
0, $max_length)."..."; 
else if($check_num % 3 == 1) 
$str = substr($str, 
0, $max_length + 2)."..."; 
else if($check_num % 3 == 2) 
$str = 
substr($str, 0, $max_length + 1)."..."; 
} 

return $str; 
}

Beim Erstellen einer Datentabelle: Wenn das Feld Chinesisch speichert, müssen Sie „Organisation“ auf „utf8_general_ci“ setzen.

Wenn das Feld Englisch oder speichert Zahlen, die Standardeinstellung ist in Ordnung.

Entsprechende SQL-Anweisung, zum Beispiel:

CREATE DATABASE `dbname` DEFAULT CHARACTER SET utf8 COLLATE utf8_general_ci;

2. Verwenden Sie PHP, um die Datenbank zu lesen und zu schreiben

Nachdem Sie eine Verbindung zur Datenbank hergestellt haben:

CREATE TABLE `test` ( 
`id` INT NOT NULL , 
`name` VARCHAR( 10 ) CHARACTER 
SET utf8 COLLATE utf8_general_ci NOT NULL , 
PRIMARY KEY ( `id` ) 
) 
ENGINE = MYISAM ;
Verbinden Sie zwei Zeilen:

und Sie können die MYSQL-Datenbank normal lesen und schreiben.

$connection = mysql_connect($host_name, $host_user, $host_pass);

mysql_query("set character set &#39;utf8&#39;");//读库 
mysql_query("set names &#39;utf8&#39;");//写库
4. UTF-8-Codierungsprobleme im Zusammenhang mit JS

1. Chinesisches verstümmeltes Problem, wenn JS Cookies liest


PHP schreibt manchmal Cookies Es ist notwendig, die chinesischen Zeichen mit Escape-Codierung zu versehen, da sonst die von JS im Cookie gelesenen chinesischen Zeichen verstümmelt werden.

但php本身没有escape函数,我们新写一个escape函数:

function escape($str) 
{ 
preg_match_all("/[\x80-\xff].|[\x01-\x7f]+/",$str,$r); 
$ar = $r[0]; 
foreach($ar as $k=>$v) 
{ 
if(ord($v[0]) < 128) 
$ar[$k] = 
rawurlencode($v); 
else 
$ar[$k] = 
"%u".bin2hex(iconv("UTF-8","UCS-2",$v)); 
} 
return join("",$ar); 
}

JS读cookie的时候,用unescape解码,然后就解决cookie中有中文乱码的问题了。

2.外部JS文件UTF-8编码问题

当一个HTML页面或则PHP页面包含一个外部的JS文件时,如果HTML页面或则PHP页面是UTF-8编码格式的文件,外部的JS文件同样要转成UTF-8的文件,否则将出现,没有包含不成功,调用函数时没有反应的情况。

点击编辑器的菜单:“文件”->“另存为”,可以看到当前文件的编码,确保文件编码为:UTF-8,如果是ANSI,需要将编码改成:UTF-8。



五.FLASH相关的UTF-8编码问题

FLASH内部对所有字符串,默认都是以UTF-8处理

1.FLASH读文普通本文件(txt,html)

要将文本文件的编码存为UTF-8

点击编辑器的菜单:“文件”->“另存为”,可以看到当前文件的编码,确保文件编码为:UTF-8,如果是ANSI,需要将编码改成:UTF-8。

2.FLASH读XML文件

要将XML文件的编码存为UTF-8

点击编辑器的菜单:“文件”->“另存为”,可以看到当前文件的编码,确保文件编码为:UTF-8,如果是ANSI,需要将编码改成:UTF-8。

在XML第1行写:

<?xml version="1.0" encoding="utf-8"?>

 

3.FLASH读PHP返回数据

如果PHP编码本身是UTF-8的,直接echo就可以了。

如果PHP编码本身是GB2312的,可以将PHP转存成UTF-8编码格式的文件,直接echo就可以了

如果PHP编码本身是GB2312的,而且不允许改文件的编码格式,用下面的语句将字符串转换成UTF-8的编码格式

$new_str = iconv("GB2312", "UTF-8", "$str");

再echo就可以了

4.FLASH读数据库(MYSQL)的数据

FLASH要通过PHP读取数据库中的数据,PHP本身的编码不重要,关键是如果数据库的编码是GB2312的话,需要用下面的语句将字符串转换成UTF-8的编码格式。

$new_str = iconv("GB2312", "UTF-8", "$str");

5.FLASH通过PHP写数据

一句话,FLASH传过来的字符串是UTF-8格式的,要转换成相应的编码格式,再操作(写文件、写数据库、直接显示等等),还是用iconv函数转换。

6.FLASH使用本地编码(理论上不推荐使用)

如果想让FLASH不使用UTF-8编码,而是使用本地编码。对于中国大陆地区而言,本地编码是GB2312或GBK

AS程序内,可以添加以下代码:

System.useCodepage = true;

那么FLASH内所有字符都是使用GB2312的编码了,所有导入到FLASH或者从FLASH导出的数据,都应该做相应的编码转换。

因为使用本地编码,会造成使用繁体中文地区的用户产生乱码,所以不推荐使用。

 以上就是Web 开发中遇到的UTF-8编码的问题总结的内容,更多相关文章请关注PHP中文网(www.php.cn)! 


Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn