Heim > Fragen und Antworten > Hauptteil
Ich versuche, eine alte Website neu zu schreiben.
Es ist auf Persisch und verwendet persische/arabische Zeichen.
CREATE DATABASE `db` DEFAULT CHARACTER SET utf8 COLLATE utf8_persian_ci; USE `db`;
Bei fast allen meinen Tabellen/Spalten ist COLLATE auf utf8_persian_ci
Ich verwende Codeigniter für mein neues Skript und habe
'char_set' => 'utf8', 'dbcollat' => 'utf8_persian_ci',
In den Datenbankeinstellungen also kein Problem.
Hier ist also der seltsame Teil
Das alte Skript verwendete eine Art Datenbank-Engine namens TUBADBENGINE
或 TUBA DB ENGINE
... nichts Besonderes.
Als ich mit einem alten Skript einige Daten (auf Farsi) in die Datenbank eingegeben habe und mir die Datenbank angesehen habe, wurden die Zeichen als Ø1مران
gespeichert.
Das alte Skript ruft die Daten gut ab bzw. zeigt sie an, aber das neue Skript zeigt sie mit der gleichen seltsamen Schriftart/dem gleichen Zeichensatz wie die Datenbank an
Also, wenn ich tippe ???
时,数据库存储的数据看起来像 Ø1Ù...راÙ
,当我在新脚本中获取它时,我看到 Ø1Ù...راÙ
但在旧脚本中我看到 ??
CREATE TABLE IF NOT EXISTS `tnewsgroups` ( `ID` int(11) NOT NULL AUTO_INCREMENT, `fName` varchar(200) COLLATE utf8_persian_ci DEFAULT NULL, PRIMARY KEY (`ID`) ) ENGINE=InnoDB DEFAULT CHARSET=utf8 COLLATE=utf8_persian_ci AUTO_INCREMENT=11 ; -- -- Dumping data for table `tnewsgroups` -- INSERT INTO `tnewsgroups` (`ID`, `fName`) VALUES (1, 'عمران'), (2, 'معماری'), (3, 'برق'), (4, 'مکانیک'), (5, 'test'), (6, 'test2');
Andererseits, wenn ich ???
direkt in die Datenbank
Das Gleiche habe ich natürlich auch in der Datenbank hinterlegt ???
Das neue Skript wird sehr gut angezeigt
Aber im alten Drehbuch bekomme ich ????
Kann das jemand verstehen?
Das ist ein großer Motor
https://github.com/maxxxir/mz-codeigniter-crud/blob/master/tuba.php
Verwendungsbeispiel eines alten Skripts:
define("database_type" , "MYSQL"); define("database_ip" , "localhost"); define("database_un" , "root"); define("database_pw" , ""); define("database_name" , "nezam2"); define("database_connectionstring" , ""); $db = new TUBADBENGINE(database_type , database_ip , database_un , database_pw , database_name , database_connectionstring); $db->Select("SELECT * FROM tnews limit 3"); if ($db->Lasterror() != "") { echo "<B><Font color=red>ÎØÇ ! áØÝÇ ãÌÏøÏÇ ÊáÇÔ ˜äíÏ"; exit(); } for ($i = 0 ; $i < $db->Count() ; $i++) { $row = $db->Next(); var_dump($row); }
P粉2573421662023-11-18 09:06:47
deceze的答案非常好,但我可以添加一些信息,这些信息可能有助于处理大量记录,而无需手动测试它们.
如果转换 CONVERT(BINARY CONVERT(field_name USING latin1) USING utf8)
失败,则会打印 NULL
而不是 field_name
内容。
所以我用这个来查找那些记录:
SELECT IFNULL( CONVERT(BINARY CONVERT(field_name USING latin1) USING utf8) , '**************************************************') FROM table_name
或者这个:
SELECT id, field_name, CONVERT(BINARY CONVERT(field_name USING latin1) USING utf8) FROM table_name WHERE CONVERT(BINARY CONVERT(field_name USING latin1) USING utf8) IS NULL
带有该子句的 UPDATE
仅影响转换成功的记录:
UPDATE table_name SET field_name = CONVERT(BINARY CONVERT(field_name USING latin1) USING utf8mb4 ) WHERE CONVERT(BINARY CONVERT(field_name USING latin1) USING utf8mb4) IS NOT NULL
P粉6638838622023-11-18 00:37:25
简而言之,因为这个问题之前已经讨论过一千次了:
"汉字"
,以 UTF-8 编码。该字节为 E6 BC A2 E5 AD 97
。latin1
的数据库连接发送此字符串。E6 BC A2 E5 AD 97
,认为它们代表 latin1
字符。æ¡¡¿李>
- 相反的相同过程使 PHP 接收相同的字节,然后将其视为 UTF-8。尽管数据库没有按应有的方式处理字符,但往返对于 PHP 来说工作得很好。
所以这里的问题是数据录入数据库时数据库连接设置不正确。您必须将数据库中的数据转换为正确的字符。试试这个:
SELECT CONVERT(BINARY CONVERT(field_name USING latin1) USING utf8) FROM table_name
也许 utf8
不是您所需要的,请尝试一下。如果有效,请将其更改为 UPDATE
语句以永久更新数据。