Home  >  Article  >  Backend Development  >  What to do if php files are uploaded with Chinese garbled characters, and the problem with Chinese garbled characters in php file names

What to do if php files are uploaded with Chinese garbled characters, and the problem with Chinese garbled characters in php file names

WBOY
WBOYOriginal
2016-07-25 08:52:031022browse
  1. enctype="multipart/form-data">

复制代码

php上传代码:

  1. if ($_FILES["file"]["error"] > 0)
  2. {
  3. echo "Return Code: " . $_FILES["file"]["error"] . "
    ";
  4. }else
  5. {
  6. echo "Upload: " . $_FILES["file"]["name"] . "
    ";
  7. echo "Type: " . $_FILES["file"]["type"] . "
    ";
  8. echo "Size: " . ($_FILES["file"]["size"] / 1024) . " Kb
    ";
  9. echo "Temp file: " . $_FILES["file"]["tmp_name"] . "
    ";
  10. if (file_exists("upload/" . $_FILES["file"]["name"]))
  11. {
  12. echo $_FILES["file"]["name"] . " already exists. ";
  13. }
  14. else
  15. {
  16. move_uploaded_file($_FILES["file"]["tmp_name"],
  17. "upload/" . $_FILES["file"]["name"]);
  18. }
  19. }
复制代码

上传了一个文件名为“测试数据.txt”的文件,oh ho,文件是传上去了,但是文件名为乱码。

以下是php文件上传乱码的原因分析,并给出了一些可靠的解决方法。

将:

move_uploaded_file($_FILES["file"]["tmp_name"], "upload/" . $_FILES["file"]["name"]);

修改为:

move_uploaded_file($_FILES["file"]["tmp_name"],"upload/" . iconv("UTF-8","gbk",$_FILES["file"]["name"]));

结果发现iconv函数返回值为false。 查一下函数手册,发现第二个参数有特别的用法,简单翻译一下就是我可以在编码的后面追加//TRANSLIT 或 //IGNORE ,前者会将无法翻译的字符转成最接近的字符,后者就是直接忽略不能转化的字符。

如下图: What to do if php files are uploaded with Chinese garbled characters, and the problem with Chinese garbled characters in php file names

测试:

var_dump( iconv("UTF-8","gbk//TRANSLIT",$_FILES["file"]["name"])); var_dump( iconv("UTF-8","gbk//IGNORE",$_FILES["file"]["name"]));

结果: bool(false) string(4) ".txt" 也就是说中文都没法转化,甚至连接近的字符都没有,看来网上介绍的方法也并非万能。

3、网上介绍方法失败,再尝试 猜测一下,也许系统在创建中文文件的时候会乱码,修改代码:

move_uploaded_file($_FILES["file"]["tmp_name"], "upload/测试数据.txt");

结果创建成功,没有乱码。不是系统问题。

php文件本身是utf8编码的,那么

move_uploaded_file($_FILES["file"]["tmp_name"],"upload/测试数据.txt");

这个语句肯定使用的是utf8编码,那么之前上传的文件名肯定就不是utf8编码了,那么以下的语句肯定是错误的,因为源字符串本身就不是utf8编码的:

iconv("UTF-8","gbk//TRANSLIT",$_FILES["file"]["name"]);

使用函数检查源字符串的编码:

$e=mb_detect_encoding($text, array(‘UTF-8', ‘GBK','gb2312')); echo $e;

结果是CP936,也就是源字符串编码是GBK。

测试:

move_uploaded_file($_FILES["file"]["tmp_name"],"upload/" . iconv("gbk","UTF-8",$_FILES["file"]["name"]));

问题解决,不再有中文乱码问题了。

4、其它解决方法,在html文件的head标签中间加入:

从而使编码保持统一,也就不需要再转码了。

5、小结 使用iconv函数可以解决上传中文文件名乱码的问题,实际上iconv能解决各种各样的由于编码不统一造成的乱码问题。 使用iconv函数请先检查源字符串的编码,除非你已经确定了源字符串的编码。 尽量保证所有的代码的编码一致,万不得已才使用iconv函数。

尽量不使用中文文件名作为服务器上保存的文件名,请将文件名转化成自己的文件名(即使是英文文件名也请转化一下)。



Statement:
The content of this article is voluntarily contributed by netizens, and the copyright belongs to the original author. This site does not assume corresponding legal responsibility. If you find any content suspected of plagiarism or infringement, please contact admin@php.cn