Home > Article > Backend Development > What to do if php files are uploaded with Chinese garbled characters, and the problem with Chinese garbled characters in php file names
php上传代码:
上传了一个文件名为“测试数据.txt”的文件,oh ho,文件是传上去了,但是文件名为乱码。 以下是php文件上传乱码的原因分析,并给出了一些可靠的解决方法。 将: move_uploaded_file($_FILES["file"]["tmp_name"], "upload/" . $_FILES["file"]["name"]);修改为: move_uploaded_file($_FILES["file"]["tmp_name"],"upload/" . iconv("UTF-8","gbk",$_FILES["file"]["name"]));结果发现iconv函数返回值为false。 查一下函数手册,发现第二个参数有特别的用法,简单翻译一下就是我可以在编码的后面追加//TRANSLIT 或 //IGNORE ,前者会将无法翻译的字符转成最接近的字符,后者就是直接忽略不能转化的字符。 如下图: 测试: var_dump( iconv("UTF-8","gbk//TRANSLIT",$_FILES["file"]["name"])); var_dump( iconv("UTF-8","gbk//IGNORE",$_FILES["file"]["name"]));结果: bool(false) string(4) ".txt" 也就是说中文都没法转化,甚至连接近的字符都没有,看来网上介绍的方法也并非万能。 3、网上介绍方法失败,再尝试 猜测一下,也许系统在创建中文文件的时候会乱码,修改代码: move_uploaded_file($_FILES["file"]["tmp_name"], "upload/测试数据.txt");结果创建成功,没有乱码。不是系统问题。 php文件本身是utf8编码的,那么 move_uploaded_file($_FILES["file"]["tmp_name"],"upload/测试数据.txt");这个语句肯定使用的是utf8编码,那么之前上传的文件名肯定就不是utf8编码了,那么以下的语句肯定是错误的,因为源字符串本身就不是utf8编码的: iconv("UTF-8","gbk//TRANSLIT",$_FILES["file"]["name"]);使用函数检查源字符串的编码: $e=mb_detect_encoding($text, array(‘UTF-8', ‘GBK','gb2312')); echo $e;结果是CP936,也就是源字符串编码是GBK。 测试: move_uploaded_file($_FILES["file"]["tmp_name"],"upload/" . iconv("gbk","UTF-8",$_FILES["file"]["name"]));问题解决,不再有中文乱码问题了。 4、其它解决方法,在html文件的head标签中间加入: 从而使编码保持统一,也就不需要再转码了。 5、小结 使用iconv函数可以解决上传中文文件名乱码的问题,实际上iconv能解决各种各样的由于编码不统一造成的乱码问题。 使用iconv函数请先检查源字符串的编码,除非你已经确定了源字符串的编码。 尽量保证所有的代码的编码一致,万不得已才使用iconv函数。 尽量不使用中文文件名作为服务器上保存的文件名,请将文件名转化成自己的文件名(即使是英文文件名也请转化一下)。 |