php读取csv文件后,uft8 bom导致在页面上显示出现问题的解决方法

首页

后端开发

php教程

php读取csv文件后,uft8 bom导致在页面上显示出现问题的解决方法_PHP

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Jun 01, 2016 pm 12:03 PM

bom

date.csv:
"ID" "NAME" "EMAIL"
"1" "小明" "xm@163.com"
"2" "小东" "xd@sina.com"
"3" "小少" "shaozi@hotmai.com"

读取这个csv文件
复制代码代码如下:
$handle=fopen('date.csv','r');
while($data=fgetcsv($handle,10000,"/t"))
{
echo "$data[0]"."$data[1]"."$data[2]";
}
?>

读取后在页面上显示时，成了这样：
"ID" NAME EMAIL
1 小明 xm@163.com
2 小东 xd@sina.com
3 小少 shaozi@hotmai.com
fgetcsv函数的字段环绕符默认是双引号,
为什么我读取出来时，其它字段都好好的，可是ID还有双引号包着？

上网查了下，原来是utf8编码的bom在php下无法识别.
下面是查来的资料：
Unicode规范中有一个BOM的概念。BOM——Byte Order Mark，就是字节序标记。在
这里
找到一段关于BOM的说明：
在UCS 编码中有一个叫做"ZERO WIDTH NO-BREAK SPACE"的字符，它的编码是FEFF。而FFFE在UCS中是不存在的字符，所以不应该出现在实际传输中。UCS规范建议我们在传输字节流前，先传输字符"ZERO WIDTH NO-BREAK SPACE"。这样如果接收者收到FEFF，就表明这个字节流是Big-Endian的；如果收到FFFE，就表明这个字节流是Little-Endian的。因此字符"ZERO WIDTH NO-BREAK SPACE"又被称作BOM。

UTF-8不需要BOM来表明字节顺序，但可以用BOM来表明编码方式。字符"ZERO WIDTH NO-BREAK SPACE"的UTF-8编码是EF BB BF。所以如果接收者收到以EF BB BF开头的字节流，就知道这是UTF-8编码了。
Windows就是使用BOM来标记文本文件的编码方式的。

另外unicode网站的
FAQ-BOM
详细介绍了BOM。官方的自然权威，不过是英文的，看起来比较费劲。
UTF-8编码的文件中，BOM占三个字节。如果用记事本把一个文本文件另存为UTF-8编码方式的话，用UE打开这个文件，切换到十六进制编辑状态就可以看到开头的FFFE了。这是个标识UTF-8编码文件的好办法，软件通过BOM来识别这个文件是否是UTF-8编码，很多软件还要求读入的文件必须带BOM。可是，还是有很多软件不能识别BOM。我在研究Firefox的时候就知道，在Firefox早期的版本里，扩展是不能有BOM的，不过Firefox 1.5以后的版本已经开始支持BOM了。现在又发现，PHP也不支持BOM。

PHP在设计时就没有考虑BOM的问题，也就是说他不会忽略UTF-8编码的文件开头BOM的那三个字符。由于必须在转换->UTF-8转ASCII，或者在另存为里选择ASCII编码。如果是DOS格式的行尾符，可以用记事本打开，点另存为，选ASCII编码。如果包含中文字符的话，可以用UE的另存为功能，选择“UTF-8 无 BOM”即可。请参考下面的图片：

根据Bo-Blog的wiki的说明：Editplus需要先另存为gb，再另存为UTF-8。不过这样做要小心，所有GBK编码中不包含的字符就会都丢了。如果有一些非中文的字符在文件里的话还是不要用这种办法了。(从这一个小方面来看，UE——UltraEdite-32确实比Editplus好很多，Editplus太轻量级了)

另外我发现了一个办法，就是利用Wordpress提供的文件编辑器。这个办法不受限制，不需要去下载专门的编辑器，毕竟大家都在用Wordpress嘛。先在ftp里把要编辑的文件的写入权限打开，然后进入Wordpress后台->管理->文件编辑器，输入要编辑文件的路径，点编辑文件。在显示出来的编辑界面中，你是看不到开头的那三个字符的，不过没关系，把光标定位在整个文件的第一个字符前，按一下Backspace键。OK了，点更新文件吧，在ftp里刷新一下，可以看到文件小了3字节，大功告成。

最后说一下，这是个大问题，所有要自己写插件的，编辑别人的插件自己用的，需要修改模版的(这条估计每个人都需要吧)，最好了解一下上面的知识，免得出现问题时不知所措。

声明

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

dom和bom对象有哪些Nov 13, 2023 am 10:52 AM

dom和bom对象有：1、“document”、“element”、“Node”、“Event”和“Window”等5种DOM对象；2、“window”、“navigator”、“location”、“history”和“screen”等5种BOM对象。

bom和dom有什么区别Nov 13, 2023 pm 03:23 PM

bom和dom在作用和功能、与JavaScript的关系、相互依赖性、不同浏览器的兼容性和安全性考虑等方面都有区别。详细介绍：1、作用和功能，BOM的主要作用是操作浏览器窗口，它提供了浏览器窗口的直接访问和控制，而DOM的主要作用则是将网页文档转换为一个对象树，允许开发者通过这个对象树来获取和修改网页的元素和内容；2、与JavaScript的关系等等。

探究PHP bom的含义和作用Mar 10, 2024 pm 10:45 PM

PHPbom的含义和作用在PHP编程中，BOM（ByteOrderMark）是一种特殊的字符序列，用于标识文件的编码方式和字节顺序。BOM通常是在文件开头的位置插入的，以便让解析器识别编码方式，特别是对于一些不以ASCII编码开始的编码格式，例如UTF-8。BOM在不同的编码格式下有不同的作用，下面将具体探究PHP中BOM的含义和作用，并结合代码示例加

dom和bom实现了什么Nov 20, 2023 pm 02:28 PM

DOM实现了对网页内容的动态访问和更新，BOM则提供了与浏览器窗口进行交互的API，包括控制浏览器的行为、获取浏览器和用户环境的信息，DOM主要用于操作网页内容，而BOM则主要用于操作浏览器窗口和与浏览器交互，两者共同构成了Web前端开发中重要的基础，为开发者提供了丰富的方法来控制和操作网页及浏览器，实现交互性强、用户体验良好的Web应用程序。

php 代码怎么去掉bomOct 20, 2022 am 09:29 AM

php代码掉bom的方法：1、使用“function clearbom($contents){...}”方式去掉文本中的bom头；2、通过“function checkBOM ($filename) {...}”方法检测并去掉bom头；3、通过“function SearchBOM($string) {...}”方法搜索当前文件是否有BOM并去除即可。

PHP bom的定义及其应用场景Mar 09, 2024 pm 09:36 PM

PHPBOM的定义及其应用场景BOM（ByteOrderMark），即字节顺序标记，是一种用来标示文本编码格式的特殊字符序列。在PHP开发中，BOM通常用来解决一些特定的编码问题，在一些情况下，如果不正确地处理BOM可能会导致页面显示乱码或其他问题的发生。本文将详细介绍PHPBOM的定义以及其应用场景，并附上具体的代码示例来让读者更好地理解。一、PH

bom和dom是什么模型Nov 13, 2023 pm 05:08 PM

BOM是浏览器对象模型，而DOM是文档对象模型。BOM是一种用于描述浏览器窗口和浏览器提供的各种对象的模型，它是浏览器的核心组成部分，通过BOM可以访问和操作浏览器窗口、框架等对象。DOM提供了一组API，使开发人员能够通过脚本语言访问和操作文档中的元素和属性，其核心概念包括节点、元素、属性、文本等，DOM树的根节点是document对象，通过该对象可以访问整个文档的内容。

前端bom和dom什么区别Nov 13, 2023 pm 02:36 PM

区别有：1、含义不同，bom是指浏览器对象模型，dom是指文档对象模型；2、结构不同，bom以浏览器窗口为中心，dom文档中的元素被表示为节点，并按照树状结构进行组织；3、交互方式不同，bom通过Window对象与JS进行交互，dom通过对象之间的嵌套和引用进行交互；4、应用范围不同，bom用于浏览器窗口和浏览器的交互，dom用于文档内容的操作和交互；5、发展趋势不同等等。

See all articles