FileReader 输出中包含 BOM 标记
使用 FileReader 读取带有 BOM(字节顺序标记)的 UTF-8 编码文件时),BOM 标记可能会无意中出现在输出字符串中。发生这种情况是因为 BOM 包含在文本的 UTF-8 编码表示形式中。
要了解发生这种情况的原因,请务必注意,BOM 是一个特殊字符或字符序列,用于指示文本文件的编码。在 UTF-8 的情况下,BOM 由字节序列 EFBBBF 表示。
当 FileReader 读取文件时,它使用 UTF-8 编码对字符进行解码。但是,BOM 不是有效的 Unicode 字符,因此在解码过程中不会跳过或删除它。相反,它包含在 readLine() 方法返回的字符串中。
要避免此问题,您可以使用以下方法:
以上是为什么在读取 UTF-8 编码文件时,FileReader 输出中会出现 BOM 标记?的详细内容。更多信息请关注PHP中文网其他相关文章!