首页  >  文章  >  后端开发  >  为什么 Go 的 `encoding/csv` 包向 CSV 文件中的引用字符串添加额外的引号?

为什么 Go 的 `encoding/csv` 包向 CSV 文件中的引用字符串添加额外的引号?

Barbara Streisand
Barbara Streisand原创
2024-10-25 04:09:02473浏览

Why Does Go's `encoding/csv` Package Add Extra Quotes to Quoted Strings in CSV Files?

对 Go Encoding/CSV 中引用字符串的特殊 CSV 结果进行故障排除

Go 中的编码/csv 包一直是有关处理引用字符串的许多争论的主题在 CSV 文件中。本文旨在通过探索用户在将带引号的字符串写入 CSV 文件时遇到额外引号所观察到的有趣现象来阐明该问题。

额外引号之谜

用户提供的下面的代码片段来说明这个问题:

<code class="go">package main

import (
    "encoding/csv"
    "fmt"
    "os"
)

func main() {
    // Create a file to write CSV data
    f, err := os.Create("./test.csv")
    if err != nil {
        log.Fatal("Error: %s", err)
    }
    defer f.Close()

    // Initialize a CSV writer
    w := csv.NewWriter(f)

    // Unquoted string
    var record []string
    record = append(record, "Unquoted string")
    s := "Cr@zy text with , and \ and \" etc"
    record = append(record, s)
    fmt.Println(record)
    w.Write(record)

    // Quoted string
    record = make([]string, 0)
    record = append(record, "Quoted string")
    s = fmt.Sprintf("%q", s)
    record = append(record, s)
    fmt.Println(record)
    w.Write(record)

    // Flush the writer to save the changes
    w.Flush()
}</code>

运行此代码时,带引号的字符串的预期输出如下:

[Quoted string "Cr@zy text with , and \ and \" etc"]

但是,实际获得的输出是:

[Quoted string,"""Cr@zy text with , and \ and \"" etc"""]

引用字符串周围存在额外的引号令人费解,需要进一步调查。

了解 CSV 标准

问题的根源在于CSV(逗号分隔值)文件格式标准本身。根据标准,字段中使用的双引号 (") 必须由两个双引号 ("") 表示。这是出于解析目的转义字符的一种方法。

A (double) quote character in a field must be represented by two (double) quote characters.
  • [逗号分隔值 - 维基百科](https://en.wikipedia.org/wiki/Comma-separated_values)

对 CSV 写入的影响

将此规则应用于在代码中,用户确实使用 fmt.Sprintf("%q") 正确转义了引用字符串中的引号,但是,encoding/csv 包通过 surrou

[Unquoted string Cr@zy text with , and `\` and " etc]
[Quoted string `""""Cr@zy text with , and `\` and \"" etc""""`]

This 添加了额外的转义。为了遵守 CSV 标准,需要进行额外的转义,该标准要求字段可以选择用双引号引起来,并且字段内的双引号必须表示为双双引号。

避免额外的引号

虽然额外的引号是根据 CSV 编码规范添加的,但可以通过选择替代编码格式来避免它们。或者,如果您想严格遵循 CSV 标准,则可以通过将每个单双引号替换为来手动操作字符串。双双引号,如下所示:

<code class="go">s = strings.ReplaceAll(s, `"`, `""`)</code>

结论

在 Go 的编码/csv 包中将带引号的字符串写入 CSV 文件时观察到的特殊行为可以归因于 CSV 标准本身,这需要对双引号进行转义以进行解析。通过了解这种底层机制,您可以选择替代编码格式或手动处理字符串转义来实现您想要的结果。

以上是为什么 Go 的 `encoding/csv` 包向 CSV 文件中的引用字符串添加额外的引号?的详细内容。更多信息请关注PHP中文网其他相关文章!

声明:
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn