>웹 프론트엔드 >JS 튜토리얼 >JSON을 CSV로 내보내기: CSV 및 유니코드에 대한 참고 사항

JSON을 CSV로 내보내기: CSV 및 유니코드에 대한 참고 사항

王林
王林원래의
2024-07-27 00:00:03524검색

Export JSON to CSV: a note on CSV and Unicode

Excel로 내보낼 수 있는 JS 라이브러리가 여러 개 있습니다. 하지만 추가 종속성을 피하는 최소한의 접근 방식을 따르고 싶다면 어떻게 해야 할까요?

가장 간단한 접근 방식은 Excel에서 쉽게 열 수 있는 JSON에서 CSV를 생성하는 것입니다.

변환 논리를 보여주기 전에 CSV가 무엇인지, CSV 파일을 만들 때 어떤 인코딩을 사용해야 하는지부터 알아보겠습니다.

CSV 형식

이 RFC 4180 CSV(쉼표로 구분된 값) 파일에 대한 공통 형식 및 MIME 유형은 CSV 형식의 정의를 지정합니다. CSV 형식은 공식적으로 표준화되어 있지 않기 때문에 메모일 뿐입니다.

주요 정의

  1. 각 레코드는 줄 바꿈(CRLF)으로 구분된 별도의 줄에 있습니다.
  2. 파일의 마지막 기록에는 줄 바꿈이 있을 수도 있고 없을 수도 있습니다.
  3. 헤더에는 파일 전체에서 동일한 수의 필드가 포함되어야 합니다.
  4. 각 필드를 큰따옴표로 묶거나 묶지 않을 수 있습니다.
  5. 줄바꿈(CRLF), 큰따옴표, 쉼표가 포함된 필드는 큰따옴표로 묶어야 합니다.
  6. 필드를 묶는 데 큰따옴표를 사용하는 경우 필드 안에 나타나는 큰따옴표 앞에 다른 큰따옴표를 붙여 이스케이프해야 합니다.

부호화

내 JSON 데이터에는 csv 파일을 생성할 때 고려해야 하는 ISO Latin-1(ISO/IEC 8859-1) 문자 세트의 æ å ø 문자가 있습니다.

고려해야 할 Unicode® 표준 버전 15.0의 일부 발췌

유니코드 대 UTF-8/16/32

Unicode® 표준 버전 15.0에서:

  • 유니코드는 전 세계 스크립트의 149,186자를 포함하는 문자 및 텍스트에 대한 범용 문자 인코딩 표준입니다.
  • 유니코드 문자는 32비트 형식(UTF-32), 16비트 형식(UTF-16), 8비트 형식(UTF-8)의 세 가지 인코딩 형식 중 하나로 표현됩니다.
  • 유니코드 컨소시엄은 유니코드 표준을 구현하는 적합한 방법으로 세 가지 유니코드 인코딩 형식 중 하나를 사용하는 것을 전적으로 지지합니다. 예를 들어 "UTF-8과 유니코드"를 구별하려는 함정에 빠지지 않는 것이 중요합니다. UTF-8, UTF-16 및 UTF-32는 모두 유니코드 표준의 인코딩된 문자를 구현하는 데 동등하게 유효하고 적합한 방법입니다.

BOM(바이트 순서 표시)

  • 바이트 순서 표시에 사용되는 문자 U+FEFF(UTF-8 EF BB BF)를 제로 너비 중단 없는 공백이라고 합니다.
  • 유니코드 일반 텍스트의 UTF-16 및 UTF-32 인코딩 형식은 파일에 데이터를 쓸 때 사용되는 바이트 순서에 민감합니다.
  • 시작 부분의 바이트 시퀀스 식별 데이터 스트림은 데이터 스트림이 UTF-8 인코딩 체계를 사용하고 있다는 거의 확실한 표시로 간주될 수 있습니다.

즉, CSV 문자열 앞에 너비가 0인 구분 없는 공백을 추가하면 Excel에서 1252(서유럽어(Windows) 또는 U+FEFF 문자의 경우 Excel에서 선택하는 기타 인코딩) 대신 UTF-8 인코딩을 적용하게 됩니다. 제공되지 않습니다.

이 시리즈의 다음 게시물에서는 너비가 0인 구분 없는 공백을 사용하여 CSV 파일을 생성하는 것과 없는 것의 차이점을 보여 드리겠습니다...

위 내용은 JSON을 CSV로 내보내기: CSV 및 유니코드에 대한 참고 사항의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.