>웹 프론트엔드 >JS 튜토리얼 >Node.js 파일 인코딩 형식 변환 단계에 대한 자세한 설명

Node.js 파일 인코딩 형식 변환 단계에 대한 자세한 설명

php中世界最好的语言
php中世界最好的语言원래의
2018-05-15 10:53:501553검색

이번에는 Node.js파일 인코딩 형식을 변환하는 단계에 대해 자세히 설명하고, Node.js 파일 인코딩 형식을 변환할 때 주의사항은 무엇인지 살펴보겠습니다.

프로젝트에 UTF-8 형식이 아닌 Lua 파일이 많이 있습니다. EditPlus를 사용하여 보면 ASCII로 표시됩니다. BOM을 사용하는 경우도 있는데, 이는 이전에 이에 대해 작성한 적이 있으며 특정 규칙이 있습니다.

ASCII 인코딩은 정말 골치 아픈 일입니다. 온라인 리소스를 검색하고 반복적으로 테스트하고 비교한 후 마침내 다음과 같은 보다 안정적인 방법을 생각해 냈습니다(일부 EditPlus에서는 인코딩이 utf-8이라고 표시하지만 node.js 라이브러리는 다른 인코딩을 반환함). 인코딩>_< ;)

수정 사항이 올바른지 확인하려면 수정 후 SVN을 통해 제출하기만 하면 됩니다. 제출 목록을 찾아보고 제출할 파일을 두 번 클릭하면 아래와 같은 대화 상자가 표시됩니다. 수정이 성공했다는 뜻이고, 나머지는 다 보인다는 뜻입니다. 중국어의 경우 문자가 깨져서

var fs = require('fs');
var chardet = require('chardet');
var jschardet = require("jschardet");
var encoding = require("encoding");
var path = "lua目录";
function readDirectory(dirPath) {
  if (fs.existsSync(dirPath)) {
    var files = fs.readdirSync(dirPath);
    files.forEach(function (file) {
      var filePath = dirPath + "/" + file;
      var stats = fs.statSync(filePath);
      if (stats.isDirectory()) {
        // console.log('/n读取目录:\n', filePath, "\n");
        readDirectory(filePath);
      } else if (stats.isFile() && /\.lua$/.test(filePath)) {
        var buff = fs.readFileSync(filePath);
        if (buff.length && buff[0].toString(16).toLowerCase() == "ef" && buff[1].toString(16).toLowerCase() == "bb" && buff[2].toString(16).toLowerCase() == "bf") {
          //EF BB BF 239 187 191
          console.log('\n发现BOM文件:', filePath, "\n");
          buff = buff.slice(3);
          fs.writeFile(filePath, buff.toString(), "utf8");
        }
        // { encoding: 'UTF-8', confidence: 0.99 }
        // var charset = chardet.detectFileSync(filePath);
        var info = jschardet.detect(buff);
        if (info.encoding == "GB2312" || info.encoding == "ascii") {
          var resultBuffer = encoding.convert(buff, "UTF-8", info.encoding);
          fs.writeFile(filePath, resultBuffer, "utf8");
        }
        else if (info.encoding != "UTF-8" && chardet.detectFileSync(filePath) != "UTF-8")
        {
          if (buff.toString().indexOf("\r\n") > -1)
          {
            var resultBuffer = encoding.convert(buff, "UTF-8", "GBK");
            fs.writeFile(filePath, resultBuffer, "utf8");
          }
        }
      }
    });
  } else {
    console.log('Not Found Path : ', dirPath);
  }
}
readDirectory(path);

위의 판단에 주의하세요. 첫 번째가 GB2312 또는 ascii인 경우 해당 항목을 직접 변환하세요. utf-8로 인코딩합니다. 그리고 반환된 형식이 이면 먼저 PC 아래에 줄 바꿈 문자가 있는지 확인하고, 그렇다면 모두 GBK로 처리하여 처리합니다.

전체 아이디어는 실제로 비교적 간단합니다. 파일 인코딩 형식을 판단하는 데 어려움이 있습니다. 이건 정말 어렵습니다>_<원래 인코딩 형식을 얻은 후, 인코딩.convert(버프, 대상 인코딩 형식, 원본 인코딩 형식)을 호출하여 필요한 인코딩을 가져옵니다. 시간이 있고 관심이 있다면 Notepad++의 소스 코드를 다운로드하여 파일의 인코딩 형식을 결정하는 방법을 확인할 수 있습니다. 참고: 위 방법으로 수정된 파일은 제출해야 하는 파일 목록과 일치합니다. Mac에서는 적어도 현재 발생한 문제를 해결할 수 있습니다. 특별한 점이 있다면 위의 코드를 수정하시면 됩니다.

사용된 타사 라이브러리:

encoding

https://

github.com/andris9/encodingjschardet https://github.com/aadsm/jschardetnode-chardet https://github.com/ runk /node-chardet

이 기사의 사례를 읽으신 후 방법을 마스터하셨다고 생각합니다. 더 흥미로운 정보를 보려면 PHP 중국어 웹사이트의 다른 관련 기사를 주목하세요!

추천 자료:

PopupWindow 구성 요소 사용 단계 분석의 Vue 구현


vue+jquery+lodash 슬라이딩 시 상단 부동 고정 기능에 대한 자세한 설명

위 내용은 Node.js 파일 인코딩 형식 변환 단계에 대한 자세한 설명의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.