Node.js を使用してフロントエンドコードのエンコードの問題に対処する files

ホームページ

ウェブフロントエンド

jsチュートリアル

Node.js を使用してフロントエンドコードのエンコードの問題に対処する files_node.js

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

May 16, 2016 pm 03:15 PM

javascriptnodenode.jsコーディング

NodeJS を使用してフロントエンドツールを作成する場合、最も一般的に使用されるのはテキストファイルであるため、ファイルエンコーディングの問題も関係します。一般的に使用されるテキストエンコーディングは UTF8 と GBK で、UTF8 ファイルには BOM が含まれる場合もあります。異なるエンコーディングのテキストファイルを読み取る場合は、ファイルの内容を通常に処理する前に、JS で使用される UTF8 エンコード文字列に変換する必要があります。

BOM の削除
BOM は、Unicode エンコードを使用してテキストファイルをマークするために使用されます。BOM 自体は、テキストファイルのヘッダーにある Unicode 文字 (「uFEFF」) です。さまざまな Unicode エンコードでは、BOM 文字に対応するバイナリバイトは次のとおりです:

  Bytes   Encoding
----------------------------
  FE FF    UTF16BE
  FF FE    UTF16LE
  EF BB BF  UTF8

したがって、テキストファイルの最初の数バイトが何に等しいかに基づいて、ファイルに BOM が含まれているかどうか、およびどの Unicode エンコードを使用するかを決定できます。ただし、BOM 文字はファイルのエンコーディングをマークする役割を果たしますが、テキストファイルを読み取るときに BOM が削除されない場合、特定の使用シナリオで問題が発生します。たとえば、複数の JS ファイルを 1 つのファイルにマージした後、ファイルに BOM 文字が含まれていると、ブラウザーの JS 構文エラーが発生します。したがって、NodeJS を使用してテキストファイルを読み取る場合は、通常、BOM を削除する必要があります。たとえば、次のコードは、UTF8 BOM を識別して削除する機能を実装します。

function readText(pathname) {
  var bin = fs.readFileSync(pathname);

  if (bin[0] === 0xEF && bin[1] === 0xBB && bin[2] === 0xBF) {
    bin = bin.slice(3);
  }

  return bin.toString('utf-8');
}

GBK から UTF8 へ
NodeJS は、テキストファイルを読み取るとき、またはバッファーを文字列に変換するときにテキストエンコーディングの指定をサポートしていますが、残念ながら、GBK エンコーディングは NodeJS 自体のサポートの範囲内ではありません。したがって、通常はサードパーティのパッケージ iconv-lite を使用してエンコードを変換します。 NPM を使用してパッケージをダウンロードした後、次のように GBK テキストファイルを読み取る関数を作成できます。

var iconv = require('iconv-lite');

function readGBKText(pathname) {
  var bin = fs.readFileSync(pathname);

  return iconv.decode(bin, 'gbk');
}

シングルバイトエンコーディング
場合によっては、読み取る必要があるファイルがどのエンコーディングを使用しているかを予測できないため、正しいエンコーディングを指定できません。たとえば、処理する必要がある CSS ファイルの一部は GBK でエンコードされ、一部は UTF8 でエンコードされます。ファイルのバイト内容に基づいてテキストのエンコーディングをある程度推測することは可能ですが、ここで紹介するのはある程度限定的ではありますが、より簡単な手法です。

まず、テキストファイルに Hello World などの英語の文字のみが含まれている場合は、GBK エンコードまたは UTF8 エンコードを使用してファイルを読み取ることに問題はないことがわかっています。これは、これらのエンコーディングでは、ASCII0 ～ 128 の範囲の文字が同じシングルバイトエンコーディングを使用するためです。

一方、テキストファイル内に中国語などの文字が含まれていても、コメントや文字列を除くJSコードなど、処理する必要がある文字がASCII0～128の範囲のみであれば、ファイルを読み取る際のエンコーディングは一律に 1 バイトです。ファイルの実際のエンコーディングが GBK か UTF8 かを気にする必要はありません。次の例は、このアプローチを示しています。

1. GBK エンコードソースファイルの内容:

  var foo = '中文';

2. 対応するバイト:

  76 61 72 20 66 6F 6F 20 3D 20 27 D6 D0 CE C4 27 3B

3. シングルバイトエンコードを使用して読み取った後に取得されるコンテンツ:

  var foo = '{乱码}{乱码}{乱码}{乱码}';

4. 置換内容:

  var bar = '{乱码}{乱码}{乱码}{乱码}';

5. シングルバイトエンコーディングを使用して保存した後の対応するバイト:

  76 61 72 20 62 61 72 20 3D 20 27 D6 D0 CE C4 27 3B

6. GBK エンコードを使用してコンテンツを読み取り、取得します。

  var bar = '中文';

ここでのコツは、0xEF より大きい 1 バイトが 1 バイトエンコーディングでどのような文字化けに解析されたとしても、これらの文字化けが同じ 1 バイトエンコーディングで保存されると、その後ろにある対応するバイトは変更されないということです。

NodeJS には、このメソッドの実装に使用できるバイナリエンコーディングが付属しています。そのため、次の例では、このエンコーディングを使用して、上記の例に対応するコードを記述する方法を示します。

function replace(pathname) {
  var str = fs.readFileSync(pathname, 'binary');
  str = str.replace('foo', 'bar');
  fs.writeFileSync(pathname, str, 'binary');
}

声明

この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

JavaScriptの役割：WebをインタラクティブでダイナミックにするApr 24, 2025 am 12:12 AM

JavaScriptは、Webページのインタラクティブ性とダイナミズムを向上させるため、現代のWebサイトの中心にあります。 1）ページを更新せずにコンテンツを変更できます。2）Domapiを介してWebページを操作する、3）アニメーションやドラッグアンドドロップなどの複雑なインタラクティブ効果、4）ユーザーエクスペリエンスを改善するためのパフォーマンスとベストプラクティスを最適化します。

CおよびJavaScript：接続が説明しましたApr 23, 2025 am 12:07 AM

CおよびJavaScriptは、WebAssemblyを介して相互運用性を実現します。 1）CコードはWebAssemblyモジュールにコンパイルされ、JavaScript環境に導入され、コンピューティングパワーが強化されます。 2）ゲーム開発では、Cは物理エンジンとグラフィックスレンダリングを処理し、JavaScriptはゲームロジックとユーザーインターフェイスを担当します。

Webサイトからアプリまで：JavaScriptの多様なアプリケーションApr 22, 2025 am 12:02 AM

JavaScriptは、Webサイト、モバイルアプリケーション、デスクトップアプリケーション、サーバー側のプログラミングで広く使用されています。 1）Webサイト開発では、JavaScriptはHTMLおよびCSSと一緒にDOMを運用して、JQueryやReactなどのフレームワークをサポートします。 2）ReactNativeおよびIonicを通じて、JavaScriptはクロスプラットフォームモバイルアプリケーションを開発するために使用されます。 3）電子フレームワークにより、JavaScriptはデスクトップアプリケーションを構築できます。 4）node.jsを使用すると、JavaScriptがサーバー側で実行され、高い並行リクエストをサポートします。

Python vs. JavaScript：ユースケースとアプリケーションと比較されますApr 21, 2025 am 12:01 AM

Pythonはデータサイエンスと自動化により適していますが、JavaScriptはフロントエンドとフルスタックの開発により適しています。 1. Pythonは、データ処理とモデリングのためにNumpyやPandasなどのライブラリを使用して、データサイエンスと機械学習でうまく機能します。 2。Pythonは、自動化とスクリプトにおいて簡潔で効率的です。 3. JavaScriptはフロントエンド開発に不可欠であり、動的なWebページと単一ページアプリケーションの構築に使用されます。 4. JavaScriptは、node.jsを通じてバックエンド開発において役割を果たし、フルスタック開発をサポートします。

JavaScript通訳者とコンパイラにおけるC/Cの役割Apr 20, 2025 am 12:01 AM

CとCは、主に通訳者とJITコンパイラを実装するために使用されるJavaScriptエンジンで重要な役割を果たします。 1）cは、JavaScriptソースコードを解析し、抽象的な構文ツリーを生成するために使用されます。 2）Cは、Bytecodeの生成と実行を担当します。 3）Cは、JITコンパイラを実装し、実行時にホットスポットコードを最適化およびコンパイルし、JavaScriptの実行効率を大幅に改善します。

JavaScript in Action：実際の例とプロジェクトApr 19, 2025 am 12:13 AM

現実世界でのJavaScriptのアプリケーションには、フロントエンドとバックエンドの開発が含まれます。 1）DOM操作とイベント処理を含むTODOリストアプリケーションを構築して、フロントエンドアプリケーションを表示します。 2）node.jsを介してRestfulapiを構築し、バックエンドアプリケーションをデモンストレーションします。

JavaScriptとWeb：コア機能とユースケースApr 18, 2025 am 12:19 AM

Web開発におけるJavaScriptの主な用途には、クライアントの相互作用、フォーム検証、非同期通信が含まれます。 1）DOM操作による動的なコンテンツの更新とユーザーインタラクション。 2）ユーザーエクスペリエンスを改善するためにデータを提出する前に、クライアントの検証が実行されます。 3）サーバーとのリフレッシュレス通信は、AJAXテクノロジーを通じて達成されます。

JavaScriptエンジンの理解：実装の詳細Apr 17, 2025 am 12:05 AM

JavaScriptエンジンが内部的にどのように機能するかを理解することは、開発者にとってより効率的なコードの作成とパフォーマンスのボトルネックと最適化戦略の理解に役立つためです。 1）エンジンのワークフローには、3つの段階が含まれます。解析、コンパイル、実行。 2）実行プロセス中、エンジンはインラインキャッシュや非表示クラスなどの動的最適化を実行します。 3）ベストプラクティスには、グローバル変数の避け、ループの最適化、constとletsの使用、閉鎖の過度の使用の回避が含まれます。

See all articles

ホットAIツール

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

脱衣画像を無料で

Clothoff.io

AI衣類リムーバー

Video Face Swap

完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

ホットツール

SublimeText3 英語版

推奨: Win バージョン、コードプロンプトをサポート!

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中国語版

中国語版、とても使いやすい

mPDF

mPDF は、UTF-8 でエンコードされた HTML から PDF ファイルを生成できる PHP ライブラリです。オリジナルの作者である Ian Back は、Web サイトから「オンザフライ」で PDF ファイルを出力し、さまざまな言語を処理するために mPDF を作成しました。 HTML2FPDF などのオリジナルのスクリプトよりも遅く、Unicode フォントを使用すると生成されるファイルが大きくなりますが、CSS スタイルなどをサポートし、多くの機能強化が施されています。 RTL (アラビア語とヘブライ語) や CJK (中国語、日本語、韓国語) を含むほぼすべての言語をサポートします。ネストされたブロックレベル要素 (P、DIV など) をサポートします。