nodejsの文字セット変換-フロントエンドQ&A-php.cn

ホームページ

ウェブフロントエンド

フロントエンドQ&A

nodejsの文字セット変換

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

May 13, 2023 pm 05:31 PM

Node.js は非常に人気のあるサーバーサイド JavaScript 実行環境ですが、Node.js アプリケーションを作成する場合、必然的に文字セットの変換が必要になります。中国語、日本語、韓国語、その他のシステムを扱う場合は、文字セットの変換が必要です。これにより、さまざまなエンコード形式のテキストを正しく処理できるようになります。

この記事では、Node.js での文字セット変換と、エンコード変換に iconv ライブラリを使用する方法を紹介します。

1. 文字セットの概要

コンピュータにおいて、文字セットは文字を数値コードにマッピングするスキームです。実際のアプリケーションでは、通常、ASCII、Unicode、UTF-8 などの文字エンコーディングを使用します。

ASCII (American Standard Code for Information Interchange、American Standard Code for Information Interchange) は、最も初期の文字エンコーディングの 1 つで、英語、数字、および少数の特殊文字のみをサポートします。 ASCII エンコードには合計 128 文字があり、7 バイナリビットで表され、最上位ビットは 0 です。 ASCII エンコーディングは後に拡張され、Latin-1、ISO-8859 シリーズなど、より多くの文字セットをサポートするようになりました。

Unicode は、世界中のさまざまな言語のすべての文字を含み、それらに固有のコードを割り当てる、世界的に統一された文字エンコーディングスキームです。 Unicode エンコードには合計 1,114,112 文字があり、そのうち 0x0000 から 0xFFFF までの文字は Basic Multilingual Plane (BMP) 文字と呼ばれる 16 ビットエンコードに対応し、0x010000 から 0x10FFFF までの文字は 32 ビットエンコードと呼ばれる 32 ビットエンコードに対応します。補助フラット文字。 Unicode エンコードには、UTF-8、UTF-16 などの複数の表現方法があります。

UTF-8 (Unicode Transformation Format-8、Unicode Transformation Format 8-bit) は、1 ～ 4 バイトを使用して文字を表すことができる可変長 Unicode エンコードであり、すべての Unicode 文字をサポートします。 UTF-8 エンコードでも、ASCII 文字は 1 バイトで表現されますが、漢字などの非 ASCII 文字は 2 ～ 3 バイトで表現されるため、ASCII エンコードと互換性があり、さまざまな言語の文字を保存することもできます。

2. Node.js 文字セット変換

Node.js は、バイナリデータをメモリに保存できる Buffer クラスをネイティブに提供し、通常、ネットワーク送信やファイル読み取りなどのシナリオで使用されます。書き込み。外部リソースからバイナリデータを読み取る場合は、文字セットをデコードしてバイナリデータを読み取り可能な文字列に変換する必要があり、文字列をバイナリデータに変換する場合は、エンコードして文字を変換する必要があります。

Node.js は、バイナリデータの部分的なエンコード変換を実行できる、buffer.toString()、Buffer.from() などのいくつかの組み込み文字セット変換モジュールを提供します。例:

const buf = Buffer.from('中文');
console.log(buf.toString('utf8')); // 中文
console.log(buf.toString('ascii')); // ��w�
console.log(buf.toString('base64')); // 5Lit5paH

上記の例では、文字列「中国語」を Buffer オブジェクトに変換し、toString() メソッドを使用して他のエンコード形式に変換します。 utf8 エンコード結果は正しいですが、ASCII エンコードおよび Base64 エンコード結果は正しくありません。

Node.js では、文字列変換にデフォルトで utf8 エンコーディングが使用されます。変換する文字セットが utf8 と互換性がない場合は、文字セット変換に iconv などのサードパーティライブラリを使用する必要があります。

3. 文字セット変換に iconv ライブラリを使用する

iconv は、異なる文字セット間の変換に使用される無料のオープンソース C ライブラリです。 Node.js には iconv-lite という NPM モジュールがあり、iconv ライブラリのパッケージであり、高パフォーマンスの文字セット変換機能を提供します。

次にiconv-liteを使って文字セット変換を行う方法を紹介します。

1. iconv-lite のインストール

まず、iconv-lite をインストールする必要があります。

npm install iconv-lite

2. 文字列エンコード変換

iconv-lite を使用してエンコード変換を実行するのは非常に簡単で、対応するメソッドを呼び出すだけです。たとえば、GB2312 でエンコードされた文字列を UTF-8 エンコードに変換します。

const iconv = require('iconv-lite');
const str = '中文字符串';
const buf = iconv.encode(str, 'gb2312');
const str2 = iconv.decode(buf, 'utf8');
console.log(str2); // 中文字符串

上の例では、まず iconv.encode メソッドを使用して GB2312 でエンコードされた文字列を Buffer オブジェクトに変換します。 use iconv.decode メソッドは、Buffer オブジェクトを UTF-8 でエンコードされた文字列に変換します。変換された文字列は正しい中国語の文字列です。

3. ストリームエンコード変換

大きなファイルを処理する場合、エンコード変換にストリームを使用する必要がある場合があります。ここでは、iconv-lite が提供する iconv-lite-stream ライブラリを使用して、ストリームエンコード変換を簡単に実装できます。たとえば、Shift_JIS エンコードされたファイルを UTF-8 エンコードに変換します。

const iconv = require('iconv-lite');
const fs = require('fs');
const iconvStream = iconv.decodeStream('Shift_JIS');
const inputStream = fs.createReadStream('shift-jis-file.txt');
const outputStream = fs.createWriteStream('utf8-file.txt');
inputStream.pipe(iconvStream).pipe(outputStream);

上の例では、まず読み取り可能なストリームを作成し、Shift_JIS エンコードされたファイルを読み取り、次に書き込み可能なストリームを作成し、UTF を書き込みます。 -8 でエンコードされたファイル。同時に、iconv.decodeStream メソッドによって Shift_JIS でエンコードされたストリームを作成し、読み取り可能なストリームと書き込み可能なストリームと連鎖させて、ストリームのエンコード変換を実現しました。

4. 概要

この記事では、Node.js での文字セット変換と、エンコード変換に iconv-lite ライブラリを使用する方法を紹介しました。文字セット変換は、中国語、日本語、韓国語などのシステムを扱う場合に非常に必要な機能であり、文字セット変換を正しく使用することで、文字化けなどの問題を効果的に回避できます。この記事が、読者が Node.js における文字セット変換をより深く理解するのに役立つことを願っています。

以上がnodejsの文字セット変換の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明

この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

Reactの限界は何ですか？May 02, 2025 am 12:26 AM

raceslimitationsinclude：1）asteeplearningcurveduetoitsvastecosystem、2）seochallengeswithsclient-siderEndering、3）潜在的なパフォーマンスのinlargeapplications、4）complenstatemanagementasappsgrow、and5）suneedtokeepupwithovolution

Reactの学習曲線：新しい開発者にとっての課題May 02, 2025 am 12:24 AM

ReactisChallengingを使用して、SteepLearNdParadigMshiftOconpontenAchitecture.1）startisofficialdocumentation forasolidfoundation.2）relondingjsxandjavascriptwithinit.3）LearntousefunctionalcompotontiTateを理解してください

反応の動的リストの安定したユニークなキーを生成するMay 02, 2025 am 12:22 AM

coreChallengeingEneratingは、duniqueys consinistinsidentifientiversre-renderseforeffiencedomupdates.1）aseenaturalKeysisisisisisisisedisederiableiableiaibuniqueandStable.2）denatekeysBaseTheBasedOnMultipreattributive.2）を無効にすることを非難することを解決します

JavaScriptの疲労：Reactとそのツールで最新の状態を維持しますMay 02, 2025 am 12:19 AM

javascriptfatigueinReactismainageable with rikeislikedivedingingindininginginformationscors.1）whatyouneedwhenyouneedit、focusingonprojectrelevance.2）

UseState（）フックを使用するコンポーネントをテストしますMay 02, 2025 am 12:13 AM

ESTESTROACTCOMPONENTSINGTHESESTATEHOOK、USEJESTANDREACTINTINGLIBRARYTOSIMULATE INTERACTIONSIONDANDVERIFYISTAMESISINTHEUI.1）RENDERTHECONCENTANDCHECKECHINITATA.2）SimulateUserIractionSionsionsionsionsionsionslikeClickSorformSubmissions.3）

Reactのキー：パフォーマンスの最適化技術への深い飛び込みMay 01, 2025 am 12:25 AM

keysinReactarecialforptimizingperformancebyididingineffictientListupdates.1）usekeystoidentifideidifyandtracklistelements.2）ArrayIndicesassyStopreventPerformanceSues.3）suoseStableidedifierslikeItem.idtomaincomentaindtateandiproveperift

Reactのキーとは何ですか？May 01, 2025 am 12:25 AM

ReactKeySareUniqueIdentifiersiersiderSuredStrovereconconiniationEfficiency.1）theyctrackChangesinListitems、2）sultanduniqueidentifiersiirsiTeemidssisssississmendを使用して、3）ArrayIndicesAssayStopReventisSuseSUSEORINGを回避します

反応におけるユニークな鍵の重要性：一般的な落とし穴を避けるMay 01, 2025 am 12:19 AM

sinqueysarecrucialinReactforoptimizing andMaintainingcomponentStateIntegrity.1）useanaturaluniqueidentifierfromyourdataifaibable.2）ifnonaturalidentifierexists、発電済みのKeyusingingingingalibrarylikuuid.3）

See all articles

ホットAIツール

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

脱衣画像を無料で

Clothoff.io

AI衣類リムーバー

Video Face Swap

完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

ホットツール

SecLists

SecLists は、セキュリティテスターの究極の相棒です。これは、セキュリティ評価中に頻繁に使用されるさまざまな種類のリストを 1 か所にまとめたものです。 SecLists は、セキュリティテスターが必要とする可能性のあるすべてのリストを便利に提供することで、セキュリティテストをより効率的かつ生産的にするのに役立ちます。リストの種類には、ユーザー名、パスワード、URL、ファジングペイロード、機密データパターン、Web シェルなどが含まれます。テスターはこのリポジトリを新しいテストマシンにプルするだけで、必要なあらゆる種類のリストにアクセスできるようになります。

AtomエディタMac版ダウンロード

最も人気のあるオープンソースエディター

EditPlus 中国語クラック版

サイズが小さく、構文の強調表示、コードプロンプト機能はサポートされていません

PhpStorm Mac バージョン

最新(2018.2.1)のプロフェッショナル向けPHP統合開発ツール

DVWA

Damn Vulnerable Web App (DVWA) は、非常に脆弱な PHP/MySQL Web アプリケーションです。その主な目的は、セキュリティ専門家が法的環境でスキルとツールをテストするのに役立ち、Web 開発者が Web アプリケーションを保護するプロセスをより深く理解できるようにし、教師/生徒が教室環境で Web アプリケーションを教え/学習できるようにすることです。安全。 DVWA の目標は、シンプルでわかりやすいインターフェイスを通じて、さまざまな難易度で最も一般的な Web 脆弱性のいくつかを実践することです。このソフトウェアは、