Heim >Web-Frontend >Front-End-Fragen und Antworten >Verstümmelte chinesische Zeichen, die von nodejs empfangen wurden

Verstümmelte chinesische Zeichen, die von nodejs empfangen wurden

PHPz
PHPzOriginal
2023-05-08 09:33:06862Durchsuche

Mit der Entwicklung des Internets haben viele Entwickler begonnen, Node.js für die Back-End-Entwicklung zu verwenden. Einige Entwickler werden jedoch auf das Problem verstümmelter chinesischer Zeichen stoßen, wenn sie Node.js zum Empfang chinesischer Zeichen verwenden. Diese Frage ist sowohl verwirrend als auch schwierig. In diesem Artikel wird das Problem der von Node.js empfangenen verstümmelten chinesischen Zeichen vorgestellt und verschiedene Lösungen bereitgestellt.

Problembeschreibung

Bei Verwendung von Node.js zum Empfangen von Anfragen mit chinesischen Schriftzeichen werden manchmal verstümmelte Zeichen angezeigt, wie in der folgenden Abbildung dargestellt:

#🎜🎜 ## 🎜🎜#

Wie im Bild oben gezeigt, enthalten die empfangenen Anforderungsparameter chinesische Zeichen, werden jedoch in verstümmelte Zeichen umgewandelt. Dies ist offensichtlich nicht das gewünschte Ergebnis. Wo liegt also das Problem?

Problemanalyse

Zunächst müssen wir das Prinzip verstehen, nach dem Node.js Anforderungsparameter empfängt.

Node.js ist eine Hochleistungsplattform, die auf ereignisgesteuerten und nicht blockierenden I/O-Modellen basiert. Sie lauscht auf den Netzwerkport, löst ein Ereignis aus und kapselt die Anfrage in ein Anfrageobjekt. Das Anforderungsobjekt enthält Anforderungsheader, Anforderungstext und andere Informationen. Beim Empfang des Anforderungstexts verwendet Node.js standardmäßig die UTF-8-Kodierung zur Dekodierung.

Wenn der Anforderungstext, den wir erhalten, chinesische Zeichen enthält und der Inhaltstyp im Anforderungsheader die Zeichensatzkodierung nicht festlegt, wird standardmäßig UTF-8 für die Dekodierung verwendet wird im Anforderungsheader festgelegt. Wenn die Zeichensatzkodierung angegeben ist, wird ein bestimmter Zeichensatz für die Dekodierung verwendet. Wenn jedoch die Zeichensatzkodierung nicht im Anforderungsheader festgelegt ist und der Anforderungstext mehrere Zeichensatzkodierungen oder verstümmelte Zeichen enthält, kann Node.js beim Dekodieren verstümmelte Zeichen verursachen.

Lösung

In Bezug auf das Problem der von Node.js empfangenen verstümmelten chinesischen Schriftzeichen können wir von den folgenden Aspekten ausgehen:

Einheitliche Zeichensatzkodierung
  1. Um das Problem der inkonsistenten Zeichensatzkodierung zu vermeiden, können wir im Anforderungsheader eine einheitliche Zeichensatzkodierung festlegen.

Zum Beispiel können wir im Anforderungsheader Folgendes festlegen:

Content-Type: application/x-www-form-urlencoded;charset=utf-8

Auf diese Weise können wir beim Empfang eines Anforderungstexts mit chinesischen Schriftzeichen in Node.js UTF verwenden. 8 Die Kodierung wird einheitlich dekodiert.

Die angegebene Zeichensatzkodierung erzwingen
  1. Zusätzlich zum Festlegen der Zeichensatzkodierung im Anforderungsheader können wir auch das angegebene Zeichen erzwingen Kodierung einstellen.

Wenn wir beispielsweise das Express-Framework verwenden, können wir die Body-Parser-Middleware verwenden und die Zeichensatzkodierung für die Dekodierung angeben. Das Beispiel lautet wie folgt:

const bodyParser = require('body-parser')
const app = express()

app.use(bodyParser.urlencoded({ extended: false, limit: '50mb', parameterLimit: 10000, type: 'application/x-www-form-urlencoded', verify: (req, res, buf) => { req.raw = buf } }))

Verwenden Sie das Iconv-Lite-Modul zum Dekodieren
  1. Eine andere Methode besteht darin, das Iconv-Lite-Modul zum Dekodieren zu verwenden Beim Dekodieren lautet das Codebeispiel wie folgt:
const iconv = require('iconv-lite')
const buffer = Buffer.from('e4b8ade69687', 'hex')
const str = iconv.decode(buffer, 'utf8')
console.log(str) // 输出:"中文"

Verwenden Sie das Textkodierungsmodul zum Dekodieren
  1. Die letzte Lösung besteht darin, den Text zu verwenden -Encoding-Modul zur Decodierung.

Wenn wir beispielsweise das Express-Framework verwenden, können wir den Textkodierungsdecoder für unseren Anforderungstext-Parser verwenden und ihn auf utf-8 einstellen. Ein Beispiel lautet wie folgt:

const express = require('express')
const bodyParser = require('body-parser')
const { TextDecoder } = require('text-encoding')

const app = express()
app.use(bodyParser.json({ verify: function(req, res, buf) { req.body = JSON.parse(new TextDecoder('utf-8').decode(buf)) }}))

Summary

In diesem Artikel wird das verstümmelte Problem vorgestellt, das auftreten kann, wenn Node.js eine Anfrage mit chinesischen Zeichen empfängt, sowie verschiedene Methoden dazu dieses Problem lösen.

Bei der Entwicklung von Node.js ist es sehr wichtig, das Problem verstümmelter chinesischer Schriftzeichen richtig zu behandeln. Um dieses Problem zu lösen, können wir eine einheitliche Zeichensatzkodierung verwenden, die Zeichensatzkodierung erzwingen, das Iconv-Lite-Modul zum Dekodieren und das Textkodierungsmodul zum Dekodieren verwenden usw., um verstümmelte Zeichen zu vermeiden und sicherzustellen Normaler Betrieb der Anwendung. Ich hoffe, dieser Artikel kann Entwicklern helfen, dieses Problem zu lösen.

Das obige ist der detaillierte Inhalt vonVerstümmelte chinesische Zeichen, die von nodejs empfangen wurden. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn