Der Zeichentyp von Java verwendet das Unicode-Codierungsschema.
Java verwendet UTF-16-Codierung als internen Code, was bedeutet, dass Text innerhalb der JVM durch eine 16-Bit-Codeelementsequenz dargestellt wird. Häufig verwendete Texte sind Zeichen- (char) und String-Literale (String). Konstanten. UTF-16 ist jedoch ein Codierungsschema des Unicode-Zeichensatzes.
Java-Zeichen und -Strings sind an den folgenden Stellen vorhanden:
● Die Java-Quellcodedatei *.java kann eine beliebige Zeichenkodierung haben, z. B. GBK, UTF-8
● Klassendatei *.class, verwendet eine modifizierte UTF-8-Kodierung (Modified UTF-8)
● JVM, verwendet UTF-16-Kodierung im Speicher
Der Java-Compiler Sie müssen den Quellcode korrekt lesen, Codierungsunterschiede beseitigen und ihn dann in eine UTF-8-codierte Klassendatei kompilieren. Javac übernimmt beispielsweise standardmäßig die Codierung des Betriebssystems. Sie können den Parameter -encoding verwenden, um die Zeichencodierung der Quelldatei anzugeben. Die JVM lädt die Klassendatei und konvertiert die darin enthaltenen Zeichen oder Zeichenfolgen in UTF-16-Codierungssequenzen.
Das obige ist der detaillierte Inhalt vonWelche Kodierungsmethode wird für Java-Zeichentypen verwendet?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!