UTF-8 字节数组和 Java 字符串的编码和解码
在 Java 中,操作文本数据需要在字符串和字节数组之间进行无缝转换各种编码。本文探讨如何高效地执行这些转换,重点关注广泛使用的 UTF-8 编码。
将字符串编码为字节数组
将 Java 字符串转换为UTF-8 编码的字节数组,请使用 getBytes() 方法。例如:
String str = "Hello, world!"; byte[] byteArray = str.getBytes(StandardCharsets.UTF_8);
将字节数组解码为字符串
要从给定的字节数组中获取 Java 字符串,请使用 new String() 构造函数,指定所需的编码。示例:
byte[] byteArray = {(byte) 72, (byte) 101, (byte) 108, (byte) 108, (byte) 111}; String str = new String(byteArray, StandardCharsets.UTF_8);
编码规范的重要性
选择适当的编码对于正确的字符串转换至关重要。 UTF-8 是一种通用编码,支持人类语言中的大多数字符。但是,对于其他编码需求,请从 StandardCharsets 类中选择适当的编码常量。
以上是如何对UTF-8字节数组和Java字符串进行编码和解码?的详细内容。更多信息请关注PHP中文网其他相关文章!