Java에서 문자열은 몇 바이트를 차지합니까?-Java시작하기-php.cn

집

Java

Java시작하기

Java에서 문자열은 몇 바이트를 차지합니까?

王林

Nov 22, 2019 pm 03:39 PM

java끈바이트

Java에서 문자열은 몇 바이트를 차지합니까?

먼저 char는 Java의 기본 유형이 차지하는 바이트 수가 고정되어 있습니다. 예를 들어 int는 4바이트를 차지하고 double은 차지합니다. 8바이트. 이는 Java가 차지하는 유형을 다른 플랫폼에서 고정할 수 있으므로 Java의 이식성을 보장합니다. 따라서 Java의 char 유형은 고정적으로 2바이트를 차지합니다. (참고: char 유형은 한자를 저장할 수도 있습니다.)

둘째, String은 보다 유연한 저장 방법을 사용합니다. String에서는 영문자 하나가 1바이트를 차지하고, 한자는 인코딩에 따라 차지하는 바이트 수가 달라집니다. UTF-8 인코딩에서는 한자 하나가 3바이트를 차지하고, GBK 인코딩을 사용하면 한자 하나가 2바이트를 차지합니다.

테스트 코드는 다음과 같습니다.

import java.io.UnsupportedEncodingException;

public class StrTest {

    public static void main(String[] args) throws UnsupportedEncodingException {
        String str1 = "hello";
        String str2 = "你好abc";

        System.out.println("utf-8编码下&#39;hello&#39;所占的字节数:" + str1.getBytes("utf-8").length);
        System.out.println("gbk编码下&#39;hello&#39;所占的字节数:" + str1.getBytes("gbk").length);

        System.out.println("utf-8编码下&#39;你好abc&#39;所占的字节数:" + str2.getBytes("utf-8").length);
        System.out.println("gbk编码下你好&#39;你好abc&#39;所占的字节数:" + str2.getBytes("gbk").length);
    }

}

출력 결과:

utf-8编码下’hello’所占的字节数: 5
gbk编码下’hello’所占的字节数: 5
utf-8编码下’你好abc’所占的字节数: 9
gbk编码下你好’你好abc’所占的字节数: 7

String에 대해서는 영어인 것을 알 수 있습니다 문자 고정 1바이트를 점유하는 반면, 한자는 2(GBK 인코딩) 또는 3(UTF-8 인코딩) 바이트를 차지합니다. 또한 이 방법을 사용하여 여기서 설명하지 않는 다른 인코딩의 상태를 확인할 수도 있습니다.

마지막으로 문자열의 특성에 따라 문자열에 중국어 문자가 포함되어 있는지 확인할 수 있습니다. 예:

public class StrTest {

    public static void main(String[] args) throws UnsupportedEncodingException {
        searchChineseCharacter("Good morning");
        searchChineseCharacter("hello 早上好");
    }

    //找出一个字符串中的汉字
    public static void searchChineseCharacter(String str){
        //正则表达式，用于匹配中文字符
        String regex = "[\u4e00-\u9fa5]";

        //如果str的长度和其所占字节数不等，说明包含中文
        if (str.length() != str.getBytes().length){
            Pattern pattern = Pattern.compile(regex);
            Matcher matcher = pattern.matcher(str);
            System.out.print("&#39;" + str + "&#39; 中的汉字为:");

            while (matcher.find()){
                System.out.print(matcher.group());
            }
        }

        else {
            System.out.println("&#39;" + str + "&#39; 中无汉字");
        }
    }

}

출력 결과:

‘Good morning’ 中无汉字
‘hello 早上好’ 中的汉字为:早上好

#🎜🎜 #추천 튜토리얼:

java 입문 튜토리얼

위 내용은 Java에서 문자열은 몇 바이트를 차지합니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명

본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

핫 AI 도구

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

AI 옷 제거제

AI Hentai Generator

AI Hentai를 무료로 생성하십시오.

뜨거운 도구

SecList

SecLists는 최고의 보안 테스터의 동반자입니다. 보안 평가 시 자주 사용되는 다양한 유형의 목록을 한 곳에 모아 놓은 것입니다. SecLists는 보안 테스터에게 필요할 수 있는 모든 목록을 편리하게 제공하여 보안 테스트를 더욱 효율적이고 생산적으로 만드는 데 도움이 됩니다. 목록 유형에는 사용자 이름, 비밀번호, URL, 퍼징 페이로드, 민감한 데이터 패턴, 웹 셸 등이 포함됩니다. 테스터는 이 저장소를 새로운 테스트 시스템으로 간단히 가져올 수 있으며 필요한 모든 유형의 목록에 액세스할 수 있습니다.

WebStorm Mac 버전

유용한 JavaScript 개발 도구

ZendStudio 13.5.1 맥

강력한 PHP 통합 개발 환경

안전한 시험 브라우저

안전한 시험 브라우저는 온라인 시험을 안전하게 치르기 위한 보안 브라우저 환경입니다. 이 소프트웨어는 모든 컴퓨터를 안전한 워크스테이션으로 바꿔줍니다. 이는 모든 유틸리티에 대한 액세스를 제어하고 학생들이 승인되지 않은 리소스를 사용하는 것을 방지합니다.

MinGW - Windows용 미니멀리스트 GNU

이 프로젝트는 osdn.net/projects/mingw로 마이그레이션되는 중입니다. 계속해서 그곳에서 우리를 팔로우할 수 있습니다. MinGW: GCC(GNU Compiler Collection)의 기본 Windows 포트로, 기본 Windows 애플리케이션을 구축하기 위한 무료 배포 가능 가져오기 라이브러리 및 헤더 파일로 C99 기능을 지원하는 MSVC 런타임에 대한 확장이 포함되어 있습니다. 모든 MinGW 소프트웨어는 64비트 Windows 플랫폼에서 실행될 수 있습니다.