Java에서 클래스 파서를 구현하는 방법의 예-java지도 시간-php.cn

집

Java

java지도 시간

Java에서 클래스 파서를 구현하는 방법의 예

黄舟

Sep 15, 2017 am 10:16 AM

classjava방법

이 글에서는 주로 클래스 파일 분석을 통해 Java 클래스 파서 구현 방법의 예를 소개합니다. 이는 특정 참조 값이 있으며 필요한 친구가 이에 대해 배울 수 있습니다.

저는 현재 ClassAnalyzer라는 개인 프로젝트를 작성 중입니다. ClassAnalyzer의 목적은 Java 클래스 파일의 디자인과 구조에 대한 심층적인 이해를 제공하는 것입니다. 주요 프레임워크와 기본 기능은 완성되었으며, 향후 일부 세부 기능이 추가될 예정입니다. 실제로 JDK는 클래스 파일을 디컴파일하기 위한 명령줄 도구인 javap를 이미 제공하고 있지만 이 기사에서는 파서 구현에 대한 내 아이디어를 명확히 설명할 것입니다.

클래스 파일

클래스 또는 인터페이스 정보의 전달자로서 각 클래스 파일은 클래스를 완전히 정의합니다. Java 프로그램을 "한 번 작성하면 어디서나 실행"할 수 있도록 Java 가상 머신 사양에는 클래스 파일에 대한 엄격한 규정이 있습니다. 클래스 파일을 구성하는 기본 데이터 단위는 바이트이며, 이로 인해 전체 클래스 파일에 저장되는 내용은 단일 바이트로 표현할 수 없는 거의 모든 데이터로 표시됩니다. 배수 연속된 바이트로 표현됩니다.

Java Virtual Machine 사양에 따르면 클래스 파일은 C 언어 구조와 유사한 의사 구조를 사용하여 데이터를 저장합니다. 이 의사 구조에는 부호 없는 숫자와 테이블이라는 두 가지 데이터 유형만 있습니다. JVM(Java Virtual Machine) 사양은 u1, u2, u4 및 u8을 각각 1바이트, 2바이트, 4바이트 및 8바이트의 부호 없는 숫자를 나타내도록 정의합니다. 부호 없는 숫자는 참조, 수량 또는 문자열을 설명하는 데 사용할 수 있습니다. 테이블은 여러 개의 부호 없는 숫자 또는 기타 테이블을 데이터 항목으로 구성한 복합 데이터 유형입니다. 테이블은 계층적 복합 구조로 데이터를 설명하는 데 사용되므로 전체 클래스 파일은 본질적으로 테이블입니다. ClassAnalyzer에서는 byte, short, int, long이 각각 u1, u2, u4, u8 데이터 유형에 해당합니다. Class 파일은 다음과 같은 Java 클래스로 설명됩니다.

public class ClassFile {
 public U4 magic;       // magic
 public U2 minorVersion;      // minor_version
 public U2 majorVersion;      // major_version
 public U2 constantPoolCount;    // constant_pool_count
 public ConstantPoolInfo[] cpInfo;   // cp_info
 public U2 accessFlags;      // access_flags
 public U2 thisClass;      // this_class
 public U2 superClass;      // super_class
 public U2 interfacesCount;     // interfaces_count
 public U2[] interfaces;      // interfaces
 public U2 fieldsCount;      // fields_count
 public FieldInfo[] fields;     // fields
 public U2 methodsCount;      // methods_count
 public MethodInfo[] methods;    // methods
 public U2 attributesCount;     // attributes_count
 public BasicAttributeInfo[] attributes;  // attributes
}

클래스 파일을 구성하는 각 데이터 항목(매직 넘버, 클래스 파일 버전 및 기타 데이터 항목, 액세스 플래그, 클래스 인덱스, 부모 클래스 인덱스 등)을 구문 분석하는 방법

각 클래스 파일에 있습니다. 각각은 고정된 바이트 수를 차지하며 구문 분석 중에 해당 바이트 수만 읽어야 합니다. 또한 유연하게 처리해야 하는 부분은 주로 상수 풀, 필드 테이블 컬렉션, 메서드 테이블 컬렉션, 속성 테이블 컬렉션의 네 가지 부분입니다. 필드와 메소드는 고유한 속성을 가질 수 있으며 클래스 자체에도 해당 속성이 있으므로 필드 테이블 컬렉션과 메소드 테이블 컬렉션을 구문 분석하면 속성 테이블도 구문 분석됩니다.

상수 풀은 클래스 파일 데이터의 큰 부분을 차지하며 숫자 및 문자열 상수, 클래스 이름, 인터페이스 이름, 필드 이름, 메서드 이름 등을 포함한 모든 상수 정보를 저장하는 데 사용됩니다. JVM(Java Virtual Machine) 사양은 각각 고유한 구조를 갖는 여러 상수 유형을 정의합니다. 상수 풀 자체는 테이블이며, 이를 구문 분석할 때 주의해야 할 몇 가지 사항이 있습니다.

각 상수 유형은 u1 유형 태그로 식별됩니다.

테이블 헤더에 제공된 상수 풀 크기(constantPoolCount)는 실제 값보다 1 더 큽니다. 예를 들어, ConstantPoolCount가 47과 같다면 상수 풀에는 46개의 상수가 있습니다.

상수 풀의 인덱스 범위는 1부터 시작합니다. 예를 들어, ConstantPoolCount가 47이면 상수 풀의 인덱스 범위는 1~46입니다. 항목 0을 비워 두는 디자이너의 목적은 "상수 풀 항목을 참조하지 않음"을 표현하는 것입니다.

CONSTANT_Utf8_info 상수의 구조에는 u1 유형의 태그, u2 유형의 길이 및 u1 유형의 길이 바이트가 포함됩니다. 길이 바이트의 연속 데이터는 MUTF-8(수정된 UTF-8) 문자열을 사용하여 인코딩됩니다. MUTF-8은 UTF-8과 호환되지 않습니다. 첫째, 널 문자가 2바이트(0xC0 및 0x80)로 인코딩되고, 둘째, 보조 문자가 서로게이트 쌍으로 분할되어 UTF에 따라 별도로 인코딩됩니다. -16, 관련 세부 정보는 여기(변종 UTF-8)에서 확인할 수 있습니다.

속성 테이블은 특정 시나리오에 특정한 정보를 설명하는 데 사용됩니다. 클래스 파일, 필드 테이블 및 메서드 테이블에는 모두 해당 속성 테이블 세트가 있습니다. JVM(Java Virtual Machine) 사양은 다양한 속성을 정의하며, ClassAnalyzer는 현재 일반적으로 사용되는 속성에 대한 분석을 구현합니다. 상수 유형 데이터 항목과 달리 속성에는 속성 유형을 식별하는 태그가 없지만 각 속성에는 u2 유형의 attribute_name_index가 포함되어 있습니다. Attribute_name_index는 속성 이름이 포함된 상수 풀의 CONSTANT_Utf8_info 유형의 상수를 가리킵니다. 속성을 구문 분석할 때 ClassAnalyzer는 attribute_name_index가 가리키는 상수에 해당하는 속성 이름을 통해 속성의 유형을 알고 있습니다.

필드 테이블은 클래스나 인터페이스에서 선언된 변수를 설명하는 데 사용됩니다. 필드에는 클래스 수준 변수와 인스턴스 수준 변수가 포함됩니다. 필드 테이블의 구조는 u2 유형 access_flags, u2 유형 name_index, u2 유형 descriptor_index, u2 유형 속성_count 및 attribute_count 속성_info 유형 속성을 포함합니다. 우리는 이미 속성 테이블의 구문 분석을 소개했습니다. 속성의 구문 분석 방법은 속성 테이블의 구문 분석 방법과 일치합니다.

Class的文件方法表采用了和字段表相同的存储格式，只是access_flags对应的含义有所不同。方法表包含着一个重要的属性：Code属性。Code属性存储了Java代码编译成的字节码指令，在ClassAnalyzer中，Code对应的Java类如下所示（仅列出了类属性）

public class Code extends BasicAttributeInfo {
 private short maxStack;
 private short maxLocals;
 private long codeLength;
 private byte[] code;
 private short exceptionTableLength;
 private ExceptionInfo[] exceptionTable;
 private short attributesCount;
 private BasicAttributeInfo[] attributes;
 ...
 private class ExceptionInfo {
  public short startPc;
  public short endPc;
  public short handlerPc;
  public short catchType;
   ...
 }
}

在Code属性中，codeLength和code分别用于存储字节码长度和字节码指令，每条指令即一个字节（u1类型）。在虚拟机执行时，通过读取code中的一个个字节码，并将字节码翻译成相应的指令。另外，虽然codeLength是一个u4类型的值，但是实际上一个方法不允许超过65535条字节码指令。

代码实现

ClassAnalyzer的源码已放在了GitHub上。在ClassAnalyzer的README中，我以一个类的Class文件为例，对该Class文件的每个字节进行了分析，希望对大家的理解有所帮助。

위 내용은 Java에서 클래스 파서를 구현하는 방법의 예의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명

본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

관련 기사

Java가 크로스 플랫폼 데스크톱 응용 프로그램을 개발하기 위해 인기있는 선택 인 이유는 무엇입니까?Apr 25, 2025 am 12:23 AM

javaispopularforcross-platformdesktopapplicationsduetoits "writeonce, runanywhere"철학

Java의 플랫폼 별 코드 작성 상황에 대해 토론하십시오.Apr 25, 2025 am 12:22 AM

Java에서 플랫폼 별 코드를 작성하는 이유에는 특정 운영 체제 기능에 대한 액세스, 특정 하드웨어와 상호 작용하고 성능 최적화가 포함됩니다. 1) JNA 또는 JNI를 사용하여 Windows 레지스트리에 액세스하십시오. 2) JNI를 통한 Linux 특이 적 하드웨어 드라이버와 상호 작용; 3) 금속을 사용하여 JNI를 통해 MacOS의 게임 성능을 최적화하십시오. 그럼에도 불구하고 플랫폼 별 코드를 작성하면 코드의 이식성에 영향을 미치고 복잡성을 높이며 잠재적으로 성능 오버 헤드 및 보안 위험을 초래할 수 있습니다.

Java는 Cloud-Native Applications, Multi-Platform 배포 및 교차 운용성을 통해 플랫폼 독립성을 더욱 향상시킬 것입니다. 1) Cloud Native Applications는 Graalvm 및 Quarkus를 사용하여 시작 속도를 높입니다. 2) Java는 임베디드 장치, 모바일 장치 및 양자 컴퓨터로 확장됩니다. 3) Graalvm을 통해 Java는 Python 및 JavaScript와 같은 언어와 완벽하게 통합되어 언어 교차 수용 가능성을 향상시킵니다.

Java의 강력한 타이핑은 플랫폼 독립성에 어떻게 기여합니까?Apr 25, 2025 am 12:11 AM

Java의 강력한 유형 시스템은 유형 안전, 통합 유형 변환 및 다형성을 통해 플랫폼 독립성을 보장합니다. 1) 유형 안전성 런타임 오류를 피하기 위해 컴파일 시간에 유형 검사를 수행합니다. 2) 통합 유형 변환 규칙은 모든 플랫폼에서 일관성이 있습니다. 3) 다형성 및 인터페이스 메커니즘은 코드가 다른 플랫폼에서 일관되게 행동하게 만듭니다.

JNI (Java Native Interface)가 플랫폼 독립성을 손상시킬 수있는 방법을 설명하십시오.Apr 25, 2025 am 12:07 AM

JNI는 Java의 플랫폼 독립성을 파괴 할 것입니다. 1) JNI는 특정 플랫폼에 대한 로컬 라이브러리를 요구합니다. 2) 대상 플랫폼에서 로컬 코드를 컴파일하고 연결해야합니다. 3) 운영 체제 또는 JVM의 다른 버전은 다른 로컬 라이브러리 버전을 필요로 할 수 있습니다.

Java의 플랫폼 독립성을 위협하거나 향상시키는 새로운 기술이 있습니까?Apr 24, 2025 am 12:11 AM

신흥 기술은 위협을 일으키고 Java의 플랫폼 독립성을 향상시킵니다. 1) Docker와 같은 클라우드 컴퓨팅 및 컨테이너화 기술은 Java의 플랫폼 독립성을 향상 시키지만 다양한 클라우드 환경에 적응하도록 최적화되어야합니다. 2) WebAssembly는 Graalvm을 통해 Java 코드를 컴파일하여 플랫폼 독립성을 확장하지만 성능을 위해 다른 언어와 경쟁해야합니다.

JVM의 다른 구현은 무엇이며, 모두 같은 수준의 플랫폼 독립성을 제공합니까?Apr 24, 2025 am 12:10 AM

다른 JVM 구현은 플랫폼 독립성을 제공 할 수 있지만 성능은 약간 다릅니다. 1. OracleHotspot 및 OpenJDKJVM 플랫폼 독립성에서 유사하게 수행되지만 OpenJDK에는 추가 구성이 필요할 수 있습니다. 2. IBMJ9JVM은 특정 운영 체제에서 최적화를 수행합니다. 3. Graalvm은 여러 언어를 지원하며 추가 구성이 필요합니다. 4. AzulzingJVM에는 특정 플랫폼 조정이 필요합니다.

플랫폼 독립성은 개발 비용과 시간을 어떻게 줄입니까?Apr 24, 2025 am 12:08 AM

플랫폼 독립성은 여러 운영 체제에서 동일한 코드 세트를 실행하여 개발 비용을 줄이고 개발 시간을 단축시킵니다. 구체적으로, 그것은 다음과 같이 나타납니다. 1. 개발 시간을 줄이면 하나의 코드 세트 만 필요합니다. 2. 유지 보수 비용을 줄이고 테스트 프로세스를 통합합니다. 3. 배포 프로세스를 단순화하기위한 빠른 반복 및 팀 협업.

See all articles