고급 언어 소스 프로그램을 대상 프로그램으로 처리하는 시스템 소프트웨어가 "컴파일러"입니다. 컴파일러란 고급 프로그래밍 언어로 작성된 소스 프로그램을 이에 상응하는 기계어 형식의 대상 프로그램으로 번역하는 번역 프로그램을 말합니다. 소스 프로그램을 대상 프로그램으로 변환하는 컴파일러의 작업 프로세스는 어휘 분석, 중간 대상 코드 생성, 주로 소스 프로그램 분석이라고도 하는 5단계로 나뉩니다. , 분석 중에 문법 오류가 발견되면 프롬프트 메시지가 표시됩니다.
이 튜토리얼의 운영 환경: Windows 7 시스템, Dell G3 컴퓨터.
고급 언어로 작성된 소스 프로그램을 타겟 프로그램으로 처리할 수 있는 시스템 소프트웨어가 바로 "컴파일러"입니다.
컴파일러(컴파일링 프로그램)는 컴파일러라고도 불리며, 고급 프로그래밍 언어로 작성된 소스 프로그램을 이에 상응하는 기계어 형식의 대상 프로그램으로 번역하는 번역 프로그램을 말합니다. 컴파일러는 생성적 구현 접근 방식을 사용하여 구현된 번역 프로그램입니다. 고급 프로그래밍 언어로 작성된 소스 프로그램을 입력으로 사용하고, 어셈블리 언어나 기계어로 표현된 대상 프로그램을 출력으로 사용합니다. 컴파일된 대상 프로그램은 일반적으로 실행 프로그램의 지원을 받아 실행하고, 초기 데이터를 처리하고, 필요한 계산 결과를 계산하기 위해 실행 단계를 거칩니다.
컴파일러는 소스 프로그램을 분석한 후 이를 타겟 프로그램으로 합성해야 합니다. 첫째, 소스 프로그램의 정확성을 확인하고 이를 여러 기본 구성 요소로 분해합니다. 둘째, 이러한 기본 구성 요소를 기반으로 해당하는 동등한 대상 프로그램 부분을 설정합니다. 이러한 작업을 완료하기 위해 컴파일러는 분석 단계에서 일부 테이블을 생성하고 분석 및 합성 중에 쉽게 참조하고 처리할 수 있도록 소스 프로그램을 중간 언어 형식으로 변환해야 합니다.
컴파일러의 특징:
컴파일러는 소스 프로그램을 분석한 다음 이를 타겟 프로그램으로 합성해야 합니다. 첫째, 소스 프로그램의 정확성을 확인하고 이를 여러 기본 구성 요소로 분해합니다. 둘째, 이러한 기본 구성 요소를 기반으로 해당하는 동등한 대상 프로그램 부분을 설정합니다. 이러한 작업을 완료하기 위해 컴파일러는 분석 단계에서 일부 테이블을 생성하고 분석 및 합성 중에 쉽게 참조하고 처리할 수 있도록 소스 프로그램을 중간 언어 형식으로 변환해야 합니다.
기호 테이블, 상수 테이블, 중급 언어 프로그램을 포함하여 데이터 구조 분석 및 합성에 사용되는 주요 데이터 구조입니다. 기호 테이블은 소스 프로그램에서 사용되는 식별자와 해당 속성으로 구성됩니다. 여기에는 유형(예: 변수, 배열, 구조, 함수, 프로시저 등), 유형(예: 정수, 실수 유형, 문자열, 복합 유형)이 포함됩니다. , 라벨) 등) 및 대상 프로그램에 필요한 기타 정보를 제공합니다. 상수 테이블은 상수의 기계 표현과 이에 할당된 대상 프로그램 주소를 포함하여 소스 프로그램에 사용되는 상수로 구성됩니다. 중간 언어 프로그램은 소스 프로그램을 대상 프로그램으로 변환하기 전에 도입된 중간 형태의 프로그램입니다. 표현의 선택은 컴파일러가 나중에 이를 어떻게 사용하고 처리할지에 따라 달라집니다. 일반적으로 사용되는 중간 언어 형식에는 폴란드어 표현, 삼중, 사중 및 간접 삼중이 포함됩니다.
소스 프로그램의 일부 분석은 어휘 분석, 구문 분석, 의미 분석의 세 단계를 통해 수행됩니다. 어휘 분석은 어휘 분석 프로그램(스캐너라고도 함)에 의해 완료됩니다. 이 프로그램의 작업은 단어(예: 식별자, 상수, 예약어 및 다양한 연산자, 구두점 등)를 식별하고 기호 테이블과 상수 테이블을 생성하는 것입니다. 변환 소스 프로그램을 컴파일러가 분석하고 처리하기 쉬운 내부 형태로 변환합니다. 구문 분석기는 컴파일러의 핵심 부분으로 소스 프로그램이 언어의 문법 규칙에 따라 문법적인지 확인하는 것입니다. 문법적이지 않으면 구문 오류 메시지가 출력되고, 문법적이면 소스 프로그램의 문법 구조가 분해되어 중간 언어 형태의 내부 프로그램이 구성됩니다. 문법 분석의 목적은 단어가 문장을 형성하는 방식과 명령문이 프로그램을 형성하는 방식을 이해하는 것입니다. 의미 분석 프로그램은 법적 프로그램 구조의 의미 정확성을 추가로 확인하고 식별자와 상수의 올바른 사용을 보장하고 필요한 정보를 기호 테이블이나 중간 언어 프로그램에 수집 및 저장하며 해당 의미 처리를 수행하는 것입니다.
컴파일러의 작업 과정
컴파일러는 고급 언어로 작성된 프로세스 중심의 소스 프로그램을 타겟 프로그램으로 번역하는 언어 처리 프로그램입니다. 소스 프로그램을 대상 프로그램으로 변환하는 컴파일러의 과정은 어휘 분석, 중간 코드 생성, 대상 코드 생성의 5단계로 나뉩니다. 소스 프로그램 분석이라고도 불리는 어휘 분석과 구문 분석을 주로 수행하며, 분석 과정에서 문법 오류를 발견하고 신속한 정보를 제공합니다.
(1) 어휘 분석
어휘 분석의 작업은 문자로 구성된 단어를 처리하고 소스 프로그램을 왼쪽에서 오른쪽으로 문자별로 스캔하여 단어 기호를 하나씩 생성하여 문자열로 사용하는 것입니다. 소스 프로그램은 단어 기호 문자열의 중간 프로그램으로 변환됩니다. 어휘 분석을 수행하는 프로그램을 어휘 분석기 또는 스캐너라고 합니다.
소스 프로그램의 단어 기호는 스캐너로 분석되어 일반적으로 단어 범주, 단어 자체의 값과 같은 이진 공식을 생성합니다. 단어 범주는 일반적으로 정수로 인코딩됩니다. 범주에 하나의 단어 기호만 포함된 경우 이 단어 기호의 경우 범주 인코딩은 자체 값을 완전히 나타냅니다. 카테고리에 많은 단어 기호가 포함된 경우 각 단어 기호에 대해 카테고리 코드 외에 자체 값도 제공되어야 합니다.
일반적으로 어휘 분석기를 구성하는 방법에는 수동 구성과 자동 생성이라는 두 가지 방법이 있습니다. 수동 구성은 상태 다이어그램을 사용하여 수행할 수 있으며, 자동 생성은 결정론적 유한 오토마타를 사용하여 구현할 수 있습니다.
(2) 구문 분석
컴파일러의 구문 분석기는 단어 기호를 입력으로 사용하여 단어 기호 문자열이 표현식, 할당, 루프 등과 같은 문법 규칙을 따르는 문법 단위를 형성하는지 분석합니다. , 그리고 최종적으로 요구사항을 충족하는 프로그램을 구성하는지 확인합니다. 언어에서 사용되는 문법 규칙에 따라 분석되어 각 명령문이 올바른 논리적 구조를 가지고 있는지 확인합니다. 프로그램이 최종 문법 단위입니다. 컴파일러의 문법 규칙은 문맥 자유 문법으로 특징지어질 수 있습니다.
문법 분석에는 하향식 분석과 상향식 분석의 두 가지 방법이 있습니다. 하향식(Top-down)이란 문법의 시작 기호에서 시작하여 아래쪽으로 추론하여 문장을 추론하는 것을 의미합니다. 상향식 분석 방법은 Shift-in 감소 방법을 사용합니다. 기본 아이디어는 스택의 상단이 형성될 때 등록된 기호의 첫 번째 팝업을 사용하여 스택으로 하나씩 이동하는 것입니다. 특정 표현의 생성 후보 표현식이 발견되면 스택 맨 위에 있는 부분이 생성의 왼쪽 이웃 기호로 축소됩니다.
(3) 중간 코드 생성
중간 코드는 소스 프로그램의 내부 표현, 즉 중간 언어입니다. 중간 코드의 기능은 컴파일된 프로그램의 구조를 논리적으로 더 간단하고 명확하게 만드는 것입니다. 특히 대상 코드의 최적화를 구현하기 쉽게 만드는 것입니다. 중간 코드는 중간 언어 프로그램이며 중간 언어의 복잡성은 소스 프로그램 언어와 기계 언어 사이에 있습니다. 중간 언어에는 다양한 형태가 있으며, 일반적인 형태로는 역폴란드 표기법, 테트라그램, 삼항 형태 및 트리가 있습니다.
(4) 코드 최적화
코드 최적화란 변환된 프로그램부터 시작하여 보다 효과적인 타겟 코드를 생성할 수 있도록 프로그램에서 동등한 변환을 여러 번 수행하는 것을 말합니다. 소위 동등성은 프로그램의 실행 결과가 변경되지 않음을 의미합니다. 소위 효과적인 것은 주로 대상 코드의 짧은 실행 시간과 차지하는 작은 저장 공간을 나타냅니다. 이러한 변환을 최적화라고 합니다.
최적화에는 두 가지 유형이 있습니다. 하나는 특정 컴퓨터에 의존하지 않는 구문 분석 후 중간 코드를 최적화하는 것이고, 다른 하나는 특정 컴퓨터에 크게 의존하는 대상 코드를 생성할 때 수행됩니다. 전자 유형의 최적화는 관련된 프로그램의 범위에 따라 로컬 최적화, 루프 최적화 및 전역 최적화의 세 가지 수준으로 나눌 수 있습니다.
(5) 타겟 코드 생성
타겟 코드 생성은 컴파일의 마지막 단계입니다. 타겟 코드 생성기는 구문 분석되거나 최적화된 중간 코드를 타겟 코드로 변환합니다. 대상 코드에는 세 가지 형태가 있습니다.
① 즉시 실행될 수 있는 기계어 코드, 모든 주소가 재배치됩니다.
② 기계어 모듈을 조립하여 실행해야 할 때 링크 로더가 이를 일부 실행과 결합합니다. 프로그램들을 연결하여 실행 가능한 기계어 코드로 변환합니다.
③ 어셈블리 언어 코드는 어셈블러로 컴파일되어야 실행 가능한 기계어 코드가 됩니다.
타겟 코드 생성 단계에서는 타겟 코드 속도에 직접적인 영향을 미치는 세 가지 문제를 고려해야 합니다. 첫째, 더 짧은 타겟 코드를 생성하는 방법, 둘째, 컴퓨터의 레지스터를 최대한 활용하고 개수를 줄이는 방법입니다. 타겟 코드가 저장 장치에 액세스하는 횟수 세 번째, 컴퓨터 명령 시스템의 특성을 최대한 활용하여 타겟 코드의 품질을 향상시키는 방법.
더 많은 관련 지식은 FAQ 칼럼을 방문해주세요!
위 내용은 고급 언어 소스 프로그램을 타겟 프로그램으로 처리할 수 있는 시스템 소프트웨어는 무엇인가요?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!