>  기사  >  백엔드 개발  >  axisisiconworkshop awk 소개 및 학습 노트 모음 페이지 1/3

axisisiconworkshop awk 소개 및 학습 노트 모음 페이지 1/3

WBOY
WBOY원래의
2016-07-29 08:38:00973검색

저작권 © 2004 이 기사는 GPL 계약을 준수합니다. 재인쇄, 수정 및 배포를 환영합니다.
첫 출시일: 2004년 8월 6일
------------------- ---- ----------------------------
목차
1. awk 소개
2. awk 명령 형식과 옵션
2.1. awk 구문에는 두 가지 형태가 있습니다
2.2 명령 옵션
3.1. >3.2.작업
4. awk 환경 변수
6. 레코드 및 필드
6.2. 도메인 구분 기호
7. .gawk 전용 정규식 메타문자
8. POSIX 문자 집합
9. 일치 연산자(~)
10. 비교식
12. passwd 파일
13. awk 프로그래밍
14.2.BEGIN 모듈
14.3.리디렉션 및 파이프
14.5. 조건문
14.7. 배열
15. awk
에 사용되는 프로그래밍 언어입니다. Linux/unix에서 텍스트와 데이터를 처리합니다. 데이터는 표준 입력, 하나 이상의 파일 또는 기타 명령의 출력에서 ​​가져올 수 있습니다. 사용자 정의 함수, 동적 정규 표현식과 같은 고급 기능을 지원하며 Linux/Unix에서 강력한 프로그래밍 도구입니다. 명령줄에서 사용되지만 스크립트로 더 자주 사용됩니다. awk가 텍스트와 데이터를 처리하는 방식은 파일을 첫 번째 줄부터 마지막 ​​줄까지 한 줄씩 스캔하여 특정 패턴과 일치하는 줄을 찾고 이 줄에서 원하는 작업을 수행하는 것입니다. 처리 조치가 지정되지 않은 경우 일치하는 행이 표준 출력(화면)에 표시됩니다. 모드가 지정되지 않은 경우 작업에 지정된 모든 행이 처리됩니다. awk는 각각 작성자 성의 첫 글자를 나타냅니다. 저자는 세 사람, 즉 Alfred Aho, Brian Kernighan, Peter Weinberger이기 때문입니다. gawk는 awk의 GNU 버전으로 Bell Labs 및 GNU의 일부 확장 기능을 제공합니다. 아래에 소개하는 awk는 GUN의 gawk를 예로 들어 설명한다. Linux 시스템에서는 awk가 gawk에 연결되어 있으므로 다음은 모두 awk를 사용하여 소개한다.
2. awk 명령 형식 및 옵션
2.1 awk 구문에는 두 가지 형식이 있습니다.
awk [옵션] 'script' var=값 파일(들)
awk [옵션] -f scriptfile var =값 파일
2.2. 명령 옵션
-F fs 또는 --field-separator fs
입력 파일 접기 구분 기호를 지정합니다. fs는 문자열 또는 정규 표현식입니다(예: - F). .
-v var=value 또는 --asign var=value
사용자 정의 변수를 할당합니다.
-f scripfile 또는 --file scriptfile
스크립트 파일에서 awk 명령을 읽습니다.
-mf nnn 및 -mr nnn
nnn 값에 고유 제한을 설정합니다. -mf 옵션은 nnn에 할당되는 최대 블록 수를 제한합니다. -mr 옵션은 최대 레코드 수를 제한합니다. 이 두 기능은 Bell Labs 버전 awk의 확장 기능이며 표준 awk에는 적용되지 않습니다.
-W Compact 또는 --compat, -W Traditional 또는 --traditional
호환 모드에서 awk를 실행하세요. 따라서 gawk는 표준 awk와 똑같이 동작하며 모든 awk 확장은 무시됩니다.
-W copyleft 또는 --copyleft, -W copyright 또는 --copyright
간단한 저작권 정보를 인쇄합니다.
-W help 또는 --help, -W 사용법 또는 --usage
모든 awk 옵션과 각 옵션에 대한 간략한 설명을 인쇄합니다.
-W lint 또는 --lint
기존 Unix 플랫폼으로 이식할 수 없는 구조에 대한 경고를 인쇄합니다.
-W lint-old 또는 --lint-old
레거시 Unix 플랫폼으로 이식할 수 없는 구조에 대한 경고를 인쇄합니다.
-W posix
호환 모드를 켭니다. 그러나 다음과 같은 제한 사항이 있으며 인식되지 않습니다. x, 함수 키워드, func, 이스케이프 시퀀스, fs가 공백인 경우 새 줄은 필드 구분 기호로 사용됩니다. ** 및 **= 연산자는 ^를 대체할 수 없습니다. ^= ;ffflush는 유효하지 않습니다.
-W re-interval 또는 --re-inerval
대괄호 표현식 [[:alpha:]]와 같은 간격 정규식 사용을 허용합니다. (grep의 Posix 문자 클래스)를 참조하세요.
-W 소스 프로그램 텍스트 또는 --source 프로그램 텍스트
프로그램 텍스트를 소스 코드로 사용하며 -f 명령과 혼합할 수 있습니다.
-W version 또는 --version
버그 보고서 정보의 버전을 인쇄합니다.
3. 모드 및 동작
Awk 스크립트는 모드와 동작으로 구성됩니다:
$awk '/root/' 테스트 또는 $awk '$3 <
둘 다 선택 사항입니다. 패턴이 없으면 작업이 모든 레코드에 적용됩니다. 작업이 없으면 출력이 모든 레코드와 일치합니다. 기본적으로 각 입력 줄은 레코드이지만 사용자는 RS 변수를 통해 다른 구분 기호를 지정할 수 있습니다.
3.1. 패턴
패턴은 다음 중 하나일 수 있습니다.
/정규식/: 와일드카드 문자를 사용하는 확장된 집합입니다.
관계식: 아래 연산자 표의 관계 연산자를 사용하여 문자열이나 숫자를 비교하는 작업을 수행할 수 있습니다. 예를 들어 $2>%1은 두 번째 필드가 첫 번째 필드보다 긴 행을 선택할 수 있습니다. .
패턴 일치 표현식: ~(일치) 및 ~!(일치하지 않음) 연산자를 사용합니다.
모드, 모드: 줄의 범위를 지정합니다. 이 구문에는 BEGIN 및 END 패턴이 포함될 수 없습니다.
BEGIN: 사용자가 첫 번째 입력 레코드가 처리되기 전에 발생하는 작업을 지정할 수 있습니다. 일반적으로 여기에서 전역 변수를 설정할 수 있습니다.
END: 마지막 입력 레코드를 읽은 후 사용자가 작업을 수행하도록 합니다.
3.2. 연산
연산은 하나 이상의 명령, 함수, 표현식으로 구성되며 줄 바꿈이나 세미콜론으로 구분되고 중괄호 안에 위치합니다. 네 가지 주요 부분이 있습니다:
변수 또는 배열 할당
출력 명령
내장 함수
제어 흐름 명령
4. awk 환경 변수
표 1. awk 환경 변수
변수 설명
$n 현재 레코드의 n번째 필드입니다. 필드는 FS로 구분됩니다.
$0 입력 기록을 완료했습니다.
ARGC 명령줄 ​​매개변수의 수입니다.
ARGIND 명령줄에서 현재 파일의 위치입니다(0부터 계산).
ARGV 명령줄 인수가 포함된 배열입니다.
CONVFMT 디지털 변환 형식(기본값은 %.6g)
ENVIRON 환경 변수 연관 배열.
ERRNO 마지막 시스템 오류에 대한 설명입니다.
FIELDWIDTHS 필드 너비 목록(스페이스바로 구분)
FILENAME 현재 파일 이름입니다.
FNR NR과 동일하지만 현재 파일을 기준으로 합니다.
FS 필드 구분 기호(기본값은 공백).
IGNORECASE true인 경우 대소문자 무시 일치를 수행합니다.
NF 현재 레코드의 필드 수입니다.
NR 현재 기록 번호입니다.
OFMT 디지털 출력 형식(기본값은 %.6g).
OFS 출력 필드 구분 기호(기본값은 공백)입니다.
ORS 출력 레코드 구분 기호(기본값은 개행 문자)입니다.
RLENGTH 일치 함수와 일치하는 문자열의 길이입니다.
RS 레코드 구분 기호(기본값은 개행 문자)입니다.
RSTART 일치 함수에 의해 일치된 문자열의 첫 번째 위치입니다.
SUBSEP 배열 아래 첨자 구분 기호(기본값은
위 내용은 axisisiconworkshop awk 소개와 학습 노트 모음의 1/3페이지를 소개하고 있으며, PHP 튜토리얼에 관심이 있는 친구들에게 도움이 되었으면 좋겠습니다.

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.