정규식과 Linux의 세 가지 주요 텍스트 처리 도구 사용에 대한 자세한 설명-JS 튜토리얼-php.cn

집

웹 프론트엔드

JS 튜토리얼

정규식과 Linux의 세 가지 주요 텍스트 처리 도구 사용에 대한 자세한 설명

php中世界最好的语言

Mar 29, 2018 pm 01:58 PM

linux다루다텍스트

이번에는 정규식과 리눅스의 3대 텍스트 처리 도구에 대한 자세한 설명을 가져오겠습니다. 정규식과 리눅스의 3대 텍스트 처리 도구를 사용할 때 주의사항은 무엇입니까? 실제 사례를 살펴보겠습니다.

grep, sed 및 awk는 모두 텍스트 처리 도구이지만 모두 고유한 장점과 단점이 있습니다. 하나의 텍스트 처리 명령을 다른 명령으로 완전히 대체할 수 없습니다. 그렇지 않으면 세 개의 텍스트가 없습니다. 처리됨.

1. 정규식

1. 일치하는 문자 유형

[a-z]: 소문자

[A-Z]: 대문자

[a-Z]: 소문자 또는 대문자

[0-9]: 숫자

[a-zA-Z0-9]: 문자 또는 숫자

인 문자와 일치합니다. : 공백을 제외한 임의의 문자 1개와 일치합니다.

[0-f]: 16 기본 숫자

abc | def: abc 또는 def
a (bc | de) f: abcf 또는 adef

<: href="http://www.php.cn/wiki/88.html" target="_blank">특수 문자로 구분되며 연속되는 문자열은 단어로

>: 단어 끝

[^표현]: 소문자를 제외한 모든 문자 등.

2 다음 기호는 일치 수를 제어합니다.

해당 기호의 왼쪽에는 위의 첫 번째 지점에 표현식이 있어야 합니다.

표현*: 0 또는 n 문자

표현+: 1 또는 n 문자

expression?: 0 또는 1자

expression{n}: n자

expression{n:m}: n ~ m자

expression{n,}: n자 이상

[예] [ a-z]*는 0개 이상의 소문자 일치를 의미합니다.

3. 일치하는 문자를 머리와 꼬리로 제어합니다.
^ 표현식: 머리가 일치합니다.

표현식 $: 꼬리가 일치합니다.

2. Linux

1. egrep 필터링 도구

grep의 확장 버전으로 정규 표현식을 사용할 수 있습니다.

구문:

egrep - 옵션 '정규 표현식' 파일 이름

옵션:

-n: 줄 번호 표시
-o: 일치하는 내용만 표시
-q: 자동 모드, 출력 없음, 실행 성공 여부, 즉 원하는 내용이 필터링되는지 확인하려면 $?를 사용해야 함
-l: 일치에 성공하면 파일 이름만 인쇄됩니다. 실패하면 일반적으로 -rl을 함께 사용합니다. grep -rl 'root' /etc
-A: 일치에 성공하면 일치하는 줄이 표시됩니다. 그러면 다음이 인쇄됩니다. n 줄을 함께 인쇄합니다.
-B: 일치하는 줄과 그 전후의 n 줄을 함께 인쇄합니다.
-C: 일치하는 경우 일치하는 줄과 다음을 인쇄합니다. 앞뒤 n줄을 함께
--color
-c: 일치하면 일치하는 줄 수를 출력합니다.
-i: 대소문자 무시
-v: 부정, 일치하지 않음
-w: 단어 일치

2, sed streamEditor

문법:

구문 1: sed - 옵션 '숫자 위치 지정 + 명령' 파일 이름

옵션:

-n: 자동 모드, 출력 없음
-e: 다중 편집 , 이는 명확하지 않습니다.
-i: 출력 대신 파일 내용을 직접 수정합니다.
-r: 확장 모드, 정규 표현식을 사용할 수 있습니다.
-f: 파일 이름을 지정하고 새 파일에 작업을 작성합니다.

명령:

a ∶ Append,
c ∶ 변경 변경,
d ∶ 삭제 삭제,
i ∶ 삽입, i 뒤에 문자열이 올 수 있으며 이 문자열은 새 줄(현재는 이전 줄)에 나타납니다.
p∶ 인쇄 인쇄
s∶ 교체교체, 교체작업을 직접 진행하실 수 있습니다. 일반적으로 이 작업은 정규식과 짝을 이룰 수 있습니다. 예를 들어 1,20s/old/new/g

*s 명령 특별 지침:

여러 명령을 추가하려면 {Command 1: Command 2: Command 3}을 사용하세요

语法2：sed -r '替换命令s/正则表达式/替换内容/贪婪选项g' 文件名

定位的两种方法：

①数字定位（输入行序号定位）

十进制数
1：单行
1,3：范围从第一行到第三行
2,+4：匹配行后若干行
4,~3：从第四行到下一个3的倍数行
2~3：第二行起每间隔三行的行
$：尾行
1!：除了第一行以外的行

【例】sed -n '1p' /etc/passwd

②正则表达式定位

正则必须用//包裹起来

扩展正则需要用 -r 参数或转义

替换可使用正则表达式的子模式，即小括号（），可以\1、\2代表子模式

【例】sed -r 's/(.)(.)/\2\1/ file1 表示将匹配到的第一部分和第二部分替换

*贪婪选项：填上g，代表把一行中所有匹配项替换

3、awk 文本分析工具

由命令、正则（需要用//包围起来）、比较和关系运算组合而成

使用option中的-F参数定义间隔符号

用$1,$2,$3等的顺序表示files中每行以间隔符号分隔的各列不同域，NF变量表示当前记录的字段数

语法

awk -选项参数 '逻辑判断{命令变量1,变量2,变量3}' 文件名

选项

-F 定义字段分隔符,默认的分隔符是连续的空格或制表符
-v 定义变量并赋值也可以借用次方式从shell变量中引入

AWK变量

NR 当前记录的个数(全部文件连接后的统计)
FNR 当前记录的个数(仅为当前文件的统计,非全部)
FS 字段分隔符默认为连续空格或制表符,可以使用多个不同的符号做分隔符 -F[:/]
OFS 输出字符的分隔符默认是空格
# awk -F: 'OFS="=====" {print $1,$2}' /etc/passwd
root=====x
NF 当前读入行的字段个数
ORS 输出记录分隔符默认是换行
# awk -F: 'ORS="=====" {print $1,$2}' /etc/passwd
root x=====bin x=====
FILENAME 当前文件名

【例1】使用AWK变量

# awk '{print NR,FNR,$1}' file1 file2 
1 1 aaaaa
2 2 bbbbb
3 3 ccccc
4 1 dddddd
5 2 eeeeee
6 3 ffffff
#

【例2】引用shell变量的方法

# a=root
# awk -v var=$a -F: '$1 == var {print $0}' /etc/passwd
或者 把整个命令拆开传递,让shell变量外露,
# awk -F: '$1 == "'$a'" {print $0}' /etc/passwd
# a=NF
# awk -F: '{print $'$a'}' /etc/passwd

逻辑运算（可直接引用域进行运算）

= += -= /= *= 赋值

&& || ! 逻辑与逻辑或逻辑非

~ !~ 匹配正则或不匹配,正则需要用 /正则/ 包围住
>= != == 关系比较字符串时要把字符串用双引号引起来

$ 字段引用：字段引用需要加$,而变量引用直接用变量名取

+ - * / % ++ -- 运算符

转义序列

\\ \自身
\$ 转义$
\t 制表符
\b 退格符
\r 回车符
\n 换行符
\c 取消换行

相信看了本文案例你已经掌握了方法，更多精彩请关注php中文网其它相关文章！

관련 기사

무대 뒤에서 : 어떤 언어의 힘이 자바 스크립트입니까?Apr 28, 2025 am 12:01 AM

JavaScript는 브라우저 및 Node.js 환경에서 실행되며 JavaScript 엔진을 사용하여 코드를 구문 분석하고 실행합니다. 1) 구문 분석 단계에서 초록 구문 트리 (AST)를 생성합니다. 2) 컴파일 단계에서 AST를 바이트 코드 또는 기계 코드로 변환합니다. 3) 실행 단계에서 컴파일 된 코드를 실행하십시오.

파이썬과 자바 스크립트의 미래 : 트렌드와 예측Apr 27, 2025 am 12:21 AM

Python 및 JavaScript의 미래 추세에는 다음이 포함됩니다. 1. Python은 과학 컴퓨팅 분야에서의 위치를 통합하고 AI, 2. JavaScript는 웹 기술의 개발을 촉진하고, 3. 교차 플랫폼 개발이 핫한 주제가되고 4. 성능 최적화가 중점을 둘 것입니다. 둘 다 해당 분야에서 응용 프로그램 시나리오를 계속 확장하고 성능이 더 많은 혁신을 일으킬 것입니다.

Python vs. JavaScript : 개발 환경 및 도구Apr 26, 2025 am 12:09 AM

개발 환경에서 Python과 JavaScript의 선택이 모두 중요합니다. 1) Python의 개발 환경에는 Pycharm, Jupyternotebook 및 Anaconda가 포함되어 있으며 데이터 과학 및 빠른 프로토 타이핑에 적합합니다. 2) JavaScript의 개발 환경에는 Node.js, VScode 및 Webpack이 포함되어 있으며 프론트 엔드 및 백엔드 개발에 적합합니다. 프로젝트 요구에 따라 올바른 도구를 선택하면 개발 효율성과 프로젝트 성공률이 향상 될 수 있습니다.

JavaScript가 C로 작성 되었습니까? 증거를 검토합니다Apr 25, 2025 am 12:15 AM

예, JavaScript의 엔진 코어는 C로 작성되었습니다. 1) C 언어는 효율적인 성능과 기본 제어를 제공하며, 이는 JavaScript 엔진 개발에 적합합니다. 2) V8 엔진을 예를 들어, 핵심은 C로 작성되며 C의 효율성 및 객체 지향적 특성을 결합하여 C로 작성됩니다.

JavaScript의 역할 : 웹 대화식 및 역동적 인 웹Apr 24, 2025 am 12:12 AM

JavaScript는 웹 페이지의 상호 작용과 역학을 향상시키기 때문에 현대 웹 사이트의 핵심입니다. 1) 페이지를 새로 고치지 않고 콘텐츠를 변경할 수 있습니다. 2) Domapi를 통해 웹 페이지 조작, 3) 애니메이션 및 드래그 앤 드롭과 같은 복잡한 대화식 효과를 지원합니다. 4) 성능 및 모범 사례를 최적화하여 사용자 경험을 향상시킵니다.

C 및 JavaScript : 연결이 설명되었습니다Apr 23, 2025 am 12:07 AM

C 및 JavaScript는 WebAssembly를 통한 상호 운용성을 달성합니다. 1) C 코드는 WebAssembly 모듈로 컴파일되어 컴퓨팅 전력을 향상시키기 위해 JavaScript 환경에 도입됩니다. 2) 게임 개발에서 C는 물리 엔진 및 그래픽 렌더링을 처리하며 JavaScript는 게임 로직 및 사용자 인터페이스를 담당합니다.

웹 사이트에서 앱으로 : 다양한 JavaScript 애플리케이션Apr 22, 2025 am 12:02 AM

JavaScript는 웹 사이트, 모바일 응용 프로그램, 데스크탑 응용 프로그램 및 서버 측 프로그래밍에서 널리 사용됩니다. 1) 웹 사이트 개발에서 JavaScript는 HTML 및 CSS와 함께 DOM을 운영하여 동적 효과를 달성하고 jQuery 및 React와 같은 프레임 워크를 지원합니다. 2) 반응 및 이온 성을 통해 JavaScript는 크로스 플랫폼 모바일 애플리케이션을 개발하는 데 사용됩니다. 3) 전자 프레임 워크를 사용하면 JavaScript가 데스크탑 애플리케이션을 구축 할 수 있습니다. 4) node.js는 JavaScript가 서버 측에서 실행되도록하고 동시 요청이 높은 높은 요청을 지원합니다.

Python vs. JavaScript : 사용 사례 및 응용 프로그램 비교Apr 21, 2025 am 12:01 AM

Python은 데이터 과학 및 자동화에 더 적합한 반면 JavaScript는 프론트 엔드 및 풀 스택 개발에 더 적합합니다. 1. Python은 데이터 처리 및 모델링을 위해 Numpy 및 Pandas와 같은 라이브러리를 사용하여 데이터 과학 및 기계 학습에서 잘 수행됩니다. 2. 파이썬은 간결하고 자동화 및 스크립팅이 효율적입니다. 3. JavaScript는 프론트 엔드 개발에 없어서는 안될 것이며 동적 웹 페이지 및 단일 페이지 응용 프로그램을 구축하는 데 사용됩니다. 4. JavaScript는 Node.js를 통해 백엔드 개발에 역할을하며 전체 스택 개발을 지원합니다.

See all articles