>백엔드 개발 >파이썬 튜토리얼 >Python의 문자열에서 ANSI 이스케이프 시퀀스를 어떻게 제거할 수 있습니까?

Python의 문자열에서 ANSI 이스케이프 시퀀스를 어떻게 제거할 수 있습니까?

Susan Sarandon
Susan Sarandon원래의
2024-12-06 16:36:15543검색

How Can I Remove ANSI Escape Sequences from Strings in Python?

Python의 문자열에서 ANSI 이스케이프 시퀀스 제거

SSH 명령에서 얻은 문자열로 작업할 때 다음 작업을 방해하는 ANSI 이스케이프 시퀀스가 ​​나타날 수 있습니다. 프로그램의 작동. 이러한 이스케이프 시퀀스를 제거하고 문자열에서 관련 정보를 추출하려면 Python의 정규식 모듈을 사용하여 다음 기술을 사용할 수 있습니다.

정규식 방법

다음 기술을 사용할 수 있습니다. 문자열에서 ANSI 이스케이프 시퀀스를 식별하고 제거하려면 다음 정규 표현식을 사용하세요.

import re

# 7-bit C1 ANSI sequences
ansi_escape = re.compile(r'\x1B(?:[@-Z\-_]|\[[0-?]*[ -/]*[@-~])')
result = ansi_escape.sub('', sometext)

이 정규 표현식은 7비트와 7비트를 모두 대상으로 합니다. CSI(Control Sequence Introducers) 및 SGR(Select Graphic Rendition) 코드를 포함한 8비트 C1 ANSI 이스케이프 시퀀스.

ANSI 이스케이프가 포함된 다음 문자열을 고려하세요. 시퀀스:

'ls\r\n\x1b[00m\x1b[01;31mexamplefile.zip\x1b[00m\r\n\x1b[01;31m'

위 정규식을 적용하면 이스케이프가 제거됩니다.

ls\r\nexamplefile.zip\r\n

정규식 설명

  • x1B: Escape 문자(ESC)에 대한 ASCII 코드와 일치합니다.
  • [@-Z\-_]: 그렇지 않은 7비트 C1 이스케이프 시퀀스와 일치합니다. CSI.
  • [[0-?]*[ -/]*[@-~]: CSI 이스케이프 시퀀스와 일치합니다.
  • `?*: 이전 요소가 0개 이상 일치합니다. .
  • .*: 이스케이프 시퀀스 뒤에 오는 모든 문자와 일치합니다.

이를 일치시키고 제거합니다. 이스케이프 시퀀스를 사용하면 문자열에서 원하는 텍스트를 효과적으로 추출할 수 있습니다.

위 내용은 Python의 문자열에서 ANSI 이스케이프 시퀀스를 어떻게 제거할 수 있습니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.