>  기사  >  백엔드 개발  >  다중 프로세스 프로그래밍에 Python 정규식을 사용하는 방법

다중 프로세스 프로그래밍에 Python 정규식을 사용하는 방법

PHPz
PHPz원래의
2023-06-22 13:58:40789검색

Python은 정규식 모듈을 사용하여 문자열을 일치시키고 검색하고 조작할 수 있는 널리 사용되는 프로그래밍 언어입니다. 다중 프로세스 프로그래밍은 작업을 병렬로 처리하는 프로그래밍 기술로, 프로그램의 실행 효율성을 향상시킬 수 있습니다. 이 기사에서는 다중 프로세스 프로그래밍에 Python 정규 표현식을 사용하여 대량의 데이터를 더 빠르게 처리하는 방법을 소개합니다.

  1. 필요한 라이브러리 가져오기

다중 프로세스 프로그래밍을 수행할 때는 다중 처리 및 re 라이브러리를 사용해야 합니다. multiprocessing은 프로세스를 생성하고 관리하는 데 사용되며 re는 정규식을 적용하는 데 사용됩니다.

import multiprocessing
import re
  1. 데이터 준비

정규식을 사용하기 전에 일치시킬 데이터가 필요합니다. 이 문서에서는 일치해야 하는 문자열 목록을 샘플 데이터로 사용합니다.

data = [
    'xyz_123_mn1_na1234_qwe_rty',
    'pqr_234_mn2_na2345_asd_fgh',
    'hjk_345_mn3_na3456_zxc_vbn',
    'lmn_456_mn4_na4567_qaz_wsx',
    'hgo_567_mn5_na5678_edc_rfv'
]
  1. 정규식 정의

정규식 일치를 수행하기 전에 먼저 정규식을 정의해야 합니다.

이 예의 정규 표현식은 문자열의 숫자를 일치시키는 데 사용됩니다. 여기서 d+는 하나 이상의 숫자 그룹과 일치함을 의미합니다.

pattern = re.compile(r'd+')
  1. 처리 함수 정의

다중 프로세스 프로그래밍을 할 때는 먼저 함수를 정의하고 처리를 위해 함수에 데이터를 전달해야 합니다. 이 예제의 함수는 매개변수 데이터를 입력으로 사용하고, 각 문자열에서 일치하는 숫자를 추출하고, 이를 반환 값으로 반환합니다.

def get_numbers(data):
    result = list()
    for string in data:
        numbers = pattern.findall(string)
        result.append(numbers)
    return result
  1. 프로세스 풀 만들기

데이터와 함수를 준비한 후 프로세스 풀을 만들어 데이터를 병렬로 처리할 수 있습니다.

if __name__ == '__main__':
    # 创建进程池
    pool = multiprocessing.Pool()
  1. 프로세스 풀에 작업 제출

프로세스 풀의 map() 메서드를 사용하면 병렬 처리를 위해 작업을 프로세스 풀에 제출할 수 있습니다.

    # 将任务提交到进程池
    result = pool.map(get_numbers, [data])
  1. 프로세스 풀을 닫고 결과를 출력합니다

작업을 제출한 후 리소스를 해제하려면 프로세스 풀을 닫아야 합니다. 동시에 처리 결과도 출력되어야 합니다.

    # 关闭进程池
    pool.close()
    pool.join()

    # 输出结果
    print(result)

전체 코드 예:

import multiprocessing
import re

data = [
    'xyz_123_mn1_na1234_qwe_rty',
    'pqr_234_mn2_na2345_asd_fgh',
    'hjk_345_mn3_na3456_zxc_vbn',
    'lmn_456_mn4_na4567_qaz_wsx',
    'hgo_567_mn5_na5678_edc_rfv'
]

pattern = re.compile(r'd+')


def get_numbers(data):
    result = list()
    for string in data:
        numbers = pattern.findall(string)
        result.append(numbers)
    return result


if __name__ == '__main__':
    # 创建进程池
    pool = multiprocessing.Pool()

    # 将任务提交到进程池
    result = pool.map(get_numbers, [data])

    # 关闭进程池
    pool.close()
    pool.join()

    # 输出结果
    print(result)

결론

Python 정규식과 다중 프로세스 프로그래밍을 사용하면 데이터 처리 효율성을 크게 향상시킬 수 있습니다. 이 문서에서는 나중에 대량의 데이터로 작업할 때 작업을 더 빠르게 완료할 수 있도록 다중 프로세스 프로그래밍에 Python 정규식을 사용하는 방법을 설명합니다.

위 내용은 다중 프로세스 프로그래밍에 Python 정규식을 사용하는 방법의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.