>백엔드 개발 >파이썬 튜토리얼 ># | PDF 데이터 추출 자동화: 사용자 승인 테스트

# | PDF 데이터 추출 자동화: 사용자 승인 테스트

Mary-Kate Olsen
Mary-Kate Olsen원래의
2024-12-16 00:18:32800검색

개요

각 기능을 출시하기 전에 사용자 승인 테스트("UAT")를 수행하여 버그를 찾아내고 비즈니스 로직이 코드로 올바르게 변환되었는지 확인합니다.

UAT가 100% 성공한 후에만 릴리스 기능을 선택합니다.

제 추론은 간단합니다. 최종 사용자에게 좋은 첫인상을 줄 수 있는 기회는 단 한 번 뿐이고, 릴리스가 좋지 않으면 그렇게 하기가 두 배로 어렵습니다.

# | Automate PDF data extraction: User Acceptance Testing

제품 출시를 위한 MVP 기능은 아니지만, 실력을 유지하기 위해 UAT를 좀 해보면 좋겠다고 생각했습니다.

결과

제가 생각해낸 19개 UAT 시나리오 중 하나는 관리자 명세서 PDF 템플릿 변경으로 인해 실패했습니다.

Discovery 과정에서 이러한 위험을 예상했지만, 사실 이 문제가 이렇게 빨리 발생할 것이라고는 예상하지 못했습니다.

버그 수정에 대한 자세한 내용은 글 후반부에서 다루겠습니다.

방법론

나의 UAT 프로세스에는 테스트 시나리오 및 예상 결과를 생성하기 위한 참조로 비즈니스 로직 또는 기능 요구 사항을 사용하는 작업이 포함됩니다.

테스트 시나리오는 복잡할 필요가 없습니다. "이 기능은 30초 내에 CSV 파일을 생성합니다."처럼 간단할 수 있습니다.

UAT의 경우 관리인 명세서 PDF 10개에서 문서 71페이지를 처리했습니다. 충분히 큰 샘플 세트여야 합니다.

예상되는 출력은 보관 명세서 PDF의 펀드 보유, 증권 보유현금 보유 섹션의 특정 데이터 포인트가 포함된 3개의 CSV 파일입니다.

다음 테스트 사례를 생각해냈습니다.

CSV 1: 펀드 보유

# | Automate PDF data extraction: User Acceptance Testing

CSV 2: 증권 보유

# | Automate PDF data extraction: User Acceptance Testing

CSV 3: 현금 보유

# | Automate PDF data extraction: User Acceptance Testing

버그 수정

테스트에 실패한 이유 중 하나는 관리인 명세서 PDF의 템플릿이 11월에 약간 변경되었기 때문입니다. 보다 구체적으로 말하면, 이제 펀드 보유 테이블의 "현재 가치# 1. 외화 2. RM 등가" 열의 값에 "-n" 접두사가 추가로 붙습니다.

예를 들어 이전 PDF에서는 "USD 10,000"로 표시되지 않고 이제 값은 "- USD10,000"로 표시됩니다.

# | Automate PDF data extraction: User Acceptance Testing

이 작은 변경으로 인해 다음과 같은 문제가 발생했습니다.

# | Automate PDF data extraction: User Acceptance Testing

수정 사항에 대해 ChatGPT에 문의한 결과 잘못된 "-/n" 접두사를 제거하기 위해 다음 스크러빙 로직을 추가하는 것이 좋습니다.

# Scrub error prefix
df['Currency'] = df['Currency'].str.replace('[-\n]', '', regex=True)

스크러빙 작업이 성공했고 이제 Fund Holdings CSV 출력이 예상대로 나옵니다.

다음은 무엇입니까?

이제 PDF 데이터를 추출하는 코드가 작동한다는 점이 마음에 듭니다. 그렇긴 하지만, CSV 파일은 이 모든 데이터를 저장하기에 가장 좋은 장소는 아니라고 생각합니다.

CSV는 나에게 사용자에게 친숙하지만 데이터베이스에 데이터를 저장하면 최종 사용자의 요구 사항에 따라 데이터를 검색하고 조작하는 것이 훨씬 더 쉬워집니다.

저는 데이터베이스에 대한 경험이 매우 제한되어 있습니다. 그래서 다음으로 할 일은 신속하게 온보딩할 수 있는 데이터베이스 애플리케이션의 Discovery입니다.

--종료

위 내용은 # | PDF 데이터 추출 자동화: 사용자 승인 테스트의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.