찾다
웹 프론트엔드JS 튜토리얼구조화되지 않은 이메일을 실행 가능한 데이터로 전환

Turn Unstructured Emails to Actionable Data

이 빌드에서는 물류 산업을 위해 설계된 도구를 구축하고 있습니다. 이 도구는 이메일의 PDF 첨부 파일(예: 견적 요청 또는 배송 정보 시트)에서 구조화된 데이터를 자동으로 추출하여 이 데이터를 워크플로의 다른 곳에서 사용할 수 있도록 합니다.

이해를 더 쉽게 하기 위해 다양한 도시에 깨지기 쉬운 전자제품을 운송하는 전문 가상 회사인 Nova Logistics를 예로 들어 보겠습니다.

Nova Logistics에서는 고객이 이메일로 도시 간 상품 배송 견적을 요청하며 일반적으로 필요한 모든 배송 세부정보가 포함된 PDF를 첨부합니다. 현재 프로세스는 수동으로 이루어집니다. Nova의 누군가가 각 이메일을 열고, 첨부된 PDF를 다운로드하고, 읽어본 후, 배송비를 계산하기 전에 품목 이름 및 수량과 같은 주요 정보를 추출해야 합니다.

특히 하루에 여러 개의 이메일이 있고 각 이메일에 긴 PDF 문서가 있는 경우에는 몇 시간이 걸릴 수 있습니다.

이 기사에서는 이메일을 가져오고 PDF 데이터를 추출하는 것부터 추출된 정보를 Google 스프레드시트로 보내는 것까지 전체 프로세스를 자동화하는 도구를 구축하는 과정을 살펴보겠습니다.

작동 방식

  1. 이메일 설문조사: 먼저 받은편지함에서 새 이메일을 정기적으로 확인하는 시스템을 설정하겠습니다. 이메일을 찾으면 PDF 첨부 파일을 다운로드하고 이메일에 라벨을 적용하여 나중에 다시 폴링되지 않도록 합니다.
  2. Documind로 데이터 추출: AI를 사용하여 문서에서 구조화된 데이터를 추출하는 오픈 소스 패키지인 Documind에 PDF를 URL로 전달합니다. 그러면 품목 이름, 수량, 배송 세부 정보, 무게 등과 같은 정보가 제공됩니다.
  3. 데이터 저장 및 사용: 마지막으로 추출된 데이터를 Google 스프레드시트로 전송하여 추가 계산에 쉽게 보고 추적하고 사용할 수 있습니다.

우리에게 필요한 것

이 도구를 구축하려면 다음 패키지가 필요합니다.

  • Gmail API: 받은편지함에서 이메일을 가져옵니다.
  • Supabase: PDF를 업로드하고 저장합니다.
  • Documind: PDF에서 구조화된 데이터를 추출합니다.
  • Google Sheets API: 추출된 데이터를 저장하고 견적을 계산합니다.
  • 난고: 사용자 인증 관리

1단계: 초기 설정

코드 작성을 시작하기 전에 몇 가지 설정을 해야 합니다. 괜찮아요; 각 단계를 안내해드리겠습니다.

1.1 Node.js 설치

Node.js를 사용하여 코드를 실행하겠습니다. Node.js가 설치되어 있지 않다면 Node.js 홈페이지에 접속하여 최신 버전을 다운로드 받으세요.

1.2 필수 라이브러리 설치

Node.js가 설치되면 Gmail, Google Sheets, Supabase 및 Documind와 상호 작용하는 데 도움이 되는 패키지를 설치해야 합니다.

  1. 터미널 또는 명령 프롬프트를 엽니다.
  2. 다음을 실행하여 프로젝트에 대한 새 폴더를 만듭니다.

    mkdir nova
    cd nova
    
  3. 프로젝트 초기화:

    npm init -y
    
  4. 필수 패키지 설치:

    npm install googleapis @supabase/supabase-js documind dotenv @nangohq/node
    

1.3 API 자격 증명 받기

코드 작성을 시작하기 전에 Google API(Gmail 및 Google Sheets), Supabase 및 Documind를 사용하기 위한 모든 자격 증명을 설정하고 가져와야 합니다. 각각에 대한 빠른 가이드는 다음과 같습니다.

Google API

  1. Google Cloud Console로 이동하세요.
  2. 프로젝트 목록에서 프로젝트를 선택하거나 새 프로젝트를 생성하세요
  3. 프로젝트에 Gmail API 및 Google Sheets API를 활성화하세요.
    • Cloud Console의 API 라이브러리로 이동하여 'Gmail API' 및 'Google Sheets API'를 검색하세요. 각각을 클릭하여 활성화하세요.
  4. 동의 화면 구성:
    • API 및 서비스 >로 이동 OAuth 동의 화면
    • 앱 이름을 지정하세요.
    • 시청자 유형으로 '외부'를 선택하세요.
    • 기타 필수 입력란을 작성하세요.
  5. OAuth 2.0 자격 증명 만들기:
    • API 및 서비스 >로 이동 자격 증명.
    • Create Credentials를 클릭하고 OAuth 클라이언트 ID를 선택하세요.
    • 애플리케이션 유형으로 '웹 애플리케이션'을 선택하세요.
    • 클라이언트 ID와 비밀번호를 복사하세요.
  6. 여러 플랫폼에서 사용자 OAuth를 쉽게 관리하기 위해 Nango를 사용합니다. 시작하는 방법에 대한 설명서를 확인할 수 있습니다.
    • Nango에 로그인하고 새 통합 구성을 클릭하세요.
    • 통합 목록에서 Google Mail을 검색하세요.
    • 복사한 클라이언트 ID와 비밀번호를 추가하세요.
    • 범위 필드에 https://www.googleapis.com/auth/gmail.readonly, https://www.googleapis.com/auth/gmail.modify 및 https://www.googleapis를 추가합니다. com/auth/gmail.labels
    • 통합할 콜백 URL을 복사하여 저장하세요.
    • Google 콘솔의 자격 증명으로 돌아가 콜백 URL을 승인된 리디렉션 URI로 추가하세요.

Google Sheets API도 사용하고 있으므로 6단계만 진행하면 Nango에서 또 다른 통합을 만들 수 있습니다. Google Sheets 통합을 검색하고 복사한 것과 동일한 클라이언트 ID 및 비밀번호를 사용하세요. 범위 공간에 https://www.googleapis.com/auth/spreadsheets

를 추가합니다.

앱을 게시하려면 Google 콘솔의 OAuth 동의 화면으로 이동하여 게시 버튼을 클릭하세요.

수파베이스

  1. Supabase에서 무료 계정에 가입하세요.
  2. PDF를 저장할 새 프로젝트버킷을 만듭니다.
  3. 프로젝트 설정에서 API URLAPI 키를 가져옵니다.

2단계: 코드 작성

이제 코드를 조금씩 작성해 보겠습니다.

2.1 환경변수 추가

코드 전체에서 사용되는 모든 중요한 변수를 저장하는 .env 파일을 만듭니다. 예는 다음과 같습니다.

mkdir nova
cd nova

코드에서 이러한 변수를 가져오고 사용하는 방법을 자세히 살펴보겠습니다.

2.2 Gmail API 설정 및 이메일 가져오기

먼저 Gmail API를 사용하여 처리됨 라벨이 없고 첨부 파일이 포함된 이메일을 가져오겠습니다.

필요한 액세스 토큰을 검색하기 위해 Nango를 사용합니다. 토큰이 만료되면 자동으로 토큰 새로고침을 처리하므로 토큰 수명주기를 직접 관리하는 것에 대해 걱정할 필요가 없습니다.

필요한 것은 다음과 같습니다.

  1. Nango Gmail 설정의 통합 ID
  2. 액세스 토큰이 필요한 사용자의 연결 ID입니다.
  3. 당신의 난고 비밀키.

자신의 Gmail 계정을 사용하여 Nango UI를 통해 직접 새 연결을 쉽게 추가할 수 있습니다. 귀하의 비밀키는 Nango 대시보드의 환경 설정 섹션에서 확인할 수 있습니다.

npm init -y

간결함을 위해 결과를 한 번에 5개의 이메일로 제한하고 PDF 첨부 파일이 있는 이메일만 가져오도록 구체적으로 필터링하겠습니다. 그 중 처리를 위해 첫 번째 첨부 파일만 검색합니다. 첨부 파일을 다운로드한 후 레이블을 적용하여 이메일을 처리된 것으로 표시하여 향후 폴링 주기에서 다시 가져오지 않도록 합니다.

2.2 Supabase에 업로드

다음으로 다운로드한 PDF를 Supabase에 업로드해야 합니다. 코드의 버킷 이름을 자신의 이름으로 바꾸세요.

npm install googleapis @supabase/supabase-js documind dotenv @nangohq/node

2.3 Documind를 사용하여 데이터 추출

PDF가 Supabase에 저장되면 Documind를 사용하여 관련 데이터를 추출합니다. 처리를 위해 OpenAI를 활용하므로 API 키가 .env 파일에 추가되었는지 확인하세요.

Documind는 필요한 구조화된 데이터를 추출하기 위해 정의한 스키마와 함께 작동합니다. 곧 스키마 정의를 살펴보겠습니다. 자세한 내용은 설명서를 확인하시기 바랍니다.

SUPABASE_API_KEY=<supabase api key>
SUPABASE_URL=<supabase url>
OPENAI_API_KEY=<open ai api key>
NANGO_KEY=<nango secret key>
</nango></open></supabase></supabase>

2.4 추출된 데이터를 Google Sheets로 보내기

PDF에서 데이터를 추출한 후 Google 스프레드시트로 전송합니다.

계속하기 전에 Google 스프레드시트가 설정되어 있고 Nango를 통해 계정과 연결이 설정되어 있는지 확인하세요. 아직 시작하지 않았다면 시작하는 데 사용할 수 있는 템플릿이 있습니다.

mkdir nova
cd nova

3단계: 모든 것을 하나로 합치기

이제 개별 함수를 작성했으므로 모든 것을 하나로 모아야 합니다.

이 단계에서는 Documind가 필요한 데이터를 추출하는 데 사용할 스키마를 정의합니다. 이 스키마는 AI가 PDF에서 관련 정보를 식별하고 구조화하도록 안내합니다.

npm init -y

코드 테스트

전체 소스 코드는 테스트용 샘플 PDF와 함께 GitHub에서 확인할 수 있습니다. 그러나 자신만의 문서를 만들고 사용할 수도 있습니다. 저장소를 복제하고 요구 사항에 맞게 코드를 수정한 후 자신의 사용 사례에 맞게 사용해 보세요.

위 내용은 구조화되지 않은 이메일을 실행 가능한 데이터로 전환의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
JavaScript로 문자열 문자를 교체하십시오JavaScript로 문자열 문자를 교체하십시오Mar 11, 2025 am 12:07 AM

JavaScript 문자열 교체 방법 및 FAQ에 대한 자세한 설명 이 기사는 JavaScript에서 문자열 문자를 대체하는 두 가지 방법 인 내부 JavaScript 코드와 웹 페이지의 내부 HTML을 탐색합니다. JavaScript 코드 내부의 문자열을 교체하십시오 가장 직접적인 방법은 대체 () 메소드를 사용하는 것입니다. str = str.replace ( "find", "replace"); 이 메소드는 첫 번째 일치 만 대체합니다. 모든 경기를 교체하려면 정규 표현식을 사용하고 전역 플래그 g를 추가하십시오. str = str.replace (/fi

자신의 Ajax 웹 응용 프로그램을 구축하십시오자신의 Ajax 웹 응용 프로그램을 구축하십시오Mar 09, 2025 am 12:11 AM

그래서 여기 당신은 Ajax라는이 일에 대해 배울 준비가되어 있습니다. 그러나 정확히 무엇입니까? Ajax라는 용어는 역동적이고 대화식 웹 컨텐츠를 만드는 데 사용되는 느슨한 기술 그룹을 나타냅니다. 원래 Jesse J에 의해 만들어진 Ajax라는 용어

10 JQuery Fun 및 Games 플러그인10 JQuery Fun 및 Games 플러그인Mar 08, 2025 am 12:42 AM

10 재미있는 jQuery 게임 플러그인 웹 사이트를보다 매력적으로 만들고 사용자 끈적함을 향상시킵니다! Flash는 여전히 캐주얼 웹 게임을 개발하기위한 최고의 소프트웨어이지만 JQuery는 놀라운 효과를 만들 수 있으며 Pure Action Flash 게임과 비교할 수는 없지만 경우에 따라 브라우저에서 예기치 않은 재미를 가질 수 있습니다. jQuery tic 발가락 게임 게임 프로그래밍의 "Hello World"에는 이제 jQuery 버전이 있습니다. 소스 코드 jQuery Crazy Word Composition 게임 이것은 반은 반은 게임이며, 단어의 맥락을 알지 못해 이상한 결과를 얻을 수 있습니다. 소스 코드 jQuery 광산 청소 게임

jQuery 시차 자습서 - 애니메이션 헤더 배경jQuery 시차 자습서 - 애니메이션 헤더 배경Mar 08, 2025 am 12:39 AM

이 튜토리얼은 jQuery를 사용하여 매혹적인 시차 배경 효과를 만드는 방법을 보여줍니다. 우리는 멋진 시각적 깊이를 만드는 계층화 된 이미지가있는 헤더 배너를 만들 것입니다. 업데이트 된 플러그인은 jQuery 1.6.4 이상에서 작동합니다. 다운로드

내 자신의 JavaScript 라이브러리를 어떻게 작성하고 게시합니까?내 자신의 JavaScript 라이브러리를 어떻게 작성하고 게시합니까?Mar 18, 2025 pm 03:12 PM

기사는 JavaScript 라이브러리 작성, 게시 및 유지 관리, 계획, 개발, 테스트, 문서 및 홍보 전략에 중점을 둡니다.

브라우저에서 성능을 위해 JavaScript 코드를 최적화하려면 어떻게해야합니까?브라우저에서 성능을 위해 JavaScript 코드를 최적화하려면 어떻게해야합니까?Mar 18, 2025 pm 03:14 PM

이 기사는 브라우저에서 JavaScript 성능을 최적화하기위한 전략에 대해 설명하고 실행 시간을 줄이고 페이지로드 속도에 미치는 영향을 최소화하는 데 중점을 둡니다.

Matter.js : 소개를 시작합니다Matter.js : 소개를 시작합니다Mar 08, 2025 am 12:53 AM

Matter.js는 JavaScript로 작성된 2D 강성 신체 물리 엔진입니다. 이 라이브러리를 사용하면 브라우저에서 2D 물리학을 쉽게 시뮬레이션 할 수 있습니다. 그것은 단단한 몸체를 생성하고 질량, 면적 또는 밀도와 같은 물리적 특성을 할당하는 능력과 같은 많은 기능을 제공합니다. 중력 마찰과 같은 다양한 유형의 충돌 및 힘을 시뮬레이션 할 수도 있습니다. Matter.js는 모든 주류 브라우저를 지원합니다. 또한, 터치를 감지하고 반응이 좋기 때문에 모바일 장치에 적합합니다. 이러한 모든 기능을 사용하면 엔진 사용 방법을 배울 수있는 시간이 필요합니다. 이는 물리 기반 2D 게임 또는 시뮬레이션을 쉽게 만들 수 있습니다. 이 튜토리얼에서는 설치 및 사용을 포함한이 라이브러리의 기본 사항을 다루고

jQuery 및 Ajax를 사용한 자동 새로 고침 DIV 컨텐츠jQuery 및 Ajax를 사용한 자동 새로 고침 DIV 컨텐츠Mar 08, 2025 am 12:58 AM

이 기사에서는 jQuery 및 Ajax를 사용하여 5 초마다 DIV의 컨텐츠를 자동으로 새로 고치는 방법을 보여줍니다. 이 예제는 RSS 피드의 최신 블로그 게시물을 마지막 새로 고침 타임 스탬프와 함께 가져오고 표시합니다. 로딩 이미지는 선택 사항입니다

See all articles

핫 AI 도구

Undresser.AI Undress

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

Clothoff.io

AI 옷 제거제

AI Hentai Generator

AI Hentai Generator

AI Hentai를 무료로 생성하십시오.

뜨거운 도구

SublimeText3 Mac 버전

SublimeText3 Mac 버전

신 수준의 코드 편집 소프트웨어(SublimeText3)

Eclipse용 SAP NetWeaver 서버 어댑터

Eclipse용 SAP NetWeaver 서버 어댑터

Eclipse를 SAP NetWeaver 애플리케이션 서버와 통합합니다.

MinGW - Windows용 미니멀리스트 GNU

MinGW - Windows용 미니멀리스트 GNU

이 프로젝트는 osdn.net/projects/mingw로 마이그레이션되는 중입니다. 계속해서 그곳에서 우리를 팔로우할 수 있습니다. MinGW: GCC(GNU Compiler Collection)의 기본 Windows 포트로, 기본 Windows 애플리케이션을 구축하기 위한 무료 배포 가능 가져오기 라이브러리 및 헤더 파일로 C99 기능을 지원하는 MSVC 런타임에 대한 확장이 포함되어 있습니다. 모든 MinGW 소프트웨어는 64비트 Windows 플랫폼에서 실행될 수 있습니다.

드림위버 CS6

드림위버 CS6

시각적 웹 개발 도구

WebStorm Mac 버전

WebStorm Mac 버전

유용한 JavaScript 개발 도구