AI を使用して構造的な出力のための最速かつ正確な請求書データ抽出ツールを作成する-Python チュートリアル-php.cn

ホームページ

バックエンド開発

Python チュートリアル

AI を使用して構造的な出力のための最速かつ正確な請求書データ抽出ツールを作成する

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Aug 07, 2024 am 06:36 AM

Create the fastest and precise invoice data extractor for structural output using AI

Pydantic モデルで LlamaExtract を使用してショップのレシートを抽出する

この記事では、ショップのレシートから構造化データを抽出するために、Pydantic モデルのスキーマを組み込んだ LlamaExtract を使用する方法を説明します。このアプローチは、領収書情報を体系的に整理するのに役立ち、分析と管理が容易になります。

設定

まず、llama-extract クライアントライブラリがインストールされていることを確認します。次のコマンドを使用します:

リーリー

注: pip の更新に関する通知が表示された場合は、提供されているコマンドを使用して更新できます。

まず、ログインして、Llama Index Cloud から API キーを無料で取得します

LlamaExtract API キーの環境変数を設定します:

リーリー

データを読み込む

この例では、PDF 形式の店舗レシートのデータセットがあると仮定しましょう。これらのファイルを、receipations という名前のディレクトリに配置します。

リーリー

出力には、領収書のファイルパスがリストされるはずです:

リーリー

Pydantic モデルを定義する

Pydantic を使用してデータモデルを定義します。これにより、PDF からどのフィールド/データを期待している、または抽出したいかを API に指示します。店のレシートの場合は、店名、日付、合計金額、購入した商品のリストを抽出することに興味があるかもしれません。

リーリー

スキーマの作成

これで、Pydantic モデルを使用して、LlamaExtract で抽出スキーマを定義できるようになりました。

リーリー

出力スキーマは次のようになります:

リーリー

抽出の実行

スキーマが定義されたので、レシートファイルから構造化データを抽出できるようになりました。応答モデルとして Receipt を指定することで、抽出されたデータが検証され、構造化されていることを確認します。

リーリー

必要に応じて、生の JSON 出力にアクセスできます:

リーリー

JSON 出力の例:

リーリー

結論

この記事では、Pydantic モデルで LlamaExtract を使用してデータスキーマを定義し、ショップのレシートから構造化データを抽出する方法を説明しました。このアプローチにより、抽出された情報が適切に整理および検証され、取り扱いと分析が容易になります。

これは、請求書、領収書、レポートなどの多くのケースにも使用できます

コーディングを楽しんでください!!

プロジェクトはありますか？私にメールを送ってほしいということですか??: wilbertmisingo@gmail.com

質問がある場合、または私の投稿について誰よりも早く知りたい場合:-
LinkedIn で✅私をフォローしてください?
Twitter/X で✅私をフォローしてください?

以上がAI を使用して構造的な出力のための最速かつ正確な請求書データ抽出ツールを作成するの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明

この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

Pythonを使用した科学コンピューティングでアレイはどのように使用されていますか？Apr 25, 2025 am 12:28 AM

Arraysinpython、特にvianumpy、arecrucialinscientificComputing fortheirefficienty andversitility.1）彼らは、fornumericaloperations、data analysis、andmachinelearning.2）numpy'simplementation incensuresfasteroperationsthanpasteroperations.3）arayableminablecickick

同じシステムで異なるPythonバージョンをどのように処理しますか？Apr 25, 2025 am 12:24 AM

Pyenv、Venv、およびAnacondaを使用して、さまざまなPythonバージョンを管理できます。 1）Pyenvを使用して、複数のPythonバージョンを管理します。Pyenvをインストールし、グローバルバージョンとローカルバージョンを設定します。 2）VENVを使用して仮想環境を作成して、プロジェクトの依存関係を分離します。 3）Anacondaを使用して、データサイエンスプロジェクトでPythonバージョンを管理します。 4）システムレベルのタスク用にシステムPythonを保持します。これらのツールと戦略を通じて、Pythonのさまざまなバージョンを効果的に管理して、プロジェクトのスムーズな実行を確保できます。

標準のPythonアレイでnumpyアレイを使用することの利点は何ですか？Apr 25, 2025 am 12:21 AM

numpyarrayshaveveraladvantages-averstandardpythonarrays：1）thealmuchfasterduetocベースのインプレンテーション、2）アレモレメモリ効率、特にlargedatasets、および3）それらは、拡散化された、構造化された形成術科療法、

アレイの均質な性質はパフォーマンスにどのように影響しますか？Apr 25, 2025 am 12:13 AM

パフォーマンスに対する配列の均一性の影響は二重です。1）均一性により、コンパイラはメモリアクセスを最適化し、パフォーマンスを改善できます。 2）しかし、タイプの多様性を制限し、それが非効率につながる可能性があります。要するに、適切なデータ構造を選択することが重要です。

実行可能なPythonスクリプトを作成するためのベストプラクティスは何ですか？Apr 25, 2025 am 12:11 AM

craftexecutablepythonscripts、次のようになります

numpyアレイは、アレイモジュールを使用して作成された配列とどのように異なりますか？Apr 24, 2025 pm 03:53 PM

numpyarraysarasarebetterfornumeroperations andmulti-dimensionaldata、whilethearraymoduleissuitable forbasic、1）numpyexcelsinperformance and forlargedatasentassandcomplexoperations.2）thearraymuremememory-effictientivearientfa

Numpyアレイの使用は、Pythonで配列モジュール配列の使用と比較してどのように比較されますか？Apr 24, 2025 pm 03:49 PM

NumPyArraySareBetterforHeavyNumericalComputing、whilethearrayarayismoreSuitableformemory-constrainedprojectswithsimpledatatypes.1）numpyarraysofferarays andatiledance andpeperancedatasandatassandcomplexoperations.2）thearraymoduleisuleiseightweightandmemememe-ef

CTypesモジュールは、Pythonの配列にどのように関連していますか？Apr 24, 2025 pm 03:45 PM

ctypesallowsinging andmanipulatingc-stylearraysinpython.1）usectypestointerfacewithclibrariesforperformance.2）createc-stylearraysfornumericalcomputations.3）passarraystocfunctions foreffientientoperations.how、how、becuutiousmorymanagemation、performanceo

See all articles

ホットAIツール

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

脱衣画像を無料で

Clothoff.io

AI衣類リムーバー

Video Face Swap

完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

ホットツール

MinGW - Minimalist GNU for Windows

このプロジェクトは osdn.net/projects/mingw に移行中です。引き続きそこでフォローしていただけます。 MinGW: GNU Compiler Collection (GCC) のネイティブ Windows ポートであり、ネイティブ Windows アプリケーションを構築するための自由に配布可能なインポートライブラリとヘッダーファイルであり、C99 機能をサポートする MSVC ランタイムの拡張機能が含まれています。すべての MinGW ソフトウェアは 64 ビット Windows プラットフォームで実行できます。