法的文書に関連付けられた顧客の特定-ウェブ3.0-php.cn

ホームページ

ウェブ3.0

法的文書に関連付けられた顧客の特定

Linda Hamilton

Nov 19, 2024 am 10:22 AM

ner Czech Documents XLM-RoBERTa Accelerate

主な目的は、次の識別子のいずれかを使用して各ドキュメントに関連付けられたクライアントを識別することでした:

法的文書に関連付けられた顧客の特定

目標は、固有表現認識 (NER) を使用して法的文書からクライアント名を抽出することでした。私がこのタスクにどのように取り組んだかは次のとおりです:

データ: 私は PDF 形式の法的文書のコレクションを持っていました。タスクは、次のいずれかの識別子を使用して、各文書で言及されているクライアントを識別することでした:

おおよそのクライアント名 (例: "John Doe")

正確なクライアント名 (例: "Doe, John A.")

おおよその事務所名 (例: "Doe Law Firm")

正確な事務所名 (例: "Doe, John A. Law Firm")

文書の約 5% には、特定の実体が含まれていませんでした。

データセット: モデルの開発には、710 個の「本物の」PDF ドキュメントを使用し、トレーニング用に 600 個、検証用に 55 個、テスト用に 55 個の 3 つのセットに分割しました。

ラベル: プレーンテキストとして抽出されたエンティティを含む Excel ファイルが渡されましたが、文書テキスト内で手動でラベルを付ける必要がありました。 BIO タグ付け形式を使用して、次の手順を実行しました:

エンティティの始まりを「B-」でマークします。

同じエンティティ内の後続のトークンに「I-」のマークを付け続けます。

トークンがどのエンティティにも属していない場合は、「O」とマークします。

代替アプローチ: 入力トークンの境界ボックスも考慮する LayoutLM のようなモデルは、NER タスクのパフォーマンスを向上させる可能性があります。ただし、よくあることですが、すでにプロジェクト時間の大部分をデータの準備 (Excel ファイルの再フォーマット、データエラーの修正、ラベル付けなど) に費やしていたので、私はこのアプローチを使用しないことにしました。バウンディングボックスベースのモデルを統合するには、さらに多くの時間を割り当てる必要がありました。

理論的には、正規表現とヒューリスティックをこれらの単純なエンティティの識別に適用できますが、他の潜在的な候補の中から正しいエンティティ (弁護士名、事件など) を正確に識別するには過度に複雑なルールが必要となるため、このアプローチは非現実的であると予想していました。番号、議事の他の参加者）。対照的に、モデルは関連するエンティティを区別する方法を学習できるため、ヒューリスティックの使用が不要になります。

以上が法的文書に関連付けられた顧客の特定の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明

この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

トップ10の通貨交換アプリトップ10の暗号通貨取引所の最新のランキングMay 15, 2025 pm 06:30 PM

トップ10の通貨交換アプリ：1。Binance、2。Okx、3。Huobi、4。Coinbase、5。Kraken、6。Bybit、7。Kucoin、8。Bitfinex、9。Gemini、10。Bitstamp、これらのプラットフォームは、ユーザーの経験、セキュリティ、および取引ボリュームにおける利点について高く評価されています。

トップ10の暗号通貨交換アプリのランキングトップ10の暗号通貨交換のランキングMay 15, 2025 pm 06:27 PM

上位10の暗号通貨交換は次のとおりです。1。Binance、2。Okx、3。Huobi、4。Coinbase、5。Kraken、6。Bittrex、7。Bitfinex、8。Kucoin、9。Gemini、10。

トップ10仮想通貨取引プラットフォームランキングトップ10仮想通貨交換アプリMay 15, 2025 pm 06:24 PM

トップ10仮想通貨取引プラットフォームランキング：1。OKX、2。Binance、3。Huobi、4。Coinbase、5。Kraken、6。Bitfinex、7。Bittrex、8。Poloniex、9。Gemini、10。Kucoin。これらのプラットフォームはすべて、さまざまなデジタル資産取引サービスを提供し、スポット、先物、レバレッジド取引をサポートし、ステーキングおよび貸付サービスを提供しています。ユーザーインターフェイスはシンプルで、モバイルアプリケーション機能は強力です。

トップ10のデジタル通貨交換アプリの最新のランキングトップ10のデジタル通貨交換アプリの最新のランキング

上位10のデジタル通貨交換アプリは次のとおりです。1。Binance、2。Okx、3。Huobi、4。Coinbase、5。Kraken、6。Bittrex、7。Bitfinex、8。Kucoin、9。Gemini、10。Poloniex。これらの交換には独自の特性があり、さまざまなレベルの使用レベルのユーザーに適した豊富な取引オプションと強力なセキュリティ対策を提供します。

トップ10デジタル通貨取引プラットフォームアプリの最新のトップ10デジタル通貨取引プラットフォームアプリのランキングランキングMay 15, 2025 pm 06:18 PM

トップ10デジタル通貨取引プラットフォームアプリのランキング：1。Binance、2。OKX、3。Huobi、4。Coinbase、5。Kraken、6。Bitfinex、7。Bybit、8。Kucoin、9。FTX、10。Gemini、これらのプラットフォームはユーザーエクスペリエンス、セキュリティ、およびサポートされた通貨の範囲での取引型、サポートされています。

トップ10の通貨交換トップ10の通貨交換アプリの累積May 15, 2025 pm 06:15 PM

上位10の通貨交換は次のとおりです。1。Binance、2。Okx、3。Huobi、4。Coinbase、5。Kraken、6。Bybit、7。Kucoin、8。Bitfinex、9。Gemini、10。Bitstamp、これらのプラットフォームは、ユーザーエクスペリエンス、セキュリティ、およびトランザクションボリュームにおいて高く評価されています。

上位10の暗号通貨交換は次のとおりです。1。Binance、2。Okx、3。Huobi、4。Coinbase、5。Kraken、6。Bittrex、7。Bitfinex、8。Kucoin、9。Gemini、10。

トップ10の仮想通貨取引プラットフォームの最新のランキングトップ10の仮想通貨取引プラットフォームアプリの最新のランキングMay 15, 2025 pm 06:09 PM

トップ10の仮想通貨アプリトレーディングプラットフォームの最新のランキング：1。OKX、2。Binance、3。Huobi、4。Coinbase、5。Kraken、6。Bitfinex、7。Bittrex、8。Poloniex、9。Gemini、10。Kucoin。これらのプラットフォームはすべて、さまざまなデジタル資産取引サービスを提供し、スポット、先物、レバレッジド取引をサポートし、ステーキングおよび貸付サービスを提供しています。ユーザーインターフェイスはシンプルで、モバイルアプリケーション機能は強力です。

ホットAIツール

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

脱衣画像を無料で

Clothoff.io

AI衣類リムーバー

Video Face Swap

完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

ホットツール

SAP NetWeaver Server Adapter for Eclipse

Eclipse を SAP NetWeaver アプリケーションサーバーと統合します。

SublimeText3 英語版

推奨: Win バージョン、コードプロンプトをサポート!

SecLists

SecLists は、セキュリティテスターの究極の相棒です。これは、セキュリティ評価中に頻繁に使用されるさまざまな種類のリストを 1 か所にまとめたものです。 SecLists は、セキュリティテスターが必要とする可能性のあるすべてのリストを便利に提供することで、セキュリティテストをより効率的かつ生産的にするのに役立ちます。リストの種類には、ユーザー名、パスワード、URL、ファジングペイロード、機密データパターン、Web シェルなどが含まれます。テスターはこのリポジトリを新しいテストマシンにプルするだけで、必要なあらゆる種類のリストにアクセスできるようになります。