ホームページ > 記事 > テクノロジー周辺機器 > Ant Group と浙江大学が共同で、オープンソースの大規模モデル知識抽出フレームワークである OneKE をリリース
最近、Ant Group と浙江大学が共同開発した大規模モデル知識抽出フレームワークである OneKE がオープンソースとして発表され、OpenKG オープン ナレッジ グラフ コミュニティに寄贈されました。
ナレッジ グラフは、大規模モデルの信頼性と制御性を実現するための重要なテクノロジの 1 つであり、ドメイン ナレッジ グラフの構築に役立ちます。 OneKE は、研究者や開発者が情報抽出、テキスト データの構造化、ナレッジ グラフの構築などの問題をより適切に処理できるよう支援することに取り組んでいます。
OneKE を通じてリスク イベント、個人エンティティ、組織エンティティなどを抽出すると、イベントのコンテキスト、イベントの発展傾向、エンティティ間の相関関係を明確に提示できます。適切に構築されたグラフは、大規模なモデルがエンティティ全体にわたる複雑な推論を実現するのに役立ちます。と書類。 OneKE は中国語と英語のバイリンガルで、OpenSPG および DeepKE オープン ソース フレームワークをサポートしており、そのまま使用できます。
大規模な言語モデルにより、人工知能システムが世界の知識を処理する能力が大幅に向上しました。ただし、現実世界の情報は非常に断片化されており、構造化されていないため、大規模な言語モデルが情報抽出タスクを処理する場合、抽出されたコンテンツと自然言語表現との間に大きな違いがあるため、依然として不十分な結果が得られます。また、自然言語テキスト情報も含まれます。多くの曖昧さ、多義性、比喩などがあり、知識抽出タスクに大きな課題をもたらします。このことは、大規模言語モデルで代表される生成人工知能が依然として不十分な推論能力、事実知識の欠如、不安定な生成結果などの問題を抱えており、大規模言語モデルの産業化を大きく妨げているという事実にもつながります。
統合ナレッジ抽出フレームワークは、ドメイン ナレッジ グラフの構築コストを大幅に削減でき、幅広いアプリケーション シナリオを備えています。これは、大量のデータから構造化された知識を抽出し、高品質の知識グラフを構築し、知識要素間の論理的接続を確立することによって、説明可能な推論による決定を達成できることを意味します。また、それを使用して大規模なモデルを強化して錯覚を軽減し、安定性を向上させることもできます。垂直分野における大規模モデルの適用を加速します。
医療分野では、知識抽出を通じて医師の経験をナレッジマネジメントし、制御可能な補助診断・治療や医療Q&Aを構築します。金融分野では、財務指標、リスクイベント、因果関係、産業チェーンなどの知識抽出部門が使用され、財務調査レポートの自動生成、リスク予測、産業チェーン分析などを実現します。政務シナリオでは、政務規制の知識が実現され、政務サービスの効率と正確な意思決定が向上します。
生産ベースの人工知能の産業実装を加速するために、Ant Group と浙江大学は共同ナレッジ グラフ研究室を設立し、大規模なモデル、信頼性が高く制御可能なナレッジ生成機能によって強化されたナレッジ グラフの構築に重点を置いています。我々は、共同技術研究を通じて大規模な言語モデルとナレッジグラフの双方向の強化による制御可能な生成機能パラダイムを確立することを目的として、ワールドグラフなどのトピックに関する全面的な協力を開始しました。
Ant Group と浙江大学は、知識抽出分野における Ant Bailing 大規模モデルの機能を共同で確立およびアップグレードし、中国語と英語のバイリンガル大規模モデル知識抽出フレームワーク OneKE をリリースしました。また、そのバージョンもオープンソース化しました。 LLaMA2 のフルパラメータ微調整に基づいています。テスト指標は、OneKE が複数の完全に監視されたゼロサンプルのエンティティ/関係/イベント抽出タスクで比較的良好な結果を達成したことを示しています。
OneKE は、中国語と英語の優れたバイリンガルの一般化可能な知識抽出ツールであり、中国語の NER 固有表現認識タスク、RE 関係抽出タスク、および EE イベント抽出タスクで優れたパフォーマンスを発揮します。比較的良い結果が得られました。
Ant Group のナレッジ グラフ責任者である Liang Lei 氏は、Ant は引き続きナレッジ抽出のパフォーマンスを最適化し、さまざまなシナリオにおける大規模モデルの制御可能で信頼できるニーズに応えていくと述べました。将来的には、業界パートナーと協力して、関連する技術システムを金融、医療、行政などのさまざまな垂直分野に適用し、ナレッジグラフと大規模言語モデルの二重駆動による制御可能な発電技術の産業実装を推進していきます。
OneKE 公式ホームページ: http://oneke.openkg.cn/
OpenSPG GitHub: https://github.com/OpenSPG/openspg
以上がAnt Group と浙江大学が共同で、オープンソースの大規模モデル知識抽出フレームワークである OneKE をリリースの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。