CCIG2024では、Hehe Information文書分析技術が大規模モデルコーパスの「飢餓」問題を解決-AI-php.cn

ホームページ

テクノロジー周辺機器

CCIG2024では、Hehe Information文書分析技術が大規模モデルコーパスの「飢餓」問題を解決

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

May 31, 2024 pm 10:28 PM

業界ocrふふふ情報

2024年、中国イメージ・グラフィックス会議が古都西安で盛大に開幕します。このカンファレンスは、中国画像グラフィック学会が主催し、空軍医科大学、西安交通大学、北西理工大学が主催し、20 以上のフォーラムと 100 以上の成果を通じて、生産用人工知能の展示に焦点を当てました。大規模なモデル、機械学習、脳にインスピレーションを得たコンピューティング、その他の画像グラフィックスの分野。

大型モデル技術は、多くの業界の画像処理ニーズを満たすために技術革新とともに広く使用されています。会議中、CSIG文書画像分析認識特別委員会と上海和和信息技術有限公司（「和和新恒」）は共催でフォーラム「大型モデル技術とそのフロンティア応用」を開催し、南方諸国の代表者も参加した。中国理工大学と、上海交通大学、清華大学、復旦大学、上海人工知能研究所、和和新大学、その他の大学、研究機関、企業の専門家代表が、大型モデル技術の開発と応用について徹底的な議論を行った。画像フィールド。

CCIG2024では、Hehe Information文書分析技術が大規模モデルコーパスの「飢餓」問題を解決

キャプション: 業界のフォロワーが「大規模モデル技術とそのフロンティアアプリケーション」のフォーラム共有を聞いています

大規模モデルの「急増」の背後には、モデルトレーニングに関する「エネルギー」がありますコーパスの隠れた危機」。人工知能研究者グループであるエポックリサーチは、機械学習データセットの「高品質な言語データ」が2026年までに枯渇する可能性があると予測している。この段階では、大量の高品質コーパスデータが書籍、論文、研究報告書、企業文書およびその他の文書に存在しており、複雑なレイアウトの構造により、トレーニングコーパスが制限されています。大規模モデルの処理のためのアプリケーション機能と大規模モデルのドキュメントの質問と回答。文書解析テクノロジーの進歩により、機械は文書内の複数の要素を識別し、テキスト、表、画像などをより適切に処理できるようになります。複数の種類のデータ、文書の読み取り順序の復元、大規模モデルのトレーニングとアプリケーションを高速化します。フォーラムでは、和和情報インテリジェントイノベーション部門の研究開発ディレクター、チャン・ヤン氏が文書解析の分野における和和情報インテリジェント文書処理技術の成果を共有し、参加者に新たな技術的視点をもたらしました。

「文書解析の難しさは、文書内のさまざまな要素を正確に特定し、それらの間の論理関係を理解する方法です。'物理レイアウト分析'に注意を払う必要がありますChang Yang 氏によると、物理レイアウト分析は、視覚的な特徴とドキュメントのレイアウトに焦点を当てています。主なタスクは、関連性の高いテキストを段落などの領域に集約することです。ターゲット検出タスクはモデリングのために選択され、回帰に基づく単一段階検出モデルがフィッティングに使用され、文書内のさまざまなレイアウト方法が得られます。論理レイアウト分析は意味の分析に焦点を当てています。テキストブロックは、意味論に従ってモデル化されます。たとえば、意味論的な階層関係を通じて、ディレクトリツリー構造を形成します。文書解析技術では、文書要素の検出、テキストテーブル認識、文書レイアウト分析

、読み順復元などのタスクには、

レイアウト要素と全体のレイアウトの判断が含まれます。文書処理の分野での典型的な技術的問題。 Hehe Informationは、10年以上の技術蓄積により、電子ファイル解析、画像処理、テキスト認識、表認識、レイアウト解析、レイアウト復元を開拓してきました。植字レイアウトやその他の文書インテリジェント処理プロセスは、電子文書やスキャンに直面して、テキスト、テーブル、ワイヤレステーブル、クロスページテーブル、ヘッダー、フッター、を柔軟に識別できます。数式、画像、フローチャート、その他のレイアウト要素を正確に文書の読み取り順序を復元し、正確なトレーニングコーパスと文書質疑応答アプリケーションを大規模モデルフィールドに提供します。

CCIG2024では、Hehe Information文書分析技術が大規模モデルコーパスの「飢餓」問題を解決

キャプション: インテリジェントな文書処理テクノロジーを体験するために整列する大学の研究者と学生

「調査中に、現実世界の文書には非常に豊富なレイアウトタイプがあり、単一のレイアウトタイプを単純に使用することはできないことがわかりました。「2 列、3 列などのカテゴリを定義する必要がある。」Chang Yang 氏は、近年のオープンボキャブラリーオブジェクト検出 (OVD)、視覚的意味論的整合 (Alignment)、および生成モデルなどの最先端の開発により、新しいものがもたらされるだろうと述べています。 Hehe Information Technology チームは、研究のアイデアに基づいて、インテリジェントなドキュメント処理の分野の調査も継続し、新しいテクノロジーが業界でより迅速に価値を生み出すことができるようにします。

以上がCCIG2024では、Hehe Information文書分析技術が大規模モデルコーパスの「飢餓」問題を解決の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明

この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

AIのスキルギャップは、サプライチェーンのダウンを遅くしていますApr 26, 2025 am 11:13 AM

「AI-Ready労働力」という用語は頻繁に使用されますが、サプライチェーン業界ではどういう意味ですか？サプライチェーン管理協会（ASCM）のCEOであるAbe Eshkenaziによると、批評家ができる専門家を意味します

1つの会社がAIを永遠に変えるために静かに取り組んでいる方法Apr 26, 2025 am 11:12 AM

分散型AI革命は静かに勢いを増しています。今週の金曜日、テキサス州オースティンでは、ビテンサーのエンドゲームサミットは極めて重要な瞬間を示し、理論から実用的な応用に分散したAI（DEAI）を移行します。派手なコマーシャルとは異なり

Nvidiaは、AIエージェント開発を合理化するためにNEMOマイクロサービスをリリースしますApr 26, 2025 am 11:11 AM

エンタープライズAIはデータ統合の課題に直面していますエンタープライズAIの適用は、ビジネスデータを継続的に学習することで正確性と実用性を維持できるシステムを構築する大きな課題に直面しています。 NEMOマイクロサービスは、NVIDIAが「データフライホイール」と呼んでいるものを作成することにより、この問題を解決し、AIシステムがエンタープライズ情報とユーザーインタラクションへの継続的な露出を通じて関連性を維持できるようにします。この新しく発売されたツールキットには、5つの重要なマイクロサービスが含まれています。 NEMOカスタマイザーは、より高いトレーニングスループットを備えた大規模な言語モデルの微調整を処理します。 NEMO評価者は、カスタムベンチマークのAIモデルの簡素化された評価を提供します。 Nemo Guardrailsは、コンプライアンスと適切性を維持するためにセキュリティ管理を実装しています

aiは芸術とデザインの未来のために新しい絵を描きますApr 26, 2025 am 11:10 AM

AI：芸術とデザインの未来人工知能（AI）は、前例のない方法で芸術とデザインの分野を変えており、その影響はもはやアマチュアに限定されませんが、より深く影響を与えています。 AIによって生成されたアートワークとデザインスキームは、広告、ソーシャルメディアの画像生成、Webデザインなど、多くのトランザクションデザインアクティビティで従来の素材画像とデザイナーに迅速に置き換えられています。ただし、プロのアーティストやデザイナーもAIの実用的な価値を見つけています。 AIを補助ツールとして使用して、新しい美的可能性を探求し、さまざまなスタイルをブレンドし、新しい視覚効果を作成します。 AIは、アーティストやデザイナーが繰り返しタスクを自動化し、さまざまなデザイン要素を提案し、創造的な入力を提供するのを支援します。 AIはスタイル転送をサポートします。これは、画像のスタイルを適用することです

エージェントAIとのズームがどのように革命を起こしているか：会議からマイルストーンまでApr 26, 2025 am 11:09 AM

最初はビデオ会議プラットフォームで知られていたZoomは、エージェントAIの革新的な使用で職場革命をリードしています。 ZoomのCTOであるXD Huangとの最近の会話は、同社の野心的なビジョンを明らかにしました。エージェントAIの定義 huang d

大学に対する実存的な脅威Apr 26, 2025 am 11:08 AM

AIは教育に革命をもたらしますか？この質問は、教育者と利害関係者の間で深刻な反省を促しています。 AIの教育への統合は、機会と課題の両方をもたらします。 Tech Edvocate NotesのMatthew Lynch、Universitとして

プロトタイプ：アメリカの科学者は海外の仕事を探していますApr 26, 2025 am 11:07 AM

米国における科学的研究と技術の開発は、おそらく予算削減のために課題に直面する可能性があります。 Natureによると、海外の雇用を申請するアメリカの科学者の数は、2024年の同じ期間と比較して、2025年1月から3月まで32％増加しました。以前の世論調査では、調査した研究者の75％がヨーロッパとカナダでの仕事の検索を検討していることが示されました。 NIHとNSFの助成金は過去数か月で終了し、NIHの新しい助成金は今年約23億ドル減少し、3分の1近く減少しました。リークされた予算の提案は、トランプ政権が科学機関の予算を急激に削減していることを検討しており、最大50％の削減の可能性があることを示しています。基礎研究の分野での混乱は、米国の主要な利点の1つである海外の才能を引き付けることにも影響を与えています。 35