ホームページ  >  記事  >  テクノロジー周辺機器  >  米国商務省は、GenAI データ準備に関するコメントや提案を公募しています。

米国商務省は、GenAI データ準備に関するコメントや提案を公募しています。

PHPz
PHPz転載
2024-04-28 11:52:10898ブラウズ

データは人工知能の中核です。優れたデータがなければ、有用な AI モデルを開発できる可能性はほとんどありません。これを念頭に置いて、米国商務省は先週、量産用人工知能 (GenAI) モデルを構築するための多数の公開データセットをより適切に準備する方法について意見を求める公開要請を発行しました。 この公開リクエストは、現在人工知能の分野が直面している重大な問題、つまり高品質で多様な公開データセットの不足に対処しています。これらのデータセットは、機械学習モデルのトレーニング、イノベーションの促進、AI アプリケーションの開発の促進に不可欠です。 同省は、この公開要請を通じて、公開データセットの構築および管理方法をより深く理解するために、すべての関係者からの意見を収集したいと考えています。彼らは聞きたいのです

米国商務省は、GenAI データ準備に関するコメントや提案を公募しています。

米国商務省は4月17日、「業界の専門家、研究者、市民社会団体、その他の一般の人々」に情報提供を求める情報要請書(RFI)を発行し、「人工知能「スマート オープン データセット」が役立つようになりました。

商務省は自らを「米国データ庁」と呼び、経済、人口、環境に関するデータなど、米国に関するさまざまなデータの収集、保存、分析を担当しています。商用データセンターを簡単に検索すると、気候や気象から特許、国勢調査情報に至るまで、さまざまなテーマに関する公的にアクセス可能なデータセットが 122,000 件以上あることがわかります。

このセクションは、長年にわたるテクノロジーの変化と改善に合わせて、データ管理とデータ共有活動を現在のテクノロジー標準に維持できるようにすることを目的としています。機械可読形式や Web サービスや API を介してデータに電子的にアクセスすることは、データ サービスを時代に適応させる例です。

現在、GenAI 革命の到来により、この分野は人工知能モデルの構築に使用するためにデータの最適な場所を探しています。

米国商務省の最高データ責任者であるオリバー・ワイズ氏は、情報提供要請の中で次のように書いています。 「企業は、さまざまなソースからテキスト、画像、オーディオ、ビデオ、その他の種類の情報を消化して、新しい GenAI やその他の人工コンテンツを生成できる生成人工知能 (GenAI) アプリケーションに特に関心を持っています。スマート テクノロジーは、機会とデータ アクセスをもたらします。」 「スマート」とは、ビジネスセクターが直面している最大の課題を特定しています

。 「最近の AI システムは、大量のデジタル コンテンツでトレーニングされ、コンテンツのコンテキストに基づいて応答を生成します。しかし、これらのシステムは意味のある方法でテキストを真に「理解」することはできません。機械が読み取り可能なだけでなく、「機械が理解できる」データにアクセスできるようになります。今日の AI システムは、理解に基づいて推論して判断する能力ではなく、基盤となるデータに依存する大規模な非構造化データ ストアに依存しているため、限界があります。

商務省は、GenAI テクノロジーのこれらの基本的な制限を考慮したデータ共有における支援を求めています。同社は、読みやすく理解可能なデータのための、ライセンス基準を含む新しいデータ配布基準を模索しています。データへのアクセスと取得に関して、同省は、API や「ウェブ クローラー」などを介してデータにアクセスしやすくする方法に関する提案を求めています。

人間の用語とデータをより適切に結び付けるために、メタデータを活用するナレッジ グラフの使用方法に特にニーズがあります。また、Schema.org や NIEM などの標準オントロジーの採用や、ナレッジ グラフがオントロジーと語彙の「調和とリンク」にどのように役立つかについての方向性を得たいと考えています。

同省は、データの完全性、品質、セキュリティ、倫理の最高水準を維持しながら、これらのデータ標準化の取り組みを進める方法についてコミュニティからの意見を求めています。

Wise は、関心のある方に対し、「AI 対応オープンデータ資産情報リクエスト フォーム」という件名の電子メールで提案を送信するようお願いしています。これらのトピックに関するコメントやフィードバックを 7 月 16 日までにお待ちしております。

以上が米国商務省は、GenAI データ準備に関するコメントや提案を公募しています。の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事は51cto.comで複製されています。侵害がある場合は、admin@php.cn までご連絡ください。