Heim > Artikel > Technologie-Peripheriegeräte > Das US-Handelsministerium bittet öffentlich um Kommentare und Vorschläge zur GenAI-Datenaufbereitung
Daten sind der Kern der künstlichen Intelligenz. Ohne gute Daten ist die Wahrscheinlichkeit, nützliche KI-Modelle zu entwickeln, gering. Vor diesem Hintergrund hat das US-Handelsministerium letzte Woche eine öffentliche Aufforderung zur Eingabe von Beiträgen dazu herausgegeben, wie zahlreiche öffentliche Datensätze für die Erstellung von Produktionsmodellen der künstlichen Intelligenz (GenAI) besser vorbereitet werden können. Diese öffentliche Anfrage befasst sich mit einem kritischen Problem, mit dem der Bereich der künstlichen Intelligenz derzeit konfrontiert ist: dem Mangel an hochwertigen, vielfältigen öffentlichen Datensätzen. Diese Datensätze sind von entscheidender Bedeutung für das Training von Modellen für maschinelles Lernen, die Förderung von Innovationen und die Förderung der Entwicklung von KI-Anwendungen. Durch diese öffentliche Anfrage hofft das Ministerium, Beiträge aller Parteien zu sammeln, um besser zu verstehen, wie öffentliche Datensätze erstellt und verwaltet werden. Sie wollen hören
Das US-Handelsministerium hat am 17. April eine Informationsanfrage (RFI) herausgegeben, in der es „Branchenexperten, Forscher, Organisationen der Zivilgesellschaft und andere Mitglieder der Öffentlichkeit“ auffordert, Beiträge zur Entwicklung zu leisten. Dabei hilft die künstliche Intelligenz „Smart Open Datasets“.
Das Handelsministerium bezeichnet sich selbst als „U.S. Data Agency“ und ist für die Erhebung, Speicherung und Analyse einer Vielzahl von Daten über die Vereinigten Staaten verantwortlich, darunter Daten zur Wirtschaft, Bevölkerung und Umwelt. Eine schnelle Suche in kommerziellen Rechenzentren deckt mehr als 122.000 öffentlich zugängliche Datensätze zu Themen auf, die von Klima und Wetter über Patente bis hin zu Volkszählungsinformationen reichen.
Dieser Abschnitt soll dabei helfen, die Datenverwaltungs- und Datenaustauschaktivitäten auf dem neuesten Stand der Technik zu halten, wenn sich die Technik im Laufe der Jahre verändert und verbessert. Der elektronische Zugriff auf Daten über maschinenlesbare Formate oder über Webdienste und APIs sind Beispiele für die Anpassung seiner Datendienste an die Zeit.
Jetzt, mit der Ankunft der GenAI-Revolution, sucht die Branche nach dem am besten geeigneten Speicherort für Daten, um daraus Modelle für künstliche Intelligenz zu erstellen.
Oliver Wise, Chief Data Officer des US-Handelsministeriums, schrieb in der Informationsanfrage: „Heute, mit dem Aufkommen der Technologie der künstlichen Intelligenz, steht das Handelsministerium vor einem neuen technologischen Wandel, der den Benutzern bessere Informationen bietet.“ und Datenzugriff. „Unternehmen sind besonders an Anwendungen der generativen künstlichen Intelligenz (GenAI) interessiert, die Text, Bilder, Audio, Video und andere Arten von Informationen aus verschiedenen Quellen verarbeiten können, um neue GenAI- und andere künstliche Inhalte zu erstellen.“ Herausforderungen für Datenanbieter wie Unternehmen und Datennutzer, einschließlich staatlicher Stellen, der Industrie, der Wissenschaft und des amerikanischen Volkes „Aktuelle KI-Systeme werden auf große Mengen digitaler Inhalte trainiert und generieren Antworten basierend auf dem Kontext der Inhalte.“ „Diese Systeme verstehen den Text jedoch nicht wirklich auf sinnvolle Weise.“ in der Lage, auf Daten zuzugreifen, die nicht nur maschinenlesbar, sondern auch „maschinenverständlich“ sind. Heutige KI-Systeme sind durch ihre Abhängigkeit von riesigen unstrukturierten Datenspeichern eingeschränkt, die auf den zugrunde liegenden Daten basieren und nicht auf der Fähigkeit, auf der Grundlage von Verständnis zu argumentieren und zu urteilen.
Das Handelsministerium bittet um Hilfe beim Datenaustausch unter Berücksichtigung dieser grundlegenden Einschränkungen der GenAI-Technologie. Sie sucht nach neuen Standards für die Datenverbreitung, einschließlich Lizenzstandards, für lesbare und verständliche Daten. Im Hinblick auf die Zugänglichkeit und den Abruf von Daten möchte das Ministerium Vorschläge machen, wie seine Daten besser zugänglich gemacht werden können, beispielsweise durch APIs oder „Webcrawler“.
Es besteht ein besonderer Bedarf an der Verwendung von Wissensgraphen, die Metadaten nutzen, um menschliche Begriffe besser mit Daten zu verbinden. Es hofft auch, Hinweise zur Einführung von Standardontologien wie Schema.org oder NIEM zu erhalten und zu erfahren, wie Wissensgraphen dabei helfen können, Ontologien und Vokabulare zu „harmonisieren und zu verknüpfen“.
Die Abteilung bittet die Community um Anregungen dazu, wie diese Datenstandardisierungsbemühungen vorangetrieben werden können und gleichzeitig die höchsten Standards der Datenintegrität, -qualität, -sicherheit und -ethik aufrechterhalten werden können.
Wise bittet interessierte Parteien, ihre Vorschläge per E-Mail mit der Betreffzeile „AI-Ready Open Data Asset Information Request Form“ zu senden. Wir hoffen, vor dem 16. Juli Kommentare oder Rückmeldungen zu diesen Themen zu erhalten.
Das obige ist der detaillierte Inhalt vonDas US-Handelsministerium bittet öffentlich um Kommentare und Vorschläge zur GenAI-Datenaufbereitung. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!