Rumah >Peranti teknologi >AI >OpenAI mencari rakan kongsi untuk menjana set data untuk melatih model AI
Tapak ini melaporkan pada 10 November bahawa OpenAI mengumumkan bahawa ia akan bekerjasama dengan organisasi untuk menjana set data awam/swasta untuk melatih model AI. dan " manfaat daripada model yang lebih berguna ".
Tapak ini belajar daripada blog yang OpenAI berkata: “Untuk akhirnya menjadikan AI lebih selamat dan memberi manfaat kepada semua manusia, kami berharap model AI dapat memahami dengan mendalam semua topik, industri, budaya dan bahasa, yang memerlukan rangkaian seluas mungkin Pengumpulan data latihan ."
Sebagai sebahagian daripada Program Perkongsian Data, OpenAI berkata ia akan mengumpulkan set data "berskala besar" yang "mencerminkan masyarakat manusia" dan pada masa ini tidak boleh diakses dengan mudah dalam talian. Walaupun syarikat merancang untuk bekerja merentasi pelbagai kaedah, termasuk imej, audio dan video, ia secara khusus mencari data yang "menyatakan niat manusia" (seperti penulisan atau perbualan dalam bentuk panjang) merentas bahasa, topik dan format yang berbeza.
OpenAI berkata ia akan berfungsi dengan organisasi, menggunakan gabungan pengecaman aksara optik dan alat pengecaman pertuturan automatik, untuk mendigitalkan data latihan dan mengalih keluar maklumat sensitif atau peribadi jika perlu.
OpenAI berharap dapat mencipta dua jenis set data: set data sumber terbuka awam yang boleh digunakan oleh sesiapa sahaja dalam melatih model AI, dan set set data peribadi yang boleh digunakan untuk melatih model AI proprietari.
OpenAI mengatakan set peribadi adalah untuk organisasi yang ingin memastikan data mereka peribadi tetapi mahu model OpenAI lebih memahami domain mereka setakat ini, OpenAI telah bekerjasama dengan kerajaan Iceland dan Miðeind ehf untuk meningkatkan GPT-4 untuk keupayaan pembesar suara Iceland, dan sedang bekerjasama dengan Projek Undang-undang Liberty untuk meningkatkan pemahaman modelnya tentang dokumen undang-undang.
Atas ialah kandungan terperinci OpenAI mencari rakan kongsi untuk menjana set data untuk melatih model AI. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!