Rumah  >  Artikel  >  Peranti teknologi  >  Goose Factory telah membina sebuah syarikat terjemahan AI: pakar dalam novel dalam talian, menyesuaikan gaya bahasa secara automatik, dan kedua-dua orang sebenar dan GPT-4 boleh membacanya dengan baik.

Goose Factory telah membina sebuah syarikat terjemahan AI: pakar dalam novel dalam talian, menyesuaikan gaya bahasa secara automatik, dan kedua-dua orang sebenar dan GPT-4 boleh membacanya dengan baik.

WBOY
WBOYasal
2024-06-02 12:09:21368semak imbas

Goose Factory telah menubuhkan "syarikat terjemahan" dengan lebih daripada 150 orang, daripada bos kepada pekerjasemuanya adalah ejen AI!

Perniagaan utama ialah terjemahan novel dalam talian Kualitinya sangat tinggi. Pembaca yang mengambil bahagian dalam penilaian percaya bahawa lebih baik daripada terjemahan orang sebenar.

Dan berbanding mengupah orang sebenar untuk menterjemah karya sastera, kos dikurangkan hampir 80 kali ganda.

Goose Factory telah membina sebuah syarikat terjemahan AI: pakar dalam novel dalam talian, menyesuaikan gaya bahasa secara automatik, dan kedua-dua orang sebenar dan GPT-4 boleh membacanya dengan baik.

Syarikat ATransAgents, setiap jawatan dilengkapi dengan 30 pekerja berbeza, yang boleh menyesuaikan gaya terjemahan yang berbeza mengikut bahasa, genre dan khalayak sasaran.

Berbanding dengan terjemahan tradisional, terjemahan yang dihasilkan lebih fleksibel dan pelbagai, lebih selaras dengan tabiat ungkapan bahasa sasaran, dan lebih sastera.

Jadi, walaupun TransAgents "gagal" dalam penilaian automatik berdasarkan persamaan, ia telah mendapat pengiktirafan kuat daripada pembaca dan profesional.

Persembahan sebegitu malah membuatkan orang ramai merungut bahawa mungkin zaman akan datang apabila manusia akan lebih berminat dengan kandungan yang dihasilkan oleh kecerdasan buatan.

Goose Factory telah membina sebuah syarikat terjemahan AI: pakar dalam novel dalam talian, menyesuaikan gaya bahasa secara automatik, dan kedua-dua orang sebenar dan GPT-4 boleh membacanya dengan baik.

Sesetengah orang masih mengatakan bahawa TransAgents adalah satu lagi bukti bahawa mereka salah faham kecerdasan buatan - mereka berpendapat bahawa disebabkan oleh keterbatasan model, terjemahan novel akan menjadi sangat sukar untuk AI, tetapi akibatnya, ejen AI selesai tugasan ini dengan baik sekali.

Goose Factory telah membina sebuah syarikat terjemahan AI: pakar dalam novel dalam talian, menyesuaikan gaya bahasa secara automatik, dan kedua-dua orang sebenar dan GPT-4 boleh membacanya dengan baik.

Jadi, adakah TransAgents sangat mengagumkan?

Kedua-dua orang sebenar dan GPT-4 berkata ya

Untuk menilai kualiti terjemahan TransAgents, pengarang memilih set data WMT2023, yang memerlukan terjemahan sastera peringkat bab.

Set data ini memintas 20 bab berturut-turut daripada 12 novel dalam talian, meliputi lapan kategori berikut:

  • Permainan (Permainan Video, VG)
  • Eastern Fantasy (EF)
  • Romantik Romantik Fiksyen Sains (SR)
  • (CR)
  • Fantasi (F)
  • Science Fiction (SF)
  • Horror & Thriller , HT)
  • Fantasy Romance (FR)
Pada mulanya, penulis menggunakan d-BLEU untuk penilaian automatik

kira persamaan dengan sampel rujukan Semakin tinggi persamaan, semakin tinggi skornya. Khusus untuk projek ini, terdapat dua set sampel rujukan Contoh satu ialah hasil terjemahan yang diberikan secara manual, dan sampel dua diperoleh dengan menjajarkan teks dwibahasa di Internet.

Akibatnya, skor TransAgents tidak ideal, hanya 25 mata, kurang daripada separuh SOTA.

Goose Factory telah membina sebuah syarikat terjemahan AI: pakar dalam novel dalam talian, menyesuaikan gaya bahasa secara automatik, dan kedua-dua orang sebenar dan GPT-4 boleh membacanya dengan baik.Tetapi ini tidak bermakna kualiti terjemahan TransAgents tidak baik, tetapi kerana menggunakan persamaan untuk mengukur prestasi terjemahan karya sastera sememangnya berat sebelah.

Terjemahan sastera bukan perbandingan perkataan demi perkataan, tetapi memerlukan transformasi kreatif dalam semantik, nada, gaya, dsb. Transformasi ini mungkin membawa kepada perbezaan cetek yang besar antara terjemahan

dan terjemahan rujukan jika ada persamaan tidak tinggi, ia secara semula jadi Tidak mengejutkan. Jadi, penulis hanya meminta orang sebenar (sekurang-kurangnya 10 orang) untuk menilai kualiti terjemahan, dia juga meminta GPT-4

(0125-Preview)

untuk melihat -4(1106-Pratonton) Siapakah yang mempunyai terjemahan terbaik dalam kalangan orang sebenar? Penilai akan melihat terjemahan berbeza bagi teks asal yang sama hanya melihat terjemahan, manakala GPT-4 melihat kedua-dua teks asal dan terjemahan.

Akibatnya, lebih separuh daripada pengulas orang sebenar percaya bahawa TransAgents menterjemah lebih baik daripada manusia, 8.4% percaya bahawa kualiti kedua-duanya adalah setara, dan GPT-4 juga percaya bahawa TransAgents mempunyai kualiti yang lebih tinggi daripada sendiri. (dan manusia) terjemahan.

Selain ulasan awam ini, dua penterjemah profesional juga percaya bahawa walaupun terjemahan manual lebih sesuai dengan teks asal, terjemahan yang diberikan oleh TransAgents jelas lebih sastera, lebih ringkas dan tercermin dalam perkataan dan ayat Dengan bakat bahasa dan ekspresi sastera yang mendalam.

Goose Factory telah membina sebuah syarikat terjemahan AI: pakar dalam novel dalam talian, menyesuaikan gaya bahasa secara automatik, dan kedua-dua orang sebenar dan GPT-4 boleh membacanya dengan baik.

Penunjuk ujian MATTR dan MTLD juga membuktikan ini, terutamanya pada MTLD, kepelbagaian bahasa TransAgents adalah kira-kira satu pertiga lebih tinggi daripada orang sebenar dan GPT-4.

Goose Factory telah membina sebuah syarikat terjemahan AI: pakar dalam novel dalam talian, menyesuaikan gaya bahasa secara automatik, dan kedua-dua orang sebenar dan GPT-4 boleh membacanya dengan baik.

Dalam kes yang ditunjukkan oleh pengarang, TransAgents akan menyesuaikan kandungan terjemahan mengikut kebiasaan bahasa sasaran Walaupun terjemahan orang sebenar (Ref1) dan GPT-4 adalah betul, mereka tidak selaras dengannya bahasa sebagai TransAgents.

Goose Factory telah membina sebuah syarikat terjemahan AI: pakar dalam novel dalam talian, menyesuaikan gaya bahasa secara automatik, dan kedua-dua orang sebenar dan GPT-4 boleh membacanya dengan baik.

Selain itu, TransAgents juga mengatasi hanya menggunakan GPT-4 dari segi konsisten, mengekalkan terjemahan yang sama untuk teks asal yang sama.

Goose Factory telah membina sebuah syarikat terjemahan AI: pakar dalam novel dalam talian, menyesuaikan gaya bahasa secara automatik, dan kedua-dua orang sebenar dan GPT-4 boleh membacanya dengan baik.

Sudah tentu, ini tidak bermakna ia bagus pada semua genre Di antara 8 genre yang disebutkan di atas, TransAgents mempunyai prestasi yang luar biasa dalam genre seperti permainan dan percintaan fiksyen sains, manakala ia agak biasa-biasa saja dalam genre seperti. seram dan thriller. . ketinggalan.

Goose Factory telah membina sebuah syarikat terjemahan AI: pakar dalam novel dalam talian, menyesuaikan gaya bahasa secara automatik, dan kedua-dua orang sebenar dan GPT-4 boleh membacanya dengan baik.

Namun, berdasarkan penilaian yang diberikan oleh pembaca yang belum membaca teks asal dalam ujian, peninggalan tersebut nampaknya tidak menjejaskan pengalaman membaca mereka.

Jadi, bagaimanakah "syarikat terjemahan" ini berfungsi? . , setiap seorang pakar dalam bidang yang berbeza, dan terdapat juga Ejen Hantu.

Ejen ini didorong oleh GPT-4-Turbo Setiap peranan termasuk tetapan berbilang dimensi seperti nama, umur, jawatan, tahun pengalaman dan bahasa yang dikuasai. Goose Factory telah membina sebuah syarikat terjemahan AI: pakar dalam novel dalam talian, menyesuaikan gaya bahasa secara automatik, dan kedua-dua orang sebenar dan GPT-4 boleh membacanya dengan baik.

Selepas menerima permintaan terjemahan daripada "klien", CEO akan menganalisis secara menyeluruh teks asal dan bahasa sasaran, genre, khalayak sasaran dan maklumat lain, dan memilih yang paling sesuai dengan bidang kepakaran di kalangan beberapa editor kanan.

Pada masa ini, Ejen Hantu akan menilai pilihan CEO dan memaklumkan sama ada calon itu sesuai, sekali gus mengurangkan fenomena pemilihan yang tidak betul.

Editor kanan yang dipilih akan bekerjasama dengan Ketua Pegawai Eksekutif, sekali lagi menggabungkan keperluan tugas dan ciri peribadi, untuk terus memilih ahli pasukan seperti editor junior, penterjemah, pakar penyetempatan dan pembaca pruf daripada kumpulan bakat syarikat.

Selepas pasukan dibentuk, editor junior akan mengenal pasti semua istilah penting yang berpotensi bab demi bab, menjana glosari awal, menyemaknya dengan editor kanan, memadam istilah biasa, menjana glosari yang disemak dan mengulangi berulang kali sehingga Tiada pengubahsuaian lanjut diperlukan.

Goose Factory telah membina sebuah syarikat terjemahan AI: pakar dalam novel dalam talian, menyesuaikan gaya bahasa secara automatik, dan kedua-dua orang sebenar dan GPT-4 boleh membacanya dengan baik.Kemudian, editor kanan akan menterjemah istilah utama dalam glosari ke dalam bahasa sasaran berdasarkan makna istilah dalam konteks yang berbeza.

Selepas memiliki glosari, editor junior akan menjana ringkasan bab terperinci untuk setiap bab, mengekalkan maklumat penting dan butiran sebanyak mungkin, dan kemudian biarkan editor kanan menyemaknya dan mengalih keluar maklumat yang berlebihan atau tidak perlu, meninggalkan ringkasan bab Lagi secara ringkas.

Kemudian, editor kanan menulis ringkasan keseluruhan buku berdasarkan ringkasan bab yang disemak, meringkaskan plot utama, watak dan tema, dan memilih secara rawak satu bab daripada buku itu, menganalisis nada, gaya dan khalayak sasarannya, dan membangunkan panduan gaya terjemahan.

Panduan gaya terjemahan akan dihantar kepada semua ahli pasukan projek untuk memastikan konsistensi dalam gaya terjemahan.

Menurut panduan gaya, penterjemah sebenar syarikat akan melaksanakan terjemahan awal bab demi bab, dan menyerahkan draf pertama kepada editor junior untuk semakan bagi menyemak sama ada panduan gaya terjemahan dipatuhi dan memberikan cadangan untuk penambahbaikan.

Atas dasar ini, editor kanan akan menilai kualiti terjemahan yang disemak dan memutuskan sama ada pengubahsuaian lanjut diperlukan Penterjemah, editor junior dan editor kanan akan berulang sehingga kualiti terjemahan memenuhi keperluan.

Tetapi teks terjemahan yang diperolehi pada masa ini bukanlah draf akhir dan perlu diserahkan kepada pakar lokalisasi untuk pelarasan. Pakar akan mengenal pasti kandungan yang mungkin memerlukan penyesuaian budaya, seperti simpulan bahasa, metafora, dsb., dan menyesuaikan kandungan ini untuk menjadikannya lebih relevan dengan bahasa dan budaya sasaran sambil mengekalkan maksud teks asal.

Teks yang dilaraskan akan disemak semula oleh editor junior dan editor kanan untuk memastikan terjemahan mencapai keseimbangan antara kebolehsuaian budaya dan kesetiaan.

Selepas ini, pembaca pruf akan menyemak semula kesalahan tatabahasa, ejaan, tanda baca dan pemformatan Jika terdapat sebarang pengubahsuaian, ia akan disemak semula oleh editor.

Setelah proses ini selesai, editor kanan akan menjalankan semakan akhir, memfokuskan pada keselarasan antara bab bersebelahan untuk memastikan plot, watak, tema dan elemen lain adalah konsisten di seluruh buku jika terdapat masalah dihantar semula kepada Ahli pasukan terdahulu membuat semakan sehingga terjemahan akhir dihasilkan.

Jika pelanggan mempunyai sebarang cadangan untuk pengubahsuaian terjemahan, editor kanan akan sekali lagi mengetuai dan mengatur kakitangan yang berkaitan untuk membuat pengubahsuaian sehingga versi akhir dimuktamadkan.

Bukan sahaja proses kerja sangat ketat dan standard, selepas pelanggan berpuas hati dengan terjemahan, editor kanan juga akan menganjurkan "pertemuan" untuk pasukan projek merumuskan projek dan berkongsi pengalaman serta pengajaran yang dipelajari.

Istilah berharga, kemahiran terjemahan, strategi penyesuaian budaya dan pengetahuan lain yang terkumpul semasa proses akan diringkaskan dan dimuat naik ke pangkalan pengetahuan syarikat untuk rujukan dalam projek seterusnya.

One More Thing

TransAgents bukan "syarikat" pertama yang terdiri daripada ejen Tahun lepas, ChatDev, sebuah "syarikat permainan" dari Universiti Tsinghua, menjadi popular di Internet.

Jika anda meluaskan pandangan anda, anda bukan sahaja akan melihat "syarikat", tetapi juga bandar AI Stanford dan permainan serigala jadian AI Tsinghua, yang kesemuanya menggunakan pelbagai ejen untuk mensimulasikan masyarakat manusia sebenar.

Ringkasnya, dengan mendalami penyelidikan model besar, eksperimen kecerdasan ejen dan kumpulan telah menjadi salah satu hala tuju paling popular dalam penyelidikan AI, dan berdasarkan TransAgents ini, kerjasama pelbagai ejen telah mula menunjukkan manfaat praktikal.

(Dengan cara ini, beberapa netizen mendapati bahawa dari Stanford Town ke ChatDev hingga TransAgents kali ini, pengarang penyelidikan pelbagai ejen sangat menyukai gaya lukisan gaya "Stardew Valley".)

Goose Factory telah membina sebuah syarikat terjemahan AI: pakar dalam novel dalam talian, menyesuaikan gaya bahasa secara automatik, dan kedua-dua orang sebenar dan GPT-4 boleh membacanya dengan baik.

Sudah tentu , sesetengah orang telah menyatakan kebimbangan mengenai perkara ini, percaya bahawa terjemahan yang diterajui AI akan membawa kepada penyeragaman bahasa dan kehilangan ungkapan unik dalam pelbagai bahasa.

Goose Factory telah membina sebuah syarikat terjemahan AI: pakar dalam novel dalam talian, menyesuaikan gaya bahasa secara automatik, dan kedua-dua orang sebenar dan GPT-4 boleh membacanya dengan baik.

Apatah lagi, saya telah melompat keluar dari TransAgents sendiri dan memikirkan ketakutan Ilya terhadap kerjasama Ejen berskala besar...

Goose Factory telah membina sebuah syarikat terjemahan AI: pakar dalam novel dalam talian, menyesuaikan gaya bahasa secara automatik, dan kedua-dua orang sebenar dan GPT-4 boleh membacanya dengan baik.

Jadi apakah hasil novel yang anda fikir boleh dicipta di jalan kecerdasan kawanan ? Jangan ragu untuk berkongsi pendapat anda di ruang komen.

Alamat kertas: https://arxiv.org/abs/2405.11804

Atas ialah kandungan terperinci Goose Factory telah membina sebuah syarikat terjemahan AI: pakar dalam novel dalam talian, menyesuaikan gaya bahasa secara automatik, dan kedua-dua orang sebenar dan GPT-4 boleh membacanya dengan baik.. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn