Rumah > Artikel > Peranti teknologi > Sejauh manakah ChatGPT boleh melaksanakan perkhidmatan perubatan? Prestasi profesor Harvard dalam ujian peribadi hampir dengan doktor, Yun Zhisheng terdedah untuk mencipta versi industri
Artikel ini dicetak semula dengan kebenaran AI New Media Qubit (ID akaun awam: QbitAI Sila hubungi sumber untuk mencetak semula).
Pemain domestik memasuki ChatGPT dengan rancak, dan kejayaan mereka dalam pelbagai industri jelas kepada semua.
Tetapi masih belum jelas bila orang boleh mula bekerja, terutamanya dalam beberapa industri yang sukar dan halangan tinggi, seperti penjagaan perubatan.
Kini, seorang profesor Sekolah Perubatan Harvard telah menguji sendiri prestasi ChatGPT.
Keputusan menunjukkan bahawa ia mendiagnosis dengan betul 39 daripada 45 kes, dengan kadar ketepatan 87% (melebihi kadar diagnosis 51% mesin sedia ada) dan menyediakan 30 kes Triaj yang betul cadangan telah dibuat.
Beliau berkata bahawa prestasi diagnosis bantuan ChatGPT adalah hampir dengan prestasi doktor. Dalam kes ini, bila saya boleh mula bekerja?
Malah, ini juga masalah yang dihadapi oleh kebanyakan pemain domestik: Bonus dah ada, macam mana nak ambil dulu?
Kami juga telah menyelesaikan masalah teknikal dan ekologi secara sistematik di sebalik mereplikasi ChatGPT versi Cina sebelum ini, dan ia jelas sekali bukan sesuatu yang boleh dicapai dalam jangka pendek.
Kini idea baharu telah muncul: Buat terus versi menegak industri ChatGPT.
Adakah pendekatan ini boleh dilaksanakan?
Penciptaan ChatGPT, teknologi teras tidak boleh memintas tiga elemen kuasa pengkomputeran, data dan algoritma.
Dari segi kuasa pengkomputeran, OpenAI bergantung pada Microsoft - ia mempunyai 285,000 teras CPU dan 10,000 GPU NVIDIA V100 Hanya melatih GPT-3 dengan kos sebanyak 4.6 juta dolar A.S. ; Data Dari segi data, siri GPT telah dioptimumkan secara berulang, yang pernah memukau semua orang, mempunyai 175 bilion parameter, manakala versi sebelumnya GPT-2 hanya mempunyai 1.5 bilion parameter; >AlgoritmaSudah tentu, ia mempunyai pengumpulan mendalam selama bertahun-tahun, jika tidak, ia tidak akan dapat mempunyai ciri pembelajaran autonomi "seperti manusia", dan seterusnya menunjukkan keupayaan untuk menyesuaikan diri dengan cepat kepada pelbagai bidang dan pelbagai senario.
Digabungkan dengan teknologi maklum balas ekologi, gelung tertutup berulang terbentuk. OpenAI telah membina"ekosistem GPT" nya sendiri dalam bentuk antara muka terbuka sejak GPT-3. Menurut statistik dari laman web gpt3demo, pada masa ini terdapat 656 aplikasi yang dibangunkan menggunakan model siri GPT-3.
Halanganteknikal dan ekologi sedemikian menentukan bahawa tidak semudah itu untuk memalsukan ChatGPT. Dalam kes ini, penyelesaian untuk versi menegak ChatGPT juga telah mula dibincangkan dalam industri.
Pertama sekali, daripadaperspektif teknikal, cabaran teras mereka adalah untuk mencapai atau melebihi kesan ChatGPT dalam tugasan dalam medan menegak dengan parameter yang lebih sedikit, seperti berpuluh bilion parameter.
Ini mungkin lebih sukar daripada menghasilkan semula ChatGPT, kerana bilangan parameter adalah jauh lebih kecil, dan anda tidak boleh hanya bergantung pada "estetika ganas", tetapi juga memerlukan reka bentuk model yang hebat dan kemahiran mampatan. Cabaran lain ialahperbezaan sumber data.
Seperti Google dan Microsoft, mereka sebenarnya mempunyai sumber data umum semula jadi, tetapi pengumpulan data khusus tidak boleh dibandingkan dengan pemain menegak. Terutama dalam industri mata pencarian seperti penjagaan perubatan, yang sangat profesional dan meliputi pelbagai bidang Data berkualiti tinggi yang diperlukan mungkin tidak lebih kecil daripada ChatGPT, dan kebanyakan data tidak boleh ditangkap dalam talian. Tetapi bagi pemain menegak yang telah berakar umbi dalam hal ini selama bertahun-tahun, mereka telah membina ekologi perindustrian mereka sendiri dan mempunyai data industri yang kaya dan pengetahuan. Pengumpulan telah meletakkan asas yang diperlukan untuk pembiakan ChatGPT. Dan dari perspektifpermintaan nilai, nilai yang diwakili oleh industri menegak adalah nyata. Sebagai contoh, permintaan untuk penjagaan perubatan itu sendiri tidak kecil Setelah ChatGPT dilaksanakan dalam penjagaan perubatan, ia akan mewakili nilai sosial yang hebat.
Dulu, pengguna lazimnya menggunakan carian dan APP untuk membantu mendiagnosis penyakit mereka, tetapi selalunya hasilnya adalah minimum. Profesor Sekolah Perubatan Harvard Ateev Mehrotra pernah menguji bahawa kadar ketepatan purata diagnostik dalam talian sedia ada hanya 51%, manakala ChatGPT mempunyai 87%, jadi dia percaya bahawa ChatGPT berpotensi menjadi pengubah permainan dalam diagnosis perubatan . Untuk mempercepatkan pelaksanaan aplikasi ChatGPT, adalah wajar untuk mencipta versi menegak ChatGPT dari perspektif kesukaran teknikal dan permintaan nilai. Kini terdapat pemain AI di China yang sudah melakukan perkara ini. Versi Industri ChatGPT YunzhishengPendedahan kemajuan terkini, runut suara pintar unicorn Yunzhisheng mempromosikan pembinaan Versi Industri ChatGPT——Menggunakan rawatan perubatan sebagai titik permulaan, bina versi industri perubatan ChatGPT Pada masa yang sama, bina platform berdasarkan versi industri ChatGPT, kembangkan dengan cepat ke bidang lain, dan kemudian gunakan model domain untuk menyepadukan teknologi MoE (Campuran Pakar) untuk melatih. model ChatGPT umum.
Dan idea ini daripada khas kepada umum. Malah, ia adalah pendekatan “U+X” Yun Zhisheng yang konsisten. Di sini, “U” merujuk kepada pembangunan algoritma model besar universal dan platform asas latihan yang cekap “X” merujuk kepada versi model besar khusus yang digunakan dalam pelbagai bidang industri.
Malah, ini juga menjadi idea bagi banyak syarikat untuk memasuki ChatGPT Dengan cara ini, mereka boleh memanfaatkan data khusus sedia ada.
Walau bagaimanapun, ia tidak semudah itu, apatah lagi Yunzhisheng memilih industri perubatan, yang mempunyai keperluan yang lebih tinggi untuk kualiti kandungan yang dijana, sebagai titik masuknya.
Masalah paling penting ialah meningkatkan kebolehpercayaan pengetahuan perubatan. Apa yang paling bagus oleh ChatGPT ialah bercakap karut dengan serius. Sebenarnya, bukanlah satu masalah besar untuk meletakkan carian sembang dan pengeluaran kandungan pada Bing sekarang, dan pengguna menikmatinya.
Namun, apabila digunakan dalam industri, selalunya sukar bagi bukan profesional untuk mengesannya, yang boleh membawa kepada pelbagai risiko. Oleh itu, versi industri ChatGPT mesti menamatkan semua perkara karut, terutamanya dalam industri seperti perubatan, pendidikan dan industri, yang mempunyai keperluan penjanaan kandungan yang sangat tinggi dan kadar toleransi kesalahan yang rendah, dan juga mempunyai keperluan kualiti data yang lebih tinggi.
Kedua, ia adalah untuk mencapai "keberkesanan kos" dalam industri. Untuk mana-mana teknologi dilaksanakan secara besar-besaran, ia mesti menyelesaikan masalah "bagaimana untuk memaksimumkan kesan dengan sumber yang terhad."
Ini juga satu-satunya cara untuk ChatGPT dilaksanakan dalam industri - Model boleh mencapai kesan yang sama seperti ChatGPT dengan skala parameter yang lebih kecil. Ini juga membawa banyak masalah kepada syarikat-syarikat ini.
Malah, Yunzhisheng juga mengakui bahawa parameter versi industri ChatGPT juga mungkin perlu mencapai skala berpuluh-puluh bilion, dan bukan kecil untuk mencapai hasil yang berkesan dan mencapai aplikasi berskala besar.
Pada tahap tertentu, mencipta versi industri ChatGPT adalah lebih sukar daripada ChatGPT universal semasa, tetapi apabila industri ChatGPT benar-benar dilaksanakan, masalah ini mesti diselesaikan. Secara ringkasnya, ia adalah untuk merealisasikan keupayaan kejuruteraan ChatGPT.
Ini adalah laluan yang tidak boleh dielakkan oleh setiap orang yang memasuki permainan tetapi mesti melaluinya.
Berdasarkan perkara ini, tidak syak lagi bahawa pilihan Yun Zhisheng adalah lebih sukar - rawatan perubatan sebagai pintu masuk. Ini sentiasa dianggap sebagai kawasan yang mempunyai halangan industri yang tinggi, profesionalisme yang kuat, dan kesukaran teknikal Ini juga merupakan sebab mengapa terdapat sangat sedikit pemain AI perubatan berbanding dengan kemakmuran industri lain.
Tetapi sebaik sahaja versi perubatan ChatGPT dibuka, pelaksanaan bidang lain, termasuk model besar am akhir, akan dilakukan dengan dua kali ganda hasil dengan separuh usaha.
Sebagai sebuah syarikat AI yang diasaskan pada 2012, mereka telah memberi perhatian yang teliti kepada teknologi AI yang canggih dan secara aktif mempromosikan aplikasi industri teknologi, termasuk peningkatan algoritma pembelajaran mendalam dan aplikasi industri pada tahun 2012, dan superkomputer Atlas dalam 2016. Platform, graf pengetahuan dan aplikasi teknologi AI tindanan penuh telah dinaik taraf kepada teknologi kognitif AGI berdasarkan rangka kerja ChatGPT.
Pada masa yang sama, beliau telah terlibat secara mendalam dalam industri perubatan selama hampir 10 tahun dan telah mengumpul pengetahuan industri, data dan aplikasi Beliau juga memenangi hadiah pertama Anugerah Kemajuan Sains dan Teknologi Beijing pada 2019 .
Sebagai tindak balas sama ada ia yakin dalam membina versi industri ChatGPT, Yunzhisheng berkata: Yakin sepenuhnya.
Seperti yang diringkaskan sebelum ini, membina ChatGPT tidak dapat dipisahkan daripada data berkualiti tinggi, algoritma terkemuka dan kuasa pengkomputeran yang mencukupi. Versi menegak ChatGPT juga memerlukan keupayaan kejuruteraan yang lebih mendalam.
Dari aspek ini, Yunzhisheng sememangnya menjadi rujukan industri.
Dari segi data, dalam tempoh 10 tahun yang lalu, Yunzhisheng telah mengumpul rangkaian penuh data industri, termasuk panduan berorientasikan pesakit, pra-perundingan, pendidikan pesakit dan sistem susulan , serta rekod perubatan Suara berorientasikan klinikal, kawalan kualiti rekod perubatan, kawalan kualiti penyakit tunggal dan sistem pengurusan risiko perubatan telah dilaksanakan di hampir 400 hospital. Dikatakan bahawa skala data telah mencapai 5T, menyediakan asas data untuk model bahasa besar dalam industri perubatan.
Dari segi algoritma, kecerdasan kognitif yang diwakili oleh ChatGPT sendiri merupakan kelebihan teknologi teras Yunzhisheng. Mereka telah membina salah satu graf pengetahuan perubatan terbesar di negara ini. Dari 2019 hingga 2022, teknologi kecerdasan kognitif Yunzhisheng memenangi 7 kejohanan dan 5 anugerah naib juara dalam penilaian domestik dan asing yang berkaitan. Model bahasa pra-latihan perubatan yang dibangunkan sendiri CirBERTa pernah mengungguli senarai cabaran pemprosesan maklumat perubatan China.
Dari segi kuasa pengkomputeran, kuasa pengkomputeran titik terapung bagi platform pengkomputeran super Yunzhisheng boleh mencapai 8 petaflops/saat, yang boleh memberikan jaminan kuasa pengkomputeran untuk model dengan ratusan bilion parameter .
Dari segi kejuruteraan model besar, Yunzhisheng telah membangunkan model CirBERTa, menghasilkan semula model GPT-2, dan menggunakan pemampatan model dan mekanisme penyulingan pengetahuan untuk mencapai pecutan hampir seratus kali ganda dalam talian dalam kecekapan penaakulan meletakkan asas untuk aplikasi meluas model besar.
Selain itu, sebagai versi industri ChatGPT, jaminan kualiti kandungan juga merupakan bahagian penting.
Penyelesaian yang disediakan oleh Yunzhisheng ialah menggunakan pembelajaran berterusan dan teknologi pembenaman pengetahuan yang diterapkan dalam CirBERTa untuk mengoptimumkan pemerolehan pengetahuan dan mekanisme kemas kini model ChatGPT berdasarkan pengumpulan graf pengetahuan sedia ada.
Menurut laporan, ini dapat memastikan ketepatan pengetahuan dalam jawapan ChatGPT, dan pada masa yang sama, ia juga boleh memberikan maklumat kebolehkesanan pengetahuan.
Selain itu, menggunakan teknologi kawalan kualiti rekod perubatan terkemuka industri Yunzhisheng, anda boleh menemui masalah secara automatik dalam rekod perubatan yang dijana, dan kemudian secara automatik menjana pembelajaran pengukuhan berdasarkan maklum balas manusia sebagai teknologi teras ChatGPT ( RLHF, Pembelajaran Pengukuhan daripada Maklum Balas Manusia) memerlukan data maklum balas pengguna untuk mempercepatkan pengoptimuman model.
Akhirnya, kembali kepada kejadian itu sendiri, perbincangan sebelumnya tentang nilai ChatGPT kepada industri semuanya dari perspektif ekologi industri peringkat makro dan inovasi model, seperti interaksi manusia-komputer, pengedaran maklumat, pengeluaran kandungan , dsb.
Kini, apabila semakin banyak perusahaan menegak memasuki pasaran, kepentingan ChatGPT kepada perusahaan juga muncul - pilihan paradigma teknologi AGI baharu: Berdasarkan "model asas universal berskala besar + Industri ringan penyepaduan pengetahuan dan kaedah penyelesaian masalah untuk "Pengoptimuman Aplikasi Industri".
Pada masa lalu, pemain dalam senario ini mungkin berada dalam keadaan jahil apabila tiba pada penerokaan AI, "Melihat gunung sebagai gunung, melihat gunung sebagai bukan gunung" , kini terdapat "gunung yang lebih kecil, dan mengetahui bahawa akan ada jalan ".
"Kepintaran" yang ditunjukkan oleh ChatGPT telah membawa mereka arah teknikal yang jelas.
Ketua Pegawai Eksekutif Yunzhisheng Huang Wei juga mempunyai pemahaman yang mendalam Walaupun berbanding dengan AlphaGo, dia percaya bahawa kesan ChatGPT jauh lebih mendalam, setara dengan "revolusi perindustrian" baharu.
Kelebihan terbesar revolusi ini ialah melalui mekanisme perhatian yang diselia sendiri, ia boleh menggunakan sepenuhnya data besar tanpa pengawasan untuk melatih model asas umum, dan menggabungkan persepsi, kognisi dan penjanaan dengan rangka kerja yang bersatu untuk mencapai "end-to-end" "Integrasi untuk mempersembahkan kecerdasan mesin secara langsung daripada hasil yang dihasilkan berkualiti tinggi. Kaedah pembelajaran berpandukan data berpandukan buatan yang diguna pakai oleh mesin adalah berbeza sama sekali daripada mod pemikiran logik manusia Ia serupa dengan mekanisme "aerodinamik" jet yang digunakan oleh kapal terbang, yang sama sekali berbeza daripada kaedah "kepak sayap" yang diguna pakai oleh. burung.
Sama ada untuk keseluruhan industri atau perusahaan individu, nilai yang dibawa oleh ChatGPT benar-benar membuatkan mereka tidak dapat mengikutinya.
Terutama untuk pemain dalam beberapa senario, mereka masih merupakan kumpulan orang yang paling berkemungkinan memakan bonus ChatGPT.
Mereka mempunyai senario, data dan halangan industri yang mendalam Setelah mereka mempunyai keupayaan ChatGPT, mereka boleh menjadi yang pertama melaksanakannya dalam industri. Ini adalah kelebihan gerakan pertama yang tidak dapat dicapai oleh pemain lain.
Apabila gelombang AI terakhir melanda, pemain adeganlah yang pertama mengambil kesempatan daripada bonus AI. Cuma sekarang ChatGPT muncul terus melalui laluan teknikal, dan kelajuan pelaksanaan secara semula jadi lebih pantas berbanding sebelum ini.
Ketua Pegawai Eksekutif Yunzhisheng Huang Wei juga memberikan titik masa yang jelas:
Pelan permohonan yang berjaya akan dilaksanakan dalam tahun ini.
Atas ialah kandungan terperinci Sejauh manakah ChatGPT boleh melaksanakan perkhidmatan perubatan? Prestasi profesor Harvard dalam ujian peribadi hampir dengan doktor, Yun Zhisheng terdedah untuk mencipta versi industri. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!