Rumah  >  Artikel  >  Peranti teknologi  >  Huang Bin, pakar dalam R&D Platform Algoritma Muzik Awan NetEase: Amalan dan Pemikiran mengenai Sistem Ramalan Dalam Talian Muzik Awan NetEase

Huang Bin, pakar dalam R&D Platform Algoritma Muzik Awan NetEase: Amalan dan Pemikiran mengenai Sistem Ramalan Dalam Talian Muzik Awan NetEase

WBOY
WBOYke hadapan
2023-04-10 19:21:011288semak imbas

Tetamu |. Huang Bin

Dianjurkan |. Tu Chengye

Baru-baru ini, di Persidangan Teknologi Kecerdasan Buatan Global AISummit yang dihoskan oleh 51CTO, Huang Bin, pakar dalam R&D Platform Algoritma Muzik Awan NetEase , memberikan ucaptama "Amalan dan Pemikiran pada Sistem Ramalan Dalam Talian Muzik Awan NetEase" berkongsi amalan dan pemikiran yang berkaitan tentang cara membina sistem ramalan berprestasi tinggi, mudah digunakan dan kaya dengan ciri dari perspektif penyelidikan teknologi dan pembangunan.

Kandungan ucapan kini disusun seperti berikut, dengan harapan dapat memberi inspirasi kepada anda.

Seni Bina Sistem Keseluruhan

Pertama, mari kita lihat seni bina keseluruhan sistem ramalan, seperti yang ditunjukkan dalam rajah di bawah:

Huang Bin, pakar dalam R&D Platform Algoritma Muzik Awan NetEase: Amalan dan Pemikiran mengenai Sistem Ramalan Dalam Talian Muzik Awan NetEase

Sistem Pelayan Ramalan di tengah-tengah seni bina keseluruhan

ialah komponen teras sistem ramalan, termasuk komponen pertanyaan, komponen pemprosesan ciri dan komponen pengiraan model. Sistem pemantauan di sebelah kiri digunakan untuk memantau perkhidmatan rangkaian talian bagi memastikan kelancaran rangkaian sistem. PushServer di sebelah kanan digunakan untuk tolak model, menolak model terkini ke dalam sistem ramalan dalam talian untuk ramalan.

Matlamatnya adalah untuk membina sistem ramalan berprestasi tinggi, mudah digunakan dan kaya dengan ciri.

Pengkomputeran Berprestasi Tinggi

Bagaimana untuk meningkatkan prestasi pengkomputeran? Apakah masalah prestasi pengkomputeran biasa kami, saya akan menghuraikannya dari tiga aspek.

  • Pemprosesan ciri

Dalam penyelesaian umum, pengiraan ciri dan pengiraan model kami digunakan dalam proses berasingan, yang akan menghasilkan sejumlah besar ciri yang sedia ada merentas perkhidmatan, Pemindahan merentas bahasa akan membawa berbilang pengekodan, penyahkodan dan salinan memori, menghasilkan overhed prestasi yang agak besar.

  • Kemas kini model

Kami tahu bahawa apabila model dikemas kini, akan terdapat jenis blok besar aplikasi dan keluaran. Walau bagaimanapun, dalam beberapa penyelesaian umum, ia tidak disertakan dengan penyelesaian pemanasan awal model, yang akan membawa kepada jitter memakan masa yang agak tinggi dalam proses kemas kini model dan tidak dapat menyokong kemas kini masa nyata model.

  • Penjadualan Pengkomputeran

Rangka kerja am menggunakan mekanisme penyegerakan, yang mempunyai konkurensi yang tidak mencukupi dan penggunaan CPU yang rendah, serta tidak dapat memenuhi keperluan pengkomputeran serentak yang tinggi.

Jadi, bagaimanakah kita hendak menyelesaikan kesesakan prestasi ini dalam sistem ramalan?

1. Penyepaduan lancar perpustakaan pembelajaran mesin

Mengapa kita perlu melakukan perkara sedemikian? Kerana dalam penyelesaian tradisional, kita semua tahu bahawa pemprosesan ciri dan pengiraan model digunakan dalam proses yang berasingan, yang akan menghasilkan penghantaran silang rangkaian yang lebih spesifik, pensirilan, penyahsirilan dan aplikasi dan keluaran memori yang kerap. Terutama apabila jumlah ciri adegan yang disyorkan adalah sangat besar, ini akan membawa overhed prestasi yang ketara. Dalam rajah di bawah, carta alir di bahagian atas menunjukkan situasi khusus dalam penyelesaian umum.

Huang Bin, pakar dalam R&D Platform Algoritma Muzik Awan NetEase: Amalan dan Pemikiran mengenai Sistem Ramalan Dalam Talian Muzik Awan NetEase

Integrasi lancar perpustakaan pembelajaran komputer

Untuk menyelesaikan masalah di atas, kami menyepadukan rangka kerja pembelajaran pengkomputeran berprestasi tinggi ke dalam sistem ramalan Dalam sistem, kelebihannya ialah kami dapat memastikan pemprosesan ciri dan pengiraan model boleh digunakan dalam proses yang sama, dan boleh melaksanakan operasi ciri dalam bentuk penunjuk, mengelakkan overhed penyirian, penyahsirilan dan penghantaran rangkaian, dengan itu meningkatkan ciri pengiraan dan pemprosesan Ciri membawa peningkatan prestasi pengkomputeran yang lebih baik, yang merupakan faedah penyepaduan pembelajaran mesin yang lancar.

2. Pertimbangan reka bentuk seni bina

Pertama sekali, keseluruhan sistem menggunakan reka bentuk seni bina tak segerak sepenuhnya. Faedah seni bina tak segerak ialah panggilan luaran tidak menyekat dan menunggu, jadi mekanisme tak segerak boleh memastikan bahawa kestabilan perkhidmatan rangkaian yang memakan masa masih dikekalkan di bawah beban CPU yang tinggi, seperti 60% hingga 70%.

Kedua, pengoptimuman akses memori. Pengoptimuman akses memori terutamanya berdasarkan seni bina NUMA pelayan, dan kami menggunakan kaedah operasi terikat teras. Dengan cara ini, kami boleh menyelesaikan masalah capaian memori jauh yang wujud dalam seni bina NUMA sebelum ini, sekali gus meningkatkan prestasi pengkomputeran perkhidmatan kami.

Ketiga, pengkomputeran selari. Kami membahagikan tugas pengkomputeran dan menggunakan konkurensi berbilang benang untuk melakukan pengiraan, yang boleh mengurangkan penggunaan masa perkhidmatan dan meningkatkan penggunaan sumber.

Huang Bin, pakar dalam R&D Platform Algoritma Muzik Awan NetEase: Amalan dan Pemikiran mengenai Sistem Ramalan Dalam Talian Muzik Awan NetEase

Pertimbangan reka bentuk seni bina

Di atas adalah amalan kami dalam menganggar pertimbangan seni bina sistem sistem.

3. Caching berbilang peringkat

Caching berbilang peringkat digunakan terutamanya dalam peringkat pertanyaan ciri dan peringkat utama. Mekanisme caching yang kami rangkumkan boleh, dalam satu tangan, mengurangkan panggilan luaran kepada pertanyaan, dan sebaliknya, mengurangkan pengiraan tidak sah berulang yang disebabkan oleh pengekstrakan ciri.

Melalui caching, kecekapan pertanyaan dan pengekstrakan boleh dipertingkatkan dengan ketara. Terutamanya dalam peringkat pertanyaan, kami merangkum pelbagai komponen berdasarkan kepentingan ciri dan magnitud ciri, seperti pertanyaan segerak, pertanyaan tak segerak dan import kelompok ciri.

Pertama ialah pertanyaan segerak, yang sesuai terutamanya untuk beberapa ciri yang lebih penting, sudah tentu prestasi pertanyaan segerak tidak begitu cekap.

Yang kedua ialah pertanyaan tak segerak, yang menyasarkan beberapa ciri "dimensi Aite" ini mungkin tidak begitu penting, jadi anda boleh menggunakan kaedah pertanyaan tak segerak ini.

Kaedah ketiga ialah import kelompok ciri, yang sesuai terutamanya untuk data ciri yang skala cirinya tidak terlalu besar. Dengan mengimport ciri ini ke dalam proses secara berkelompok, kami boleh melaksanakan pertanyaan ciri setempat dan prestasinya sangat cekap.

Huang Bin, pakar dalam R&D Platform Algoritma Muzik Awan NetEase: Amalan dan Pemikiran mengenai Sistem Ramalan Dalam Talian Muzik Awan NetEase

Caching berbilang peringkat

4. Pengoptimuman pengiraan model

Selepas memperkenalkan mekanisme caching, mari kita lihat pengoptimuman tingkah laku. pengiraan model. Untuk pengiraan model, kami terutamanya mengoptimumkan daripada tiga aspek: pengoptimuman input model, pengoptimuman pemuatan model dan pengoptimuman kernel.

  • Pengoptimuman input model

Dalam kawasan input model, semua orang tahu bahawa Pelayanan TF menggunakan input Contoh. Input contoh akan termasuk pembinaan Contoh, pensirilan dan penyahsirilan Contoh, dan panggilan ke Parse Example di dalam model, yang akan memakan masa yang agak lama.

Dalam gambar di bawah, kami melihat tangkapan skrin [Sebelum Pengoptimuman] untuk menunjukkan statistik data sebelum pengiraan dan pengoptimuman model. Kita dapat melihat bahawa terdapat Contoh Parse yang agak panjang yang mengambil masa yang lama untuk dihuraikan, dan op lain tidak dapat melaksanakan penjadualan selari sebelum Contoh Parse dihuraikan. Untuk menyelesaikan masalah prestasi pokok model, kami telah merangkumkan penyelesaian input model berprestasi tinggi dalam sistem ramalan. Melalui penyelesaian baharu, kami boleh mencapai salinan sifar input ciri, dengan itu mengurangkan pembinaan dan penghuraian Contoh ini yang memakan masa.

Dalam gambar di bawah, kami melihat tangkapan skrin [After Optimization] untuk menunjukkan statistik data selepas pengoptimuman pengiraan model Kami dapat melihat bahawa tidak ada lagi masa penghuraian Contoh Parse, hanya penghuraian Contoh dibiarkan memakan masa.

Huang Bin, pakar dalam R&D Platform Algoritma Muzik Awan NetEase: Amalan dan Pemikiran mengenai Sistem Ramalan Dalam Talian Muzik Awan NetEase

Pengoptimuman pengiraan model

  • Pengoptimuman pemuatan model

Selepas memperkenalkan pengoptimuman input model, mari kita lihat pada model Pengoptimuman pemuatan. Pemuatan model Tensorflow ialah mod pemuatan malas Selepas model dimuatkan secara dalaman, model ini tidak akan memanaskan model sehingga permintaan rasmi daripada rangkaian datang akan menjadi kegelisahan yang memakan masa yang serius.

Untuk menyelesaikan masalah ini, kami telah melaksanakan fungsi pemanasan awal model automatik dalam sistem ramalan, penukaran panas antara model lama dan baharu, dan pemunggahan tak segerak dan pelepasan memori model lama. Dengan cara ini, melalui beberapa kaedah pengoptimuman untuk memuatkan model ini, keupayaan kemas kini peringkat minit model dicapai.

  • Pengoptimuman kernel

Seterusnya, mari kita lihat pengoptimuman kernel model. Pada masa ini, kami terutamanya melakukan beberapa pengoptimuman penyegerakan kernel pada kernel Tensorflow, dan kami akan melaraskan beberapa kumpulan benang antara ops dan dalam ops mengikut model, dsb.

Di atas ialah beberapa percubaan kami untuk mengoptimumkan prestasi dalam pengiraan model.

Selepas memperkenalkan penyelesaian pengoptimuman prestasi di atas, mari kita lihat hasil pengoptimuman prestasi akhir.

Huang Bin, pakar dalam R&D Platform Algoritma Muzik Awan NetEase: Amalan dan Pemikiran mengenai Sistem Ramalan Dalam Talian Muzik Awan NetEase

Hasil pengoptimuman prestasi

Di sini kami membuat perbandingan antara sistem anggaran dan sistem penyelesaian umum. Kita dapat melihat bahawa apabila penggunaan CPU bagi sistem yang dianggarkan mencapai 80%, masa pengiraan dan kadar tamat masa keseluruhan perkhidmatan adalah sangat stabil dan sangat rendah. Melalui perbandingan, kita boleh membuat kesimpulan bahawa penyelesaian baharu (sistem ramalan) mempunyai prestasi dua kali ganda dari segi pengiraan dan pemprosesan, mempunyai keupayaan pengekstrakan CPU yang lebih kuat, dan mengurangkan masa perkhidmatan.

Terima kasih kepada pengoptimuman sistem kami, kami boleh menyediakan lebih banyak pengiraan kerumitan model dan lebih banyak pengiraan set calon untuk algoritma perniagaan.

Angka di atas memberikan contoh Set calon telah dikembangkan daripada 300 set calon sebelumnya kepada 1000 set calon Pada masa yang sama, kami telah meningkatkan kerumitan pengiraan model dan menggunakan beberapa ciri yang lebih kompleks . Ia telah membawa peningkatan prestasi yang lebih baik dalam perniagaan ini.

Di atas ialah pengenalan kepada pengoptimuman prestasi dan hasil pengoptimuman prestasi sistem anggaran.

Cara meningkatkan kecekapan pembangunan

1. Reka bentuk berlapis sistem

Sistem ini menggunakan reka bentuk seni bina berlapis. Kami membahagikan keseluruhan sistem anggaran kepada tiga lapisan, termasuk lapisan seni bina asas, lapisan templat perantaraan dan lapisan struktur atas.

Lapisan seni bina asas terutamanya menyediakan mekanisme tak segerak, baris gilir tugas, penjadualan serentak, komunikasi rangkaian, dsb.

Lapisan templat tengah terutamanya menyediakan komponen yang berkaitan dengan pengiraan model, termasuk pengurusan pertanyaan, pengurusan cache, pengurusan pemuatan model dan pengurusan pengiraan model.

Lapisan antara muka atas terutamanya menyediakan antara muka Tahap Tinggi Perniagaan hanya perlu melaksanakan antara muka lapisan ini, yang sangat mengurangkan pembangunan kod.

Huang Bin, pakar dalam R&D Platform Algoritma Muzik Awan NetEase: Amalan dan Pemikiran mengenai Sistem Ramalan Dalam Talian Muzik Awan NetEase

Melalui reka bentuk seni bina berlapis sistem, kod lapisan bawah dan tengah boleh digunakan semula antara perniagaan yang berbeza hanya perlu memberi tumpuan kepada pembangunan perniagaan kecil jumlah kod pada lapisan atas. Pada masa yang sama, kami juga berfikir lebih jauh Adakah terdapat cara untuk mengurangkan lagi pembangunan kod lapisan antara muka atas? Mari perkenalkan secara terperinci di bawah.

2. Pengkapsulan pertanyaan universal

Dengan merangkum penyelesaian umum yang dibentuk oleh pertanyaan ciri dan analisis ciri berdasarkan teknologi pb dinamik, adalah mungkin untuk mengkonfigurasi nama jadual, KEY pertanyaan dan masa cache sahaja melalui XML , kebergantungan pertanyaan, dsb. boleh merealisasikan keseluruhan proses pertanyaan ciri, penghuraian dan caching.

Seperti yang ditunjukkan dalam rajah di bawah, kita boleh melaksanakan logik pertanyaan kompleks dengan beberapa baris konfigurasi. Pada masa yang sama, kecekapan pertanyaan dipertingkatkan melalui enkapsulasi pertanyaan.

Huang Bin, pakar dalam R&D Platform Algoritma Muzik Awan NetEase: Amalan dan Pemikiran mengenai Sistem Ramalan Dalam Talian Muzik Awan NetEase

3. Pakej pengiraan ciri

Pengiraan ciri boleh dikatakan sebagai modul dengan kerumitan pembangunan kod tertinggi dalam keseluruhan sistem anggaran ciri?

Pengiraan ciri termasuk proses luar talian dan proses dalam talian. Proses luar talian sebenarnya adalah sampel luar talian, yang diproses untuk mendapatkan beberapa format yang diperlukan oleh platform latihan luar talian, seperti format TF Recocd. Proses dalam talian terutamanya melakukan beberapa pengiraan ciri pada permintaan dalam talian dan memperoleh beberapa format yang diperlukan oleh platform ramalan dalam talian melalui pemprosesan. Malah, logik pengiraan untuk pemprosesan ciri adalah sama persis antara proses luar talian dan proses dalam talian. Walau bagaimanapun, kerana platform pengkomputeran proses luar talian dan proses dalam talian adalah berbeza, dan bahasa yang digunakan adalah berbeza, beberapa set kod perlu dibangunkan untuk melaksanakan pengiraan ciri, jadi terdapat tiga masalah berikut.

Huang Bin, pakar dalam R&D Platform Algoritma Muzik Awan NetEase: Amalan dan Pemikiran mengenai Sistem Ramalan Dalam Talian Muzik Awan NetEase

  • Ketekalan sukar untuk dijamin

Sebab asas mengapa konsistensi sukar untuk dijamin ialah sukar untuk menyatukan ciri memproses logik latihan luar talian dan ramalan dalam talian. Di satu pihak, ia akan menjejaskan kesan algoritma, dan sebaliknya, ia akan membawa kepada kos pengesahan satu kali yang agak tinggi semasa proses pembangunan.

  • Kecekapan rendah

Jika anda ingin menambah ciri baharu, anda perlu membangunkan beberapa set kod yang melibatkan proses luar talian dan proses dalam talian, menghasilkan kecekapan pembangunan yang sangat rendah .

  • Sukar untuk digunakan semula

Sukar untuk digunakan semula, sebab utama rangka kerja tersebut tidak mempunyai sokongan untuk keupayaan penggunaan semula, mengakibatkan penduaan pengiraan ciri antara perniagaan yang berbeza Ia menjadi sangat sukar untuk digunakan.

Di atas ialah beberapa masalah rangka kerja pengiraan ciri.

Untuk menyelesaikan masalah ini, kami akan menyelesaikannya secara beransur-ansur mengikut empat perkara berikut.

Pertama sekali, kami mencadangkan konsep operator dan pengiraan ciri abstrak ke dalam enkapsulasi operator. Kedua, selepas pengendali dikapsulkan, kami membina perpustakaan pengendali, yang boleh memberikan keupayaan untuk menggunakan semula pengendali antara perniagaan. Kemudian, kami mentakrifkan bahasa penerangan pengiraan ciri DSL berdasarkan pengendali. Melalui bahasa penerangan ini, kita boleh melengkapkan ungkapan konfigurasi pengiraan ciri. Akhir sekali, seperti yang dinyatakan sebelum ini, kerana terdapat beberapa set logik dalam proses dalam talian dan proses luar talian, yang akan membawa kepada ketidakkonsistenan logik, kita perlu menyelesaikan masalah ciri satu kali.

Empat perkara di atas ialah idea kami tentang cara merangkum rangka kerja pengiraan ciri.

Huang Bin, pakar dalam R&D Platform Algoritma Muzik Awan NetEase: Amalan dan Pemikiran mengenai Sistem Ramalan Dalam Talian Muzik Awan NetEase

  • Abstraksi operator

Untuk merealisasikan abstraksi operator, protokol data mesti disatukan terlebih dahulu. Kami menggunakan teknologi pb dinamik untuk memproses sebarang ciri mengikut data bersatu berdasarkan maklumat data asal ciri Ini menyediakan asas data untuk enkapsulasi operator kami. Seterusnya, kami mengambil sampel dan merangkum proses pemprosesan ciri, mengabstrakkan proses pengiraan ciri ke dalam penghuraian, pengiraan, pemasangan dan pengendalian pengecualian, dan menyatukan API proses pengiraan untuk mencapai abstraksi operator.

  • Membina perpustakaan operator

Selepas kami mempunyai abstraksi pengendali, kami boleh membina perpustakaan operator. Perpustakaan pengendali dibahagikan kepada perpustakaan pengendali am platform dan perpustakaan pengendali tersuai perniagaan. Perpustakaan pengendali am platform digunakan terutamanya untuk mencapai penggunaan semula peringkat syarikat. Perpustakaan pengendali tersuai perniagaan ditujukan terutamanya kepada beberapa senario tersuai dan ciri perniagaan untuk mencapai penggunaan semula dalam kumpulan. Melalui enkapsulasi pengendali dan pembinaan perpustakaan pengendali, kami menyedari penggunaan semula pengiraan ciri dalam berbilang senario dan meningkatkan kecekapan pembangunan.

  • Bahasa Penerangan Pengiraan DSL

Ungkapan dikonfigurasikan pengiraan ciri merujuk kepada bahasa yang dikonfigurasikan yang mentakrifkan ungkapan pengiraan ciri yang dipanggil DSL. Melalui bahasa konfigurasi, kita boleh merealisasikan ekspresi bersarang berbilang peringkat pengendali, empat operasi aritmetik dan sebagainya. Tangkapan skrin pertama di bawah menunjukkan sintaks khusus bahasa yang dikonfigurasikan.

Huang Bin, pakar dalam R&D Platform Algoritma Muzik Awan NetEase: Amalan dan Pemikiran mengenai Sistem Ramalan Dalam Talian Muzik Awan NetEase

Apakah faedah yang boleh kami bawa melalui bahasa konfigurasi pengiraan ciri?

Pertama, kami boleh melengkapkan keseluruhan pengiraan ciri melalui konfigurasi, dengan itu meningkatkan kecekapan pembangunan.

Kedua, kami boleh mencapai kemas kini hangat pengiraan ciri dengan menerbitkan ungkapan terkonfigurasi pengiraan ciri.

Ketiga, latihan dan ramalan menggunakan konfigurasi pengiraan ciri yang sama untuk mencapai konsistensi dalam talian dan luar talian.

Ini ialah faedah ungkapan pengiraan ciri.

  • Ketekalan ciri

Seperti yang dinyatakan sebelum ini, pengiraan ciri dibahagikan kepada proses luar talian dan proses dalam talian. Disebabkan oleh sebab berbilang platform luar talian dan dalam talian, pengiraan logik adalah tidak konsisten. Untuk menyelesaikan masalah ini, kami melaksanakan keupayaan menjalankan merentas platform rangka kerja pengkomputeran ciri dalam rangka kerja pengkomputeran ciri. Logik teras dibangunkan dalam C++, dan antara muka C++ dan antara muka Java terdedah kepada dunia luar. Dalam proses pembungkusan dan pembinaan, pakej perpustakaan dan balang C++ jadi boleh dilaksanakan dengan satu klik, dengan itu memastikan pengiraan ciri boleh menjalankan platform C++ untuk pengiraan dalam talian dan platform Spark luar talian atau platform Flink, dan ia boleh dinyatakan dengan pengiraan ciri untuk memastikan pengiraan ciri Mencapai konsistensi logik dalam talian dan luar talian.

Huang Bin, pakar dalam R&D Platform Algoritma Muzik Awan NetEase: Amalan dan Pemikiran mengenai Sistem Ramalan Dalam Talian Muzik Awan NetEase

Perkara di atas menerangkan situasi khusus pengiraan ciri. Mari kita lihat beberapa hasil yang telah dicapai oleh pengkomputeran ciri setakat ini.

Kami kini telah mengumpul 120 operator Melalui bahasa DSL pengiraan ciri, konfigurasi boleh direalisasikan dan keseluruhan pengiraan ciri dapat diselesaikan. Melalui keupayaan operasi merentas platform yang kami sediakan, masalah ketidakkonsistenan logik dalam talian dan luar talian diselesaikan.

Tangkapan skrin dalam rajah di bawah menunjukkan bahawa dengan sedikit konfigurasi, keseluruhan proses pengiraan ciri boleh direalisasikan, yang meningkatkan kecekapan pembangunan pengiraan ciri.

Huang Bin, pakar dalam R&D Platform Algoritma Muzik Awan NetEase: Amalan dan Pemikiran mengenai Sistem Ramalan Dalam Talian Muzik Awan NetEase

Perkara di atas memperkenalkan penerokaan kami untuk meningkatkan kecekapan pembangunan. Secara umum, kita boleh meningkatkan kebolehgunaan semula kod melalui reka bentuk hierarki sistem, dan mencapai proses pembangunan boleh dikonfigurasikan dengan merangkum pertanyaan, pengekstrakan dan pengiraan model.

4. Enkapsulasi pengiraan model

Pengiraan model juga berbentuk enkapsulasi. Melalui bentuk ungkapan konfigurasi, pemuatan model, struktur input model, pengiraan model, dan lain-lain direalisasikan Dengan menggunakan beberapa baris konfigurasi, proses ekspresi keseluruhan pengiraan model direalisasikan.

Huang Bin, pakar dalam R&D Platform Algoritma Muzik Awan NetEase: Amalan dan Pemikiran mengenai Sistem Ramalan Dalam Talian Muzik Awan NetEase

Pelaksanaan masa nyata model

Mari kita lihat kes pelaksanaan masa nyata model tersebut.

1. Latar belakang projek masa nyata

Mengapa kita perlu melakukan projek masa nyata model sedemikian?

Sebab utamanya ialah sistem pengesyoran tradisional ialah sistem yang mengemas kini hasil pengesyoran pengguna setiap hari Prestasi masa nyatanya sangat lemah dan tidak dapat memenuhi senario sedemikian dengan keperluan masa nyata yang tinggi, seperti adegan siaran langsung kami, atau Beberapa senario lain dengan keperluan masa nyata yang lebih tinggi.

Sebab lain ialah kaedah pengeluaran sampel tradisional mempunyai masalah penyeberangan ciri. Apakah persimpangan ciri? Angka berikut menunjukkan sebab asas untuk menyeberangi ciri Dalam proses penyambungan sampel, kami menggunakan struktur anggaran model pada masa "T-1" dan menyambungkannya dengan ciri pada masa "T". lintasan akan timbul. Persimpangan ciri akan sangat mempengaruhi kesan pengesyoran rangkaian talian. Untuk menyelesaikan masalah masa nyata dan masalah persimpangan sampel, kami melaksanakan penyelesaian masa nyata model sedemikian dalam sistem ramalan.

Huang Bin, pakar dalam R&D Platform Algoritma Muzik Awan NetEase: Amalan dan Pemikiran mengenai Sistem Ramalan Dalam Talian Muzik Awan NetEase

2 Pengenalan kepada penyelesaian masa nyata

Model penyelesaian masa nyata dihuraikan daripada tiga dimensi.

  • Penjanaan masa nyata sampel
  • Latihan model tambahan
  • Ramalan masa nyata sistem

Huang Bin, pakar dalam R&D Platform Algoritma Muzik Awan NetEase: Amalan dan Pemikiran mengenai Sistem Ramalan Dalam Talian Muzik Awan NetEase

Sampel dijana dalam masa nyata. Berdasarkan sistem ramalan dalam talian, kami melaksanakan ciri-ciri sistem ramalan kepada Kafka dalam masa nyata dan mengaitkannya dalam bentuk ID RACE Dengan cara ini kami boleh memastikan bahawa sampel diletakkan pada cakera dalam beberapa saat dan boleh menyelesaikan masalah lintasan ciri.

Model latihan tambahan. Selepas sampel diletakkan pada cakera dalam beberapa saat, kami boleh mengubah suai modul latihan untuk melaksanakan latihan tambahan model, dan mencapai kemas kini peringkat minit model.

Sistem ramalan adalah masa nyata. Selepas mengeksport model pada tahap minit, kami menolak model terkini ke sistem ramalan dalam talian melalui perkhidmatan push model Push Server, yang membolehkan sistem ramalan di tapak menggunakan model terkini untuk ramalan.

Secara umumnya, penyelesaian model masa nyata adalah untuk mencapai penempatan sampel dalam beberapa saat, latihan peringkat minit dan kemas kini dalam talian peringkat minit bagi model.

Penyelesaian masa nyata model semasa kami telah dilaksanakan dalam berbilang senario. Melalui penyelesaian model masa nyata, hasil perniagaan telah dipertingkatkan dengan ketara.

Huang Bin, pakar dalam R&D Platform Algoritma Muzik Awan NetEase: Amalan dan Pemikiran mengenai Sistem Ramalan Dalam Talian Muzik Awan NetEase

Rajah di atas menunjukkan terutamanya data percubaan khusus bagi penyelesaian masa nyata model. Kita boleh melihat latihan tambahan, lebih pendek tempoh latihan, lebih baik. Melalui data khusus, kita boleh tahu bahawa kesan kitaran 15 minit adalah jauh lebih besar daripada 2 jam, 10 jam, atau satu hari. Penyelesaian masa nyata model semasa sudah mempunyai proses capaian piawai, yang boleh membawa hasil yang lebih baik kepada perniagaan secara berkelompok.

Perkara di atas memperkenalkan penerokaan dan percubaan dalam tiga aspek: cara sistem ramalan meningkatkan prestasi pengkomputeran, cara meningkatkan kecekapan pembangunan dan cara menambah baik algoritma projek melalui cara kejuruteraan.

Nilai platform keseluruhan sistem anggaran, atau tujuan platform keseluruhan sistem anggaran, boleh diringkaskan dalam tiga perkataan, iaitu "cepat, baik dan menjimatkan".

"Pantas" merujuk kepada pembinaan aplikasi yang diperkenalkan sebelum ini. Kami berharap melalui pembinaan aplikasi berterusan, lelaran perniagaan boleh menjadi lebih cekap.

"Baik" bermakna kami berharap melalui cara kejuruteraan, seperti penyelesaian model masa nyata dan penyelesaian ketekalan logik dalam talian dan luar talian melalui pengiraan ciri, kami boleh membawa hasil yang lebih baik kepada perniagaan.

"Simpan" bermaksud menggunakan prestasi sistem anggaran yang lebih tinggi, yang boleh menjimatkan lebih banyak sumber pengkomputeran dan menjimatkan kos pengkomputeran.

Huang Bin, pakar dalam R&D Platform Algoritma Muzik Awan NetEase: Amalan dan Pemikiran mengenai Sistem Ramalan Dalam Talian Muzik Awan NetEase

Pada masa hadapan, kami akan terus berusaha ke arah tiga matlamat ini.

Di atas adalah pengenalan saya kepada sistem ramalan muzik awan. Perkongsian saya berakhir di sini, terima kasih semua!

Atas ialah kandungan terperinci Huang Bin, pakar dalam R&D Platform Algoritma Muzik Awan NetEase: Amalan dan Pemikiran mengenai Sistem Ramalan Dalam Talian Muzik Awan NetEase. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Artikel ini dikembalikan pada:51cto.com. Jika ada pelanggaran, sila hubungi admin@php.cn Padam