Rumah  >  Artikel  >  pembangunan bahagian belakang  >  Bagaimana untuk meningkatkan Ketepatan Model ML untuk Pengelasan Teks?

Bagaimana untuk meningkatkan Ketepatan Model ML untuk Pengelasan Teks?

WBOY
WBOYasal
2024-08-06 20:16:301071semak imbas

How to improve ML Model Accuracy for Text Classification?

Hai Pakar,

Kami sedang menangani Masalah Klasifikasi Teks. Kami mempunyai kira-kira 80K rekod dengan kira-kira 50 kelas. Data sangat tidak seimbang. Ia mempunyai 2 lajur satu untuk penerangan dan satu lagi mengandungi kelas.
Sehingga kini kami telah mencuba model dan teknik berikut:

  1. Prapemprosesan Data: a. Penukaran huruf kecil, teks berangka yang dialih keluar, dialih keluar tanda baca b. Mengalih keluar perkataan yang tidak penting dan menghentikan perkataan c. Lemmatisasi
  2. Transformasi TFIDF
  3. Menggunakan Model SKLEARN: a. SVC linear b. Regresi Linear c. Regresi Logistik d. Pokok Keputusan e. Hutan Rawak
  4. Menggunakan Huggingface Transformers: a. Google Bert b. Suling Bert
  5. Persampelan SMOTE

Adalah diperhatikan bahawa ketepatan maksimum yang kami dapat ialah 70% (Random Forest dan Google Bert).
Adakah terdapat sebarang skop untuk meningkatkan ketepatan?
Jika ya, apakah teknik atau model lain yang boleh kami gunakan untuk meningkatkan ketepatan?

Atas ialah kandungan terperinci Bagaimana untuk meningkatkan Ketepatan Model ML untuk Pengelasan Teks?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn
Artikel sebelumnya:Senarai PythonArtikel seterusnya:Senarai Python