Rumah >pembangunan bahagian belakang >Tutorial Python >Isu dengan saiz tensor yang tidak sepadan semasa latihan dengan DeepSpeed

Isu dengan saiz tensor yang tidak sepadan semasa latihan dengan DeepSpeed

DDD
DDDasal
2024-12-23 18:32:14657semak imbas

Issue with mismatched tensor sizes during training with DeepSpeed

Saya sedang melatih model menggunakan** Pelatih Wajah** dengan penyepaduan DeepSpeed ​​dan saya menghadapi ralat yang berkaitan dengan saiz tensor yang tidak sepadan. Secara khususnya, saya mendapat ralat berikut:

Saiz tensor a (50) mesti sepadan dengan saiz tensor b (3) pada dimensi bukan tunggal2

Saya harap seseorang boleh membetulkannya dan tolong kongsikan versi anda!???

data saya:

Berikut ialah persediaan saya:

Saya telah menyemak sama ada input_id dan label mempunyai bentuk yang sama. Saya telah mengesahkan saiz kelompok dalam konfigurasi Jurulatih dan konfigurasi DeepSpeed. Saya juga telah memastikan bahawa model diletakkan dengan betul pada peranti (cuda atau cpu).

mungkin, saya tidak pasti.

Atas ialah kandungan terperinci Isu dengan saiz tensor yang tidak sepadan semasa latihan dengan DeepSpeed. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn