Rumah >Peranti teknologi >AI >Gunakan model bahasa besar secara tempatan pada 2GB DAYU200
Pindahkan rangka kerja inferens model LLM ringan InferLLM ke sistem standard OpenHarmony dan susun fail binari yang boleh dijalankan pada OpenHarmony. Rangka kerja inferens ini ialah rangka kerja inferens CPU LLM yang mudah dan cekap yang boleh menggunakan model kuantitatif dalam LLM secara tempatan.
Gunakan OpenHarmony NDK untuk menyusun fail boleh laku InferLLM pada OpenHarmony (khususnya gunakan rangka kerja kompilasi silang lycium OpenHarmony, dan kemudian tulis beberapa skrip. Kemudian simpannya dalam tpc_c_cplusplusSIG gudang besar.) Deployly the local language
pada DAYU200http://ci.openharmony.cn/Ldaistlybuild/daily muat turun gudang ini 9c akan dijana dalam direktori tpc_c_cplusplus/thirdparty/InferLLM/ direktori 63555be41d, di mana menyusun pustaka pihak ketiga 32-bit dan 64-bit. (Hasil kompilasi yang berkaitan tidak akan dibungkus ke dalam direktori usr di bawah direktori lycium).
git clone https://gitee.com/openharmony-sig/tpc_c_cplusplus.git --depth=1
rreee
Atas ialah kandungan terperinci Gunakan model bahasa besar secara tempatan pada 2GB DAYU200. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!