我完成了一個完整的LLM訓練項目,從下載訓練資料集到使用訓練好的模型生成文本,整個流程都包含在內。目前支援PILE資料集,這是一個用於LLM訓練的多樣化資料集。您可以限制資料集大小,自訂預設的Transformer架構和訓練配置等等。
這是我在Colab T4 GPU上訓練的,擁有1300萬參數的LLM產生的文字範例:
在****1978年,公園被歸還給了工廠——公共區域被電子圍欄隔開,這些圍欄緊隨車站所在的城市而建。古代西方國家的運河被限制在城市區域內。中國的村莊直接與城市相連,這引發了對美國預算的抗議,而奧丹巴伊納斯(Odambinais)的未來則是不確定的,財富集中在農村地區。
這個計畫更注重學習過程,而不是立即創造出最優秀的AI。
程式碼、文件和範例都可以在GitHub上找到:
GitHub連結
以上是從頭開始培養法學碩士的詳細內容。更多資訊請關注PHP中文網其他相關文章!