我目前正在使用 ** Hugging Face** 的 Trainer 与 DeepSpeed 集成来训练模型,并且遇到与张量大小不匹配相关的错误。具体来说,我收到以下错误:
我希望有人可以修复它并分享您的版本!???
我的数据:
这是我的设置:
我已检查 input_ids 和标签是否具有相同的形状。我已经验证了 Trainer 配置和 DeepSpeed 配置中的批量大小。我还确保模型正确放置在设备(cuda 或 cpu)上。
也许吧,我不确定。
以上是DeepSpeed 训练期间张量大小不匹配的问题的详细内容。更多信息请关注PHP中文网其他相关文章!