首页 >科技周边 >人工智能 >线上开售！首场机器之心 AI 技术论坛圆满收官，这些大模型技术干货值得反复观看

线上开售！首场机器之心 AI 技术论坛圆满收官，这些大模型技术干货值得反复观看

PHPz转载: 2023-09-14 09:49:02686浏览

人工智能已经进入大模型时代，这将彻底改变 AI 在各行各业落地的模式，也对各行业的研发及技术从业者提出了新的 AI 技能要求。

为了助力大模型技术升级，我们举办了名为“Llama 2 大模型算法与应用实践”的活动，这个AI技术论坛已经圆满结束。活动当天，位于北京望京浦项中心B座二层的多功能厅座无虚席，来自全国十余个城市的200名参会者纷纷到场。在四位大模型技术专家的指导下，我们系统地学习了Llama 2底层大模型技术，并亲自动手搭建了自己的专属大模型，共同高效地完成了大模型技术的升级

线上开售！首场机器之心 AI 技术论坛圆满收官，这些大模型技术干货值得反复观看

活动获得了参会者广泛好评

内容高质量、内容超过预期、讲解精彩深入、现场问答交流具有启发性、服务全面周到……参会者给予活动广泛好评，并表达了对更多层次丰富、内容深入的技术活动的期待。

此外，因城市距离、行程档期等原因，许多对活动感兴趣的朋友遗憾未能来到现场。为了回应大家的学习实践需求，本站官网知识站（https://vtizr.xet.tech/s/1GOWfs）现上线本场论坛现场视频。全套视频售价 699 元（购买成功后请添加本站小助手 ID：13661489516，索取配套会前会后学习资料包）。立即购课学习，开启你的大模型技术升级之旅吧！

系统讲解：最新技术进展与前沿应用案例

线上开售！首场机器之心 AI 技术论坛圆满收官，这些大模型技术干货值得反复观看

上海交通大学清源研究院长聘教轨副教授、生成式人工智能研究组（GAIR）负责人刘鹏飞

“把模型训练得足够透彻，在一个比较小的模型里也可以达到一个非常好的性能。”第一位主讲人刘鹏飞专注于自然语言的预训练、生成和评估等研究方向。

Llama 2是市场上原创程度最高、训练技术细节最透明、口碑最好的预训练语言模型，具有极高的研究价值。本次刘鹏飞以《Llama 2大模型技术解读》为主题，从LLaMA的诞生背景、重要概念、Llama 2的训练技术以及对齐技术出发，深入解读了Llama 2及其Chat版本所涉及的技术栈细节，并分享了他的优化实践经验，包括数据源配比权重、上采样等技术细节，并探讨了大模型发展的突破难点

线上开售！首场机器之心 AI 技术论坛圆满收官，这些大模型技术干货值得反复观看

老刘说 NLP 技术公众号作者、开源爱好者刘焕勇

重新写成：基础模型对算力和算法要求非常高，因此在更多的行业应用中，选择基于基础模型构建行业大模型，并进一步细分领域。刘焕勇主讲人介绍说：“基于行业大模型，基础模型中所包含的垂直领域数据较少，容易产生幻觉，效果不如人意。”虽然 Llama 并非中文市场的最佳选择，但由于其率先开源并可商用，所积累的丰富行业落地案例非常珍贵

他以《基于 Llama 系列开源模型进行行业落地的实践范式与案例解读》为题，分享了 Llama 系列模型与其他开源模型的对比及其汉化机制，解读了基于 Llama 系列模型的领域微调模型案例、“基于LLama 系列模型+知识库增强”的落地应用案例。总结了做行业领域模型微调的算力条件、数据数量和质量要求、ROI 和场景等行业微调模型的必备条件，强调了大模型落地行业的形态可能是多源异构数据、文档智能分析、知识库规范。

线上开售！首场机器之心 AI 技术论坛圆满收官，这些大模型技术干货值得反复观看 LinkSoul.AI CEO、Chinese Llama 2 7B 项目发起人史业民

随着大模型技术的发展，多模态大模型越来越成为驱动具身智能和更好用户体验的关键，必将成为下一代人工智能技术的关键组成部分。基于 LLM 的改造是目前效果最好的多模态模型方案之一，具有极大的研究和实践价值。

史业民主讲了《基于 Llama 2 的多模态大模型技术与实践》的主题，分享了多模态模型的模式和原理，并深入探讨了视觉多模态大模型和语音多模态大模型的改进实践。他提到了旧模型如何支持新的模态，以及在考虑新能力时需要注意的重点。此外，他还介绍了多模态改进的几种方案，并强调了训练细节上需要注意的事项。史业民认为，多模态模型的最大挑战在于数据，他分享了一些基于模型生成图片或图文数据的方法和路径

线上开售！首场机器之心 AI 技术论坛圆满收官，这些大模型技术干货值得反复观看

中国的大型模型布道师苏洋是Llama 2 7B的贡献者

在本次活动调研中，参会者最关注的行业应用内容是"量化与微调"。苏洋在分享中介绍了《Llama 2 开源模型量化及低成本微调实战》的专题内容，包括开源模型生态与 Llama 生态的现状，主流的量化与微调方案，以及这两个事情的简易程度

“微调建议使用开源业界分享出来的 Sota 方案，而不是盲目追求原创。”他强调量化和微调在遵循各种原理的基础上，具有相对较强的实践性。实际的模型量化过程不是简单的一刀切，有非常多的维度、参数，在每一层、每一列都要进行最合理的量化或者转化，而微调也需要考虑具体的训练环境、硬件环境和基础系统环境，苏洋对此展开了深入讲解。

线上开售！首场机器之心 AI 技术论坛圆满收官，这些大模型技术干货值得反复观看

动手实践环节

在进行了详细的技术解读和案例解析之后，史业民和苏洋一起带领现场参会者，上手进行了大模型训练、量化和微调实践。

史业民重点讲解了基础模型选取、训练技巧和经验，包括基于一个 base model 从头训练和基于开源模型做词表扩充训练两条路径，以及对应的架构、模型大小、是否可商用、是否扩词表等筛选条件，并回答了 SFT 数据集等相关问题。

苏洋带领现场参会者完成了一系列操作，包括部署镜像、载入模型、加载数据集，设置 QLoRA 的参数，配置 SFT 参数，使用 transformer 参数包等。通过微调成功运行了一个私属大模型，帮助参会者更好地吸收了本次活动的内容干货

未来，我们将继续关注和追踪行业的最新动态和开发者的需求，持续举办高质量的大型技术活动，帮助开发者快速提升工程实践和创新应用能力，为迎接大模型时代做好准备。欢迎大家持续关注我们的AI技术论坛活动

以上是线上开售！首场机器之心 AI 技术论坛圆满收官，这些大模型技术干货值得反复观看的详细内容。更多信息请关注PHP中文网其他相关文章！

架构栈算法人工智能 transformer nlp https llama

声明：

本文转载于：jiqizhixin.com。如有侵权，请联系admin@php.cn删除

上一篇：小米有品上线AR体感运动主机 “15分钟消耗一碗米饭”下一篇：VLDB 2023奖项公布，清华、第四范式、NUS联合论文获最佳工业界论文奖

查看更多