Google Deepmind的Gemma:深入研究开源LLMS
> AI景观正在嗡嗡作响,尤其是关于开源大语模型(LLM)的活动。 诸如Google,Meta和Twitter之类的科技巨头越来越拥抱开源开发。 Google DeepMind最近揭露了Gemma,这是一个使用与Google的Gemini Models相同的基础研究和技术建造的轻巧的开源LLM家族。本文探讨了Gemma模型,通过Cloud GPU和TPU的可访问性,并提供了一个逐步指南,以在角色扮演数据集上微调Gemma 7b-it模型。
>了解Google的Gemma
gemma(拉丁语中的“珍贵石头”)是一个主要由Google DeepMind开发的仅是解码的,文本到文本开放的模型。 受双子座模型的启发,Gemma设计用于轻巧的操作和广泛的框架兼容性。 Google已发布了两个Gemma尺寸的模型权重:2B和7B,每个型号都有预训练和指导调节的变体(例如Gemma 2b-it和Gemma 7b-it)。 Gemma的性能与其他开放模型相媲美,特别是在各种LLM基准测试中胜过Meta的Llama-2。
图像源
>访问Google的Gemma模型
访问Gemma很简单。 可以通过Huggingchat和Poe获得免费访问。 通过从拥抱面孔下载模型权重并利用GPT4ALL或LMSTUDIO来下载模型权重,也可以使用本地用法。 本指南重点是使用Kaggle的Free GPU和TPU进行推理。
>在TPU上运行Gemma推断>使用keras在TPU上运行gemma推断,请按照以下步骤:
- >导航到keras/gemma,选择“ gemma_instruct_2b_en”模型变体,然后单击“新笔记本”。 在右面板中,选择“ TPU VM VM V3-8”作为加速器。
- > 安装必要的python库:
!pip install -q tensorflow-cpu !pip install -q -U keras-nlp tensorflow-hub !pip install -q -U keras>=3 !pip install -q -U tensorflow-text
- 使用
- >
jax.devices()
验证tpu可用性 set - 作为keras后端:
jax
os.environ["KERAS_BACKEND"] = "jax"
> >使用 - 加载模型,并使用
keras_nlp
>函数生成文本。generate
>
图像源
用于使用变压器的GPU推断,请按照以下步骤:
>导航到Google/gemma,选择“变形金刚”,选择“ 7b-it”变体,然后创建一个新笔记本。
- 选择GPT T4 X2作为加速器。 >
- >安装所需软件包:
%%capture %pip install -U bitsandbytes %pip install -U transformers %pip install -U accelerate>使用用于VRAM管理的bitsandbytes使用4位量化的模型。
- 加载令牌。
- >创建一个提示,将其传递给模型,解码输出并显示结果。
- 。
>微调Google的Gemma:逐步指南>
>设置
hieunguyenminh/roleplay
安装必要的软件包:
- 导入所需的库。
%%capture %pip install -U bitsandbytes %pip install -U transformers %pip install -U peft %pip install -U accelerate %pip install -U trl %pip install -U datasets
- >使用您的API键登录以拥抱Face CLI。
- > 初始化重量和偏见(W&B)工作区。
- 加载数据集
- >加载角色扮演数据集的前1000行。
- 加载模型和令牌
添加适配器层
>添加一个Lora适配器层以有效微调模型。
训练模型
定义培训参数(超参数)并创建一个sfttrainer。 使用
。训练模型
保存模型>在本地保存微调模型,然后将其推到拥抱的脸上轮毂。
模型推理
使用微调模型生成响应。.train()
本节演示了如何加载基本模型和训练有素的适配器,将其合并并生成响应。
最终想法
Google发布的Gemma的发布表示向AI开源协作的转变。 本教程提供了使用和微调Gemma模型的综合指南,突出了开源开发和云计算资源的力量。 下一步是使用Langchain等框架构建您自己的基于LLM的应用程序。>
以上是微调Google Gemma:使用自定义说明增强LLM的详细内容。更多信息请关注PHP中文网其他相关文章!

聊天机器人诸如Chatgpt之类的聊天机器人举例说明了生成的AI,为项目经理提供了功能强大的工具来简化工作流程并确保项目按计划和预算范围内保持。 但是,在制作正确的提示时有效使用铰链。 精确,细节

定义人工智能(AGI)的挑战是重大的。 AGI进步的主张通常缺乏明确的基准,其定义是针对预定的研究方向而定制的。本文探讨了一种新颖的定义方法

IBM WATSONX.DATA:简化企业AI数据堆栈 IBM将watsonx.data定位为企业的关键平台,旨在加速精确且可扩展的生成AI解决方案。 这是通过简化投诉来实现的

在AI和材料科学领域的突破所推动的机器人技术的快速进步已准备好迎来人类机器人的新时代。 多年来,工业自动化一直是主要重点,但是机器人的功能迅速exp

Netflix 界面十年来最大更新:更智能、更个性化,拥抱多元内容 Netflix 周三宣布对其用户界面进行十年来最大规模的改版,不仅外观焕然一新,还增加了更多关于每个节目的信息,并引入了更智能的 AI 搜索工具,能够理解模糊的概念(例如“氛围”),以及更灵活的结构,以便更好地展示公司在新兴的视频游戏、直播活动、体育赛事和其他新型内容方面的兴趣。 为了紧跟潮流,新的移动端竖屏视频组件将使粉丝更容易滚动浏览预告片和片段,观看完整节目或与他人分享内容。这让人联想起无限滚动且非常成功的短视频网站 Ti

人工智能通用智能(AGI)的讨论日益增多,促使许多人思考当人工智能超越人类智能时会发生什么。这个时刻是近在咫尺还是遥遥无期,取决于你问谁,但我认为这并非我们应该关注的最重要的里程碑。哪些更早的人工智能里程碑会影响到每个人?哪些里程碑已经实现?以下是我认为已经发生的三件事。 人工智能超越人类弱点 在2022年的电影《社交困境》中,人文科技中心(Center for Humane Technology)的崔斯坦·哈里斯指出,人工智能已经超越了人类的弱点。这是什么意思?这意味着人工智能已经能够运用人类

Transunion的首席技术官Ranganath Achanta在2021年末加入公司后加入公司以来,率先进行了重大的技术转变。

建立信任至关重要,对于成功采用业务的AI是至关重要的。 考虑到业务流程中的人类因素,这尤其如此。 像其他任何人一样,员工对AI及其实施引起了人们的关注。 德勤研究人员是SC


热AI工具

Undresser.AI Undress
人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover
用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool
免费脱衣服图片

Clothoff.io
AI脱衣机

Video Face Swap
使用我们完全免费的人工智能换脸工具轻松在任何视频中换脸!

热门文章

热工具

SublimeText3 英文版
推荐:为Win版本,支持代码提示!

SecLists
SecLists是最终安全测试人员的伙伴。它是一个包含各种类型列表的集合,这些列表在安全评估过程中经常使用,都在一个地方。SecLists通过方便地提供安全测试人员可能需要的所有列表,帮助提高安全测试的效率和生产力。列表类型包括用户名、密码、URL、模糊测试有效载荷、敏感数据模式、Web shell等等。测试人员只需将此存储库拉到新的测试机上,他就可以访问到所需的每种类型的列表。

ZendStudio 13.5.1 Mac
功能强大的PHP集成开发环境

Dreamweaver Mac版
视觉化网页开发工具

WebStorm Mac版
好用的JavaScript开发工具