搜索
首页科技周边人工智能超越GPT-4,斯坦福团队手机可跑的大模型火了,一夜下载量超2k

在大模型落地应用的过程中,端侧 AI 是非常重要的一个方向。

近日,斯坦福大学研究人员推出的 Octopus v2 火了,受到了开发者社区的极大关注,模型一夜下载量超 2k。

20 亿参数的 Octopus v2 可以在智能手机、汽车、个人电脑等端侧运行,在准确性和延迟方面超越了 GPT-4,并将上下文长度减少了 95%。此外,Octopus v2 比 Llama7B RAG 方案快 36 倍。超越GPT-4,斯坦福团队手机可跑的大模型火了,一夜下载量超2k

不少网友感叹:设备端 AI 智能体的时代到来了!

超越GPT-4,斯坦福团队手机可跑的大模型火了,一夜下载量超2k

  • 论文:Octopus v2: On-device language model for super agent

  • 论文地址:https://arxiv.org/abs/2404.01744

  • 模型主页:https://huggingface.co/NexaAIDev/Octopus-v2

模型概述

Octopus-V2-2B 是一种开源语言模型,拥有20亿参数,专为Android API量身定制。它可以在Android设备上无缝运行,并将实用性扩展到从Android系统管理到多个设备的编排等各种应用程序。

超越GPT-4,斯坦福团队手机可跑的大模型火了,一夜下载量超2k

通常,检索增强生成 (RAG) 方法需要对潜在函数参数进行详细描述(有时需要多达数万个输入 token)。基于此,Octopus-V2-2B 在训练和推理阶段引入了独特的函数 token 策略,不仅使其能够达到与 GPT-4 相当的性能水平,而且还显著提高了推理速度,超越了基于 RAG 的方法,这使得它对边缘计算设备特别有利。

超越GPT-4,斯坦福团队手机可跑的大模型火了,一夜下载量超2k

Octopus-V2-2B 能够在各种复杂场景中生成单独的、嵌套的和并行的函数调用。

数据集

为了训练、验证和测试阶段采用高质量数据集,特别是实现高效训练,研究团队用三个关键阶段创建数据集:

  • 生成相关的查询及其关联的函数调用参数;

  • 由适当的函数组件生成不相关的查询; 

  • 通过 Google Gemini 实现二进制验证支持。

超越GPT-4,斯坦福团队手机可跑的大模型火了,一夜下载量超2k

研究团队编写了 20 个 Android API 描述,用于训练模型。下面是一个 Android API 描述示例:

def get_trending_news (category=None, region='US', language='en', max_results=5):"""Fetches trending news articles based on category, region, and language.Parameters:- category (str, optional): News category to filter by, by default use None for all categories. Optional to provide.- region (str, optional): ISO 3166-1 alpha-2 country code for region-specific news, by default, uses 'US'. Optional to provide.- language (str, optional): ISO 639-1 language code for article language, by default uses 'en'. Optional to provide.- max_results (int, optional): Maximum number of articles to return, by default, uses 5. Optional to provide.Returns:- list [str]: A list of strings, each representing an article. Each string contains the article's heading and URL.    """

模型开发与训练

该研究采用 Google Gemma-2B 模型作为框架中的预训练模型,并采用两种不同的训练方法:完整模型训练和 LoRA 模型训练。

在完整模型训练中,该研究使用 AdamW 优化器,学习率设置为 5e-5,warm-up 的 step 数设置为 10,采用线性学习率调度器。

LoRA 模型训练采用与完整模型训练相同的优化器和学习率配置,LoRA rank 设置为 16,并将 LoRA 应用于以下模块:q_proj、k_proj、v_proj、o_proj、up_proj、down_proj。其中,LoRA alpha 参数设置为 32。

对于两种训练方法,epoch 数均设置为 3。

使用以下代码,就可以在单个 GPU 上运行 Octopus-V2-2B 模型。

from transformers import AutoTokenizer, GemmaForCausalLMimport torchimport timedef inference (input_text):start_time = time.time ()input_ids = tokenizer (input_text, return_tensors="pt").to (model.device)input_length = input_ids ["input_ids"].shape [1]outputs = model.generate (input_ids=input_ids ["input_ids"], max_length=1024,do_sample=False)generated_sequence = outputs [:, input_length:].tolist ()res = tokenizer.decode (generated_sequence [0])end_time = time.time ()return {"output": res, "latency": end_time - start_time}model_id = "NexaAIDev/Octopus-v2"tokenizer = AutoTokenizer.from_pretrained (model_id)model = GemmaForCausalLM.from_pretrained (model_id, torch_dtype=torch.bfloat16, device_map="auto")input_text = "Take a selfie for me with front camera"nexa_query = f"Below is the query from the users, please call the correct function and generate the parameters to call the function.\n\nQuery: {input_text} \n\nResponse:"start_time = time.time () print ("nexa model result:\n", inference (nexa_query)) print ("latency:", time.time () - start_time,"s")

评估

Octopus-V2-2B 在基准测试中表现出卓越的推理速度,在单个 A100 GPU 上比「Llama7B RAG 解决方案」快 36 倍。此外,与依赖集群 A100/H100 GPU 的 GPT-4-turbo 相比,Octopus-V2-2B 速度提高了 168%。这种效率突破归功于 Octopus-V2-2B 的函数性 token 设计。

超越GPT-4,斯坦福团队手机可跑的大模型火了,一夜下载量超2k

Octopus-V2-2B 不仅在速度上表现出色,在准确率上也表现出色,在函数调用准确率上超越「Llama7B RAG 方案」31%。Octopus-V2-2B 实现了与 GPT-4 和 RAG GPT-3.5 相当的函数调用准确率。

超越GPT-4,斯坦福团队手机可跑的大模型火了,一夜下载量超2k

感兴趣的读者可以阅读论文原文,了解更多研究内容。

以上是超越GPT-4,斯坦福团队手机可跑的大模型火了,一夜下载量超2k的详细内容。更多信息请关注PHP中文网其他相关文章!

声明
本文转载于:机器之心。如有侵权,请联系admin@php.cn删除
关于Python切片操作的所有内容关于Python切片操作的所有内容May 14, 2025 am 01:48 AM

对于每个Python程序员,无论是在数据科学和机器学习的领域还是软件开发领域,Python切片操作都是最有效,最多功能和强大的操作之一。 Python切片语法

易于理解的解释如何使用Chatgpt创建报价!易于理解的解释如何使用Chatgpt创建报价!May 14, 2025 am 01:44 AM

AI技术的发展提高了业务效率。特别引起关注的是使用AI创建估计值。 Openai的AI助理Chatgpt有助于改善估计创建过程并提高准确性。 本文说明了如何使用chatgpt创建报价。我们将通过与Excel VBA的合作,系统开发项目的应用,AI实施的好处以及未来的前景来介绍效率提高。了解如何通过Chatgpt提高运营效率和生产力。 OP

什么是chatgpt pro(O1 pro)?解释您可以做什么,价格以及其他计划之间的差异!什么是chatgpt pro(O1 pro)?解释您可以做什么,价格以及其他计划之间的差异!May 14, 2025 am 01:40 AM

OpenAI的最新订阅计划Chatgpt Pro提供了高级AI问题解决! 2024年12月,OpenAI宣布了其顶级计划,即Chatgpt Pro,每月费用为200美元。在本文中,我们将解释其功能,尤其是“ O1 Pro模式”的性能和OpenAI的新计划。对于旨在利用高级AI的研究人员,工程师和专业人士来说,这是必读的。 Chatgpt Pro:释放高级AI功率 Chatgpt Pro是Openai的最新,最先进的产品。

我们说明如何创建和纠正使用ChatGpt申请的动机!也介绍提示我们说明如何创建和纠正使用ChatGpt申请的动机!也介绍提示May 14, 2025 am 01:29 AM

众所周知,寻找工作时申请的动机的重要性是众所周知的,但是我敢肯定,有许多求职者努力创造它。在本文中,我们将介绍使用最新的AI技术Chatgpt创建动机声明的有效方法。我们将仔细解释完成动力的具体步骤,包括自我分析和公司研究的重要性,使用AI时要注意的要点,以及如何将您的经验和技能与公司需求相匹配。通过本文,学习创造令人信服的动力并旨在成功寻找工作的技能! Openai的最新AI代理商“ Open

Chatgpt有什么惊人的?对其特征和优势的详尽解释!Chatgpt有什么惊人的?对其特征和优势的详尽解释!May 14, 2025 am 01:26 AM

chatgpt:惊人的自然语言处理AI以及如何使用它 Chatgpt是Openai开发的创新自然语言处理AI模型。它吸引了世界各地的关注,作为一种高级工具,可以与人类进行自然对话,并且可以在各种领域中使用。它出色的语言理解,庞大的知识,学习能力和灵活的可操作性有可能改变我们的生活和企业。 在本文中,我们将解释Chatgpt和使用特定示例的主要特征,并探讨AI将解锁的未来可能性。揭开Chatgpt的可能性和吸引力,并享受生活和业务

[使用AI生成的图像]如何与Chatgpt制作和打印Bikkuriman巧克力贴纸[使用AI生成的图像]如何与Chatgpt制作和打印Bikkuriman巧克力贴纸May 14, 2025 am 01:16 AM

释放童年回忆!用ChatGPT打造你的专属ビックリマン风贴纸!你是否还记得儿时收集ビックリマン贴纸的乐趣?如今,借助ChatGPT的强大图像生成功能,无需绘画技巧,也能轻松创造出独一无二的ビックリマン风格角色!本文将手把手教你如何利用ChatGPT,将照片或插画一键变身成充满怀旧气息的闪亮贴纸。从详细的提示词示例,到贴纸制作和打印步骤,以及在社交媒体上分享的创意点子,甚至包括版权和肖像权等注意事项,我们都将一一讲解。 目录 为什么ChatGPT能制作ビックリマン风图像? ChatGPT图像生成功

当Chatgpt显示不正确时,易于理解原因和解决方案!当Chatgpt显示不正确时,易于理解原因和解决方案!May 14, 2025 am 01:00 AM

您是否曾经在Chatgpt中出现过显示错误或故障?可能会发生多种问题,例如冻结,响应延迟和意外行为。本文以易于理解的方式解释了CHATGPT显示问题的原因和解决方案。我们将提出特定的解决方案,从重新加载浏览器到改善网络环境,因此,如果您在显示问题方面遇到麻烦,请随时使用它。 从2024年12月12日晚上9点左右(包括通过API),对Chatgpt的访问一直在进行中。请检查OpenAI身份以获取最新信息。 c

脱衣服免费色情AI工具网站脱衣服免费色情AI工具网站May 13, 2025 am 11:26 AM

https://undressaitool.ai/是功能强大的移动应用程序,具有成人内容的高级AI功能。立即创建AI生成的色情图像或视频!

See all articles

热AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover

AI Clothes Remover

用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool

Undress AI Tool

免费脱衣服图片

Clothoff.io

Clothoff.io

AI脱衣机

Video Face Swap

Video Face Swap

使用我们完全免费的人工智能换脸工具轻松在任何视频中换脸!

热门文章

热工具

Dreamweaver CS6

Dreamweaver CS6

视觉化网页开发工具

SublimeText3 Mac版

SublimeText3 Mac版

神级代码编辑软件(SublimeText3)

SublimeText3汉化版

SublimeText3汉化版

中文版,非常好用

Dreamweaver Mac版

Dreamweaver Mac版

视觉化网页开发工具

SublimeText3 英文版

SublimeText3 英文版

推荐:为Win版本,支持代码提示!