搜尋
首頁科技週邊人工智慧Kimi Chat內測啟動,火山引擎提供加速解決方案,支援Moonshot AI大模型服務的訓練和推理

10月9日,北京月之暗面科技有限公司(Moonshot AI)宣布在“长文本”领域实现了突破,推出了首个支持输入20万汉字的智能助手产品Kimi Chat。这是目前全球市场上能够产品化使用的大模型服务中所能支持的最长上下文输入长度,标志着Moonshot AI在这一重要技术上取得了世界领先水平。

火山引擎与Moonshot AI深度合作,为其独家提供高稳定性和高性价比的AI训练和推理加速解决方案,双方联合进行技术研发,共同推进大型语言模型在垂直领域和通用场景的应用落地。同时,Kimi Chat即将入驻火山引擎大模型服务平台——火山方舟,双方将持续在大模型生态领域为企业和消费者提供更丰富的AI应用。

相比当前市面上以英文为基础训练的大模型服务,Kimi Chat具备较强的多语言能力,例如,Kimi Chat在中文上具备显著优势,实际使用效果能够支持约20万汉字的上下文,2.5倍于Anthropic公司的Claude-100k(实测约8万字),8倍于OpenAI公司的GPT-4-32k(实测约2.5万字)。同时,Kimi Chat能够通过创新的网络结构和工程优化,在千亿参数下实现了无损的长程注意力机制,不依赖于滑动窗口、降采样、小模型等对性能损害较大的“捷径”方案。

在之前的采访中,Moonshot AI的创始人杨植麟曾经表示,无论是文字、语音还是视频,对海量数据的无损压缩可以实现高度智能。大模型的能力上限(即无损压缩比)是由单步能力和执行的步骤数共同决定的,前者与参数量有关,后者则是指上下文长度

应对大语言模型落地挑战,推动行业应用落地

Moonshot AI相信,通过增加上下文长度可以为大型模型应用带来全新的发展机遇,使其从LLM时代进入Long LLM (LLLM)时代,并与各行各业实现精准适配。在探索处理长文本场景的有效方法时,大型模型应用需要不断探索新的手段,以解决模型幻觉的问题并提高生成内容的可控性,同时寻求个性化的大型模型能力发展新路径。在大型语言模型的研发过程中,还需要克服算力资源需求的膨胀、任务工程的不稳定性、项目成本的高昂以及安全与信任等多个门槛,以提高模型的训练效率

为了解决上述问题,Moonshot AI携手火山引擎进行AI技术创新,在火山引擎机器学习平台veMLP上进行AGI实践。Moonshot AI充分利用GPU资源池,基于大规模预训练模型,实现每天数千卡规模的常态稳定训练,六个月内训练出千亿参数规模语言大模型Kimi Chat,解锁专业场景写作、超长文本理解分析、超长记忆的个性化对话、基于大量文档的知识问答等复杂场景,并成功在多家知名企业中应用。

Moonshot AI联合创始人周昕宇表示:“Moonshot AI专注于探索通用人工智能的边界,致力于将算力转化为智能的最优解。火山引擎具备国内领先的基础设施能力和算力储备,未来双方将进一步在AI算力基础设施和应用场景拓展等方面展开合作,共同推动人工智能技术的发展,为用户提供稳定、高效、智能的服务体验。”

通过使用火山引擎机器学习平台,大型模型的训练可以更加稳定和快速

火山引擎为大模型的构建和训练提供高稳定性和高性价比的AI训练和推理加速解决方案,其机器学习平台veMLP经过抖音等海量用户业务长期打磨,沉淀形成了全栈AI开发工程优化方案、任务故障自愈、实验可观测性等解决方案和最佳实践,提供高效、稳定、安全互信的一站式AI算法开发和迭代服务,让大模型训练更快、更稳、更高性价比。Moonshot AI基于火山引擎提供的超大规模AI训练和推理加速解决方案,帮助团队快速、稳定、低成本地实现大型语言模型的持续训练迭代、精调和推理。

1.IaaS算力和存储资源的规模化调度

搭建高性能计算集群,实现万卡级大模型训练、微秒级延迟网络,弹性计算可节省70%算力成本;利用vePFS TOS冷热分层加速方案,满足训练数据高吞吐的同时整体存储成本降低65%。针对大模型的文件系统读写 Pattern,共同研发专用文件缓存系统,大幅提升显卡利用率。

2. 保障PaaS计算集群的稳定性

优化超大训练集群的稳定性,提供硬件故障自愈优化和自主诊断能力,允许用户任务迅速重试续训,实现月级别的稳定训练,通过多机训练任务通信亲和性优化,减少RingAllReduce的跨交换机通信。

3.实验高可观测性

对于多个训练任务进行实验管理,通过可视化方式对比训练结果,以确定迭代上线的模型;利用完备的监控日志,助力业务调优3D并行参数,辅助定位训练故障

大型模型服務的安全互信方案

將可信任隱私運算與LLM應用結合,提供安全沙箱功能,完善開發人員權限管控。火山引擎也與Moonshot AI一起設計適合大模型研發習慣的工作流程,確保工作效率前提下,實現資料的分級存取,保證資料安全。

火山引擎智慧演算法負責人吳迪表示:「火山引擎一直秉持著聚焦技術、賦能夥伴、價值共生的合作態度,Moonshot AI擁有國內先進的大模型研發團隊,對AI技術有著深入的理解和應用經驗,雙方的合作將進一步在多模型生態服務領域為企業和消費者提供更豐富的AI應用。」

Kimi Chat内测启动,火山引擎提供加速解决方案,支持Moonshot AI大模型服务的训练和推理

火山方舟功能全景圖

目前,火山方舟已經吸引了智譜AI、Minimax、位元組跳動雲雀等多家AI科技公司和科研院所的大模型入駐。 Moonshot AI的大模型服務Kimi Chat也即將登陸火山方舟。火山引擎將與國內優秀的大模型服務商合作,提供模型訓練、推理、評測、精調等全方位的功能與服務,協助各行各業加速AI的發展。歡迎各位企業在火山方舟體驗大模型,火山方舟願意與大家共同成長!

以上是Kimi Chat內測啟動,火山引擎提供加速解決方案,支援Moonshot AI大模型服務的訓練和推理的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述
本文轉載於:搜狐。如有侵權,請聯絡admin@php.cn刪除
及時工程中的思想圖是什麼及時工程中的思想圖是什麼Apr 13, 2025 am 11:53 AM

介紹 在迅速的工程中,“思想圖”是指使用圖理論來構建和指導AI的推理過程的新方法。與通常涉及線性S的傳統方法不同

優化您的組織與Genai代理商的電子郵件營銷優化您的組織與Genai代理商的電子郵件營銷Apr 13, 2025 am 11:44 AM

介紹 恭喜!您經營一家成功的業務。通過您的網頁,社交媒體活動,網絡研討會,會議,免費資源和其他來源,您每天收集5000個電子郵件ID。下一個明顯的步驟是

Apache Pinot實時應用程序性能監視Apache Pinot實時應用程序性能監視Apr 13, 2025 am 11:40 AM

介紹 在當今快節奏的軟件開發環境中,確保最佳應用程序性能至關重要。監視實時指標,例如響應時間,錯誤率和資源利用率可以幫助MAIN

Chatgpt擊中了10億用戶? Openai首席執行官說:'短短幾週內翻了一番Chatgpt擊中了10億用戶? Openai首席執行官說:'短短幾週內翻了一番Apr 13, 2025 am 11:23 AM

“您有幾個用戶?”他扮演。 阿爾特曼回答說:“我認為我們上次說的是每週5億個活躍者,而且它正在迅速增長。” “你告訴我,就像在短短幾週內翻了一番,”安德森繼續說道。 “我說那個私人

pixtral -12b:Mistral AI'第一個多模型模型 - 分析Vidhyapixtral -12b:Mistral AI'第一個多模型模型 - 分析VidhyaApr 13, 2025 am 11:20 AM

介紹 Mistral發布了其第一個多模式模型,即Pixtral-12b-2409。該模型建立在Mistral的120億參數Nemo 12B之上。是什麼設置了該模型?現在可以拍攝圖像和Tex

生成AI應用的代理框架 - 分析Vidhya生成AI應用的代理框架 - 分析VidhyaApr 13, 2025 am 11:13 AM

想像一下,擁有一個由AI驅動的助手,不僅可以響應您的查詢,還可以自主收集信息,執行任務甚至處理多種類型的數據(TEXT,圖像和代碼)。聽起來有未來派?在這個a

生成AI在金融部門的應用生成AI在金融部門的應用Apr 13, 2025 am 11:12 AM

介紹 金融業是任何國家發展的基石,因為它通過促進有效的交易和信貸可用性來推動經濟增長。交易的便利和信貸

在線學習和被動攻擊算法指南在線學習和被動攻擊算法指南Apr 13, 2025 am 11:09 AM

介紹 數據是從社交媒體,金融交易和電子商務平台等來源的前所未有的速度生成的。處理這種連續的信息流是一個挑戰,但它提供了

See all articles

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

AI Hentai Generator

AI Hentai Generator

免費產生 AI 無盡。

熱門文章

R.E.P.O.能量晶體解釋及其做什麼(黃色晶體)
3 週前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.最佳圖形設置
3 週前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.如果您聽不到任何人,如何修復音頻
3 週前By尊渡假赌尊渡假赌尊渡假赌
WWE 2K25:如何解鎖Myrise中的所有內容
4 週前By尊渡假赌尊渡假赌尊渡假赌

熱工具

SAP NetWeaver Server Adapter for Eclipse

SAP NetWeaver Server Adapter for Eclipse

將Eclipse與SAP NetWeaver應用伺服器整合。

禪工作室 13.0.1

禪工作室 13.0.1

強大的PHP整合開發環境

SecLists

SecLists

SecLists是最終安全測試人員的伙伴。它是一個包含各種類型清單的集合,這些清單在安全評估過程中經常使用,而且都在一個地方。 SecLists透過方便地提供安全測試人員可能需要的所有列表,幫助提高安全測試的效率和生產力。清單類型包括使用者名稱、密碼、URL、模糊測試有效載荷、敏感資料模式、Web shell等等。測試人員只需將此儲存庫拉到新的測試機上,他就可以存取所需的每種類型的清單。

Dreamweaver CS6

Dreamweaver CS6

視覺化網頁開發工具

MantisBT

MantisBT

Mantis是一個易於部署的基於Web的缺陷追蹤工具,用於幫助產品缺陷追蹤。它需要PHP、MySQL和一個Web伺服器。請查看我們的演示和託管服務。