MiniMax正式推出M2.5,并将其定位为“原生代理产品级机型”

2月13日,MiniMax正式宣布推出新一代MiniMax M2.5文字机型。报道称,该模型定位为“原生Agent生产级模型”,目前已上线MiniMax Agent平台,支持全球开源和本地化部署。您会发现MiniMax M2.5针对编程、工具使用和办公等场景进行了优化。在编程功能方面,该模型在 SWE-Bench Verified 列表中得分为 80.2%,在 Multi-SWE-Bench 中得分为 51.3%。 MiniMax 表示,M2.5 展示了“原生规范功能”,这意味着它可以在编码之前主动分解架构和功能计划。在工具调用和搜索功能方面,新版本在BrowseComp等任务上的性能较上一代提升了约20%。此外,在办公场景中,我们的模型在 GDPval-MM(评估框架)中与传统模型相比,平均胜率达到 59.0%适用于Word、PPT、Excel财务模型等高级场景。根据官方数据,在推理速度和成本控制方面,M2.5 Lightning版本支持超过100 TPS的输出速度,大约是一些主流型号的两倍。从成本来看,入场价格约为 0.3 美元/100 万枚代币,退出价格约为 2.4 美元/100 万枚代币。 MiniMax 估计,在理想条件下,理论上,四名特工可以连续工作一年,成本为 10,000 美元。人们相信,性能的提高和成本的降低可以改变大规模代理部署的经济模型。在技​​术层面上,M2.5迭代受益于大规模代理强化学习(RL缩放)。报道称,MiniMax开发了自己的Forge框架,并将引擎和训练代理分开,导致训练量增加了约40倍。实现了更快的处理速度。同时,CISPO优化和工艺流程算法层面采用奖励机制,旨在缓解长上下文场景下的信用分配问题,寻求有效性和响应速度之间的平衡。 M2.5 将于 2 月 12 日发布,今天开始对本地化部署提供全球开源支持。数据显示,连接后不到一天,用户已在平台上创建了超过1万个专家座席。 MiniMax表示,通过构建不断扩大的智能体生态系统,希望推动智能体应用在调度、办公、创作等领域的进一步发展。 (袁宁)

文章已创建 236

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

相关文章

开始在上面输入您的搜索词,然后按回车进行搜索。按ESC取消。

返回顶部