智通财经App获悉,2月4日,阿里巴巴钱文推出专为本地开发和编程代理设计的开源加权语言模型Qwen3-Coder-Next。该模型基于 Qwen3-Next-80B-A3B-Base 构建,具有新的混合注意力架构和 MoE。通过大规模合成可执行任务、环境交互和强化学习来训练代理,以显着降低推理成本,同时获得强大的代理和调度能力。报道称,Qwen3-Coder-Next并不是基于简单的参数扩展,而是专注于扩展代理训练信号。阿里巴巴钱问使用大规模可验证的编程任务和可执行环境进行训练,让模型直接从环境反馈中学习。培训过程包括对以代理为中心的代码和数据进行持续的预培训。包含高质量代理轨迹的数据的监督拟合。专家培训在特定领域(软件工程、质量控制、Web/UX 等)。将专家功能提取到单个可部署模型中。本秘籍重点关注长期推理、工具使用和执行错误恢复,这对于现实世界的调度代理非常重要。
特别提示:以上内容(包括图片、视频,如有)由自有媒体平台“网易账号”用户上传发布。本平台仅提供信息存储服务。
注:以上内容(包括图片和视频,如有)由仅提供信息存储服务的社交媒体平台网易号用户上传并发布。