MiniMax新模型比肩海外头部国产大模型开启“月更”-[长运]体育器材-注册登录测速一站式平台

新闻分类

企业新闻

新闻搜索

新闻详情

MiniMax新模型比肩海外头部国产大模型开启“月更”

作者：管理员发布于：2026-02-15 23:50 文字：【大】【中】【小】

　　2月13日，MiniMax加入国产大模型的春节档“上新”阵营。其最新发布的M2.5模型提升了智能体任务处理速度，媲美海外头部模型，而调用价格却远低于同等级产品。

　　官方数据显示，M2.5优化了模型对复杂任务的拆解能力和思考过程中token的消耗，比上一个版本M2.1完成任务的速度快了37%，从平均31.3分钟缩短至22.8分钟。这一耗时情况与Anthropic于2月初发布的Claude Opus 4.6模型的22.9分钟基本持平。

　　在第三方评测中，M2.5同样展现出竞争力。根据BridgeBench的测试，M2.5在编程任务上的得分仅比Opus 4.6低0.4分，但调用价格只有Opus 4.6的1/8。

　　MiniMax公布的价格显示，在每秒输出100个token的情况下，连续工作一小时只需要1美元，而在每秒输出50个token的情况下，只需要0.3美元。也就是说，1万美元可以让4个智能体（Agent）连续工作一年。“M2.5提供了经济上几乎无限制地构建和运营Agent的可能性。”MiniMax在官网上写道。

　　海外市场也迅速给予反馈。硅谷风险投资公司Menlo Ventures合伙人Deedy Das评价称：“MiniMax M2.5超便宜，非常适合编程。”面向云端编程智能体的开放平台OpenHands在社交平台上写道：“目前，在可通过API使用的模型中，本质上是两强争霸Opus代表最高能力上限，M2.5则以更低成本提供较高能力。”OpenHands特别提到，M2.5在需要长时间运行的任务上表现尤为出色，例如从零开始构建应用程序。

　　除编程能力外，M2.5在 Word、PPT、Excel金融建模等办公高阶场景中，也取得显著的能力提升。据介绍，MiniMax前期与金融、法律、社会科学等领域的资深从业者展开了深度合作，由他们提出需求、反馈问题、参与标准定义，并直接构建数据，将行业的隐性知识带入到模型的训练流程之中。

　　过去100多天的时间内，MiniMax保持近乎“每月一更”的节奏，陆续推出M2、M2.1和M2.5版本。从编程领域代表性基准测试SWE-Bench Verified的成绩来看，相比Claude、GPT和Gemini等模型系列的进步速度，M2系列模型的性能提升速度更为显著。

　　谈及模型能力持续跃升的关键因素，MiniMax将其归因于大规模强化学习。团队围绕着 Agent RL（智能体强化学习）的框架和算法，搭建起完整的技术体系。

　　M2.5的发布，也成为国产大模型公司春节前夕争先恐后“交卷”的最新一例。此前2月12日，字节跳动最新视频生成模型Seedance2.0宣布接入旗下AI产品豆包和即梦，智谱则上线了旗舰级新模型GLM-5，同样主打编程等方面的能力。而DeepSeek则被发现已开始测试最高100万Token的上下文长度，支持处理超长文本，进一步激发外界对传闻中DeepSeek V4的期待。

　　DeepSeek在上一个春节引发全球震撼，一年之后，国产大模型以集体“上新”的形式引爆“AI春节档”，无疑令全球AI竞赛更加白热化。

上一篇：沉醉“鞠婧祎造梦”：一场视听盛宴免费解锁无限精彩
下一篇：LD和LED二者区别？磷化铟在光通信领域起什么作用？美股AxT股价暴涨核心逻辑是什么？铟的高光时刻也许就要来临了！

MiniMax新模型比肩海外头部国产大模型开启“月更”

沉醉“鞠婧祎造梦”：一场视听盛宴免费解锁无限精彩

阿迪达斯轻商级哑铃凳 D300 重磅上市

无补偿强砍3万多棵国槐树？调查结果公布！来听新闻

互感器综合特性测试仪执行标准

体外膜氧合（ECMO）循环套包注册审查指导原则正式发布（附全文）

符洁文：美国砍掉一条烂尾的磁悬浮线路而中国又有新品“上架”

京西智行：补全产业“最后一块拼图”成就中国智能汽车

富阳银湖科技城高层合院山水颐萃别院(营销中心)-山水颐萃别院最新资讯-聚焦-(2025@)官方网站