
没人能料到,OpenClaw的热度从年初延续到了今天。国内大模型厂商也纷纷加快了在“AI 养虾”赛道的布局,来自上海的MiniMax上个月末,便在其Agent平台上推出了 MaxClaw模式,依托M2.5大模型,10秒内就能部署一个24小时待命的私人助理。
这也让人更加期待,MiniMax全新一代大模型发布之后,又将在以“养虾”为代表的Agent场景中带来怎样的新玩法。
昨天(3月18日),它来了!新亮相MiniMax M2.7,给了人们意料之中的惊喜——覆盖多场景、具备系统级能力的“全能选手”成型了。更关键的是,M2.7是MiniMax第一个模型深度参与迭代自己的模型!

指令遵循和多智能体协作能力跃升
从2.5到2.7,就模型的发展而言,看似只是一小步。那M2.7有哪些硬核的亮点?
无疑,首先指令遵循和多智能体协作的跃升,面对海量技能(Skills)的复杂环境,M2.7调用得极其稳健。官方测试中,在包含40个复杂技能的场景下,它仍然可以保持97%的遵循率,并且在MM-Claw“龙虾测试”里正确率达62.7%。
另外,它还原生自带多智能体协作,不用外部框架也能组建Agent Teams。模型能稳定锚定身份并自主决策,智能体之间互相配合就能把长流程任务拆解执行完。
Agent Teams协作模拟演示
顺着底层执行力往下,是代码能力的直观爆发——它从单纯的代码生成,拓展到了代码重构、防漏洞及复杂排障等高阶领域。
切换到办公场景,M2.7处理复杂Office文档同样干脆,支持Excel表格、Word文档和PPT的复杂多轮修改。以真实的某公司案例为例,丢给它年报和沟通会资料,它能自主比对研报并构建营收预测模型;分析完数据后,它能直接生成Excel透视表,“顺手”写出Word版调研报告,并基于模板排版出能直接拿来汇报的PPT。
业内人士评价说,过去,大模型大多充当的还是“最强大脑”,如今MiniMax释出的是一个拥有“手脚、工具和记忆”的多面手系统。
大模型开始自我进化了
当模型有能力自己构建工具链、优化执行路径并在反馈中持续重写自身策略时,它的定位就有了根本性的改变:它不再只是被优化的对象,而成为优化过程的一部分。
“M2.7已经具备了自我构建复杂Agent Harness的能力。”研发人员向新民晚报记者透露。所谓Agent Harness,其实就是模型和现实电脑环境打交道的工具箱和操作台,OpenClaw就可以被理解为是Harness的一种。简言之,以前的模型通常是人给什么工具就用什么,但现在M2.7已经能自己造工具了;而且它还能主动迭代Harness本身,给整个工具箱来一波升级。
在MiniMax内部,Agent Harness的价值已经得到了验证,仅用1人、4天、零代码,M2系列模型就以“架构师”身份自主搭建起完整的开发Agent系统,并在此基础上构建覆盖数据、训练、评测与记忆的研究型Agent体系。人类工程师只设定方向,模型完成构建,形成了“用AI迭代AI”的自我进化闭环。

新民晚报记者了解到,MiniMax设计和实现了一个简易的脚手架来引导Agent进行自主优化,核心的模块包括短时记忆、自反馈以及自优化。具体来讲,Agent完成每轮迭代后会形成一个短时记忆文件,同时对当前轮次的结果进行自反馈,从而给下一轮次提供潜在的优化方向,下一轮次基于所有历史轮次的记忆及自反馈链进行下一步的自优化。
值得一提的是,得益于模型自身演化出来的自迭代能力,M2.7的科研表现显著提升。它向以Kaggle竞赛为基础构建的MLE Bench评测体系发起了挑战,其中在MLE Lite的22道高难度竞赛题目中, 一举拿下了9枚金牌。
让模型稳定融入真实工作流
很多人说,M2.7的发布,对于这家完成资本跃升不久的大模型独角兽而言,或许只是其马拉松里的一个既定节点。

从此次“上新”的重点来看,M2.7在试图回答一个问题:模型究竟能不能稳定融入真实的工作流。恰如MiniMax创始人、CEO闫俊杰所坚持的,大模型的真正价值不在于制造对立,而在于如何作为一种日常化的工具,去分担那些繁琐的“脏活累活”。
眼下,整个行业都在紧盯硅谷风向,跟着一起疯狂“吃虾”,忙着适配OpenClaw来追赶热度。当然,跟进开源脚手架确实能快速补齐体验,但这依然停留在教模型怎么用人类工具的层面。
但就在此时,MiniMax已经切入了下一个更重要的论题,也就是让模型自己造工具搞研发,甚至成为自身研发链条的一环——这种主动进化的能力,或许将成为下一代大模型核心竞争力的分水岭。
金领速配提示:文章来自网络,不代表本站观点。