此外,为了考察模型“从零到一”构建完整、可运行应用程序的全栈能力,MiniMax构建并开源了全新基准测试VIBE。MiniMax-M2.1在VIBE综合榜单中拿到 88.6的平均分 ,得分接近Claude Opus 4.5, ...