小米认领网传神秘顶尖模型:罗福莉承诺 MiMo-V2 系列将开源

查看付费资源请通过右侧购买区域进行购买!

3 月 19 日消息,代号为“Hunter Alpha”的神秘模型本月(3 月)在全球最大 API 聚合平台 OpenRouter 引发热议,一度登上大模型调用榜第一,不少网友猜测是“DeepSeek V4”早期版本。

今天(19 日)凌晨,小米正式认领“Hunter Alpha”,宣布推出三款大模型—— MiMo-V2-Pro & Omni & TTS,可限时免费体验一周。

随后,小米 MiMo 大模型负责人罗福莉发布长文,表示这是小米首款真正为智能体时代打造的全栈产品系列。

我称之为一次悄无声息的伏击—— 并非因为我们事先策划,而是因为从聊天模式到智能代理模式的转变发生得太快,连我们自己都难以置信。在这两者之间,经历了一个既激动人心又痛苦不堪,同时又引人入胜的过程。

1T 基础模型几个月前就开始训练了。最初的目标是提高长上下文推理的效率。混合注意力机制带来了真正的创新,却又不至于过度扩张 —— 事实证明,它正是智能体时代最合适的基石。1M 上下文窗口。MTP 推理实现超低延迟和成本。这些架构决策并非一时兴起,而是我们在需要之前就构建的结构性优势。

真正改变一切的是我第一次体验到复杂的智能体框架 —— 我称之为“精心编排的语境”。第一天我就震惊了。我试图说服团队使用它,但没有成功。于是我下达了一条强硬指令:MiMo 团队中,明天对话次数少于 100 次的成员可以辞职 / 退出。这招奏效了。一旦团队的想象力被智能体系统的功能所激发,这种想象力便直接转化为研究速度。

人们问我们为什么发展如此迅速。我在构建 DeepSeek R1 时亲身经历了这一点。我的真实总结是:

  • —— 骨干网和基础设施研究周期很长。你需要一年的战略决心才能看到回报。

  • —— 训练后敏捷性是一种不同的能力:产品直觉驱动评估,迭代周期缩短,范式转变及早发生。

  • —— 以及不变的:好奇心、敏锐的技术直觉、果断的执行力、全身心的投入。

  • —— 还有一点很容易被低估:对你所创造的世界的真挚热爱。

罗福莉还承诺,新的 MiMo-V2 系列模型会开源—— 当模型足够稳定,值得开源的时候。


转载请说明出处内容投诉
仿站网 » 小米认领网传神秘顶尖模型:罗福莉承诺 MiMo-V2 系列将开源

发表评论

您需要后才能发表评论

仿站网专注帝国cms仿站,Zblog仿站,Wordpress仿站服务,专业+效率+售后保障

关于我们 联系客服
 
QQ在线咨询
客服热线
139-3511-2134