小米认领网传神秘顶尖模型：罗福莉承诺 MiMo-V2 系列将开源-网站运营-仿站网

当前位置：仿站网网站运营小米认领网传神秘顶尖模型：罗福莉承诺 MiMo-V2 系列将开源

3 月 19 日消息，代号为“Hunter Alpha”的神秘模型本月（3 月）在全球最大 API 聚合平台 OpenRouter 引发热议，一度登上大模型调用榜第一，不少网友猜测是“DeepSeek V4”早期版本。

今天（19 日）凌晨，小米正式认领“Hunter Alpha”，宣布推出三款大模型—— MiMo-V2-Pro & Omni & TTS，可限时免费体验一周。

随后，小米 MiMo 大模型负责人罗福莉发布长文，表示这是小米首款真正为智能体时代打造的全栈产品系列。

我称之为一次悄无声息的伏击—— 并非因为我们事先策划，而是因为从聊天模式到智能代理模式的转变发生得太快，连我们自己都难以置信。在这两者之间，经历了一个既激动人心又痛苦不堪，同时又引人入胜的过程。
1T 基础模型几个月前就开始训练了。最初的目标是提高长上下文推理的效率。混合注意力机制带来了真正的创新，却又不至于过度扩张 —— 事实证明，它正是智能体时代最合适的基石。1M 上下文窗口。MTP 推理实现超低延迟和成本。这些架构决策并非一时兴起，而是我们在需要之前就构建的结构性优势。
真正改变一切的是我第一次体验到复杂的智能体框架 —— 我称之为“精心编排的语境”。第一天我就震惊了。我试图说服团队使用它，但没有成功。于是我下达了一条强硬指令：MiMo 团队中，明天对话次数少于 100 次的成员可以辞职 / 退出。这招奏效了。一旦团队的想象力被智能体系统的功能所激发，这种想象力便直接转化为研究速度。
人们问我们为什么发展如此迅速。我在构建 DeepSeek R1 时亲身经历了这一点。我的真实总结是：
—— 骨干网和基础设施研究周期很长。你需要一年的战略决心才能看到回报。
—— 训练后敏捷性是一种不同的能力：产品直觉驱动评估，迭代周期缩短，范式转变及早发生。
—— 以及不变的：好奇心、敏锐的技术直觉、果断的执行力、全身心的投入。
—— 还有一点很容易被低估：对你所创造的世界的真挚热爱。

罗福莉还承诺，新的 MiMo-V2 系列模型会开源—— 当模型足够稳定，值得开源的时候。

转载请说明出处内容投诉
仿站网 » 小米认领网传神秘顶尖模型：罗福莉承诺 MiMo-V2 系列将开源