上证报中国证券网讯(记者 孙小程)6月23日,记者自MiniMax获悉,该公司通过近期举办的“技术发布周”,宣告其在基座模型、多模态技术、通用智能体等领域的突破。此次发布的核心成果包括:开源大规模混合架构推理模型MiniMax-M1、视频生成模型Hailuo-02、通用智能体MiniMax Agent、视频创作助手Hailuo Agent以及音色设计功能Voice Design。
MiniMax M1为全球首个开源大规模混合架构推理模型,采用“闪电注意力”混合架构与CISPO算法,支持100万上下文的输入和8万Token的推理输出。技术报告显示,在进行8万Token深度推理时,MiniMax M1所需算力仅为DeepSeek R1的约30%。
Hailuo 02则在多模态领域实现突破,其创新的NCR架构,在将模型参数和训练数据量分别提升3倍和4倍的同时,将效率提升2.5倍。MiniMax透露,从2024年8月时提供展示视频生成模型的Demo网页,到后续快速推出海螺视频产品,其至今为止已经帮助来自全球200个国家的创作者生成了超过3.7亿个视频。
MiniMax Agent则是公司对“AI能力”的深刻思考和交付回答,可以完成长程复杂任务,多步规划出解决方案、灵活拆解任务需求并能执行多个子任务,从而交付最终结果。据记者了解,在MiniMax内部,该产品已经被使用了两个月,逐渐为内部超过50%的员工日常使用。
Hailuo Video Agent则是国内首个能实现“成片直出”的视频创作Agent,可以自动分析、构思并生成完整视频内容。MiniMax透露,海螺视频Agent将通过三阶段进化,目前已经实现第一阶段能力,第二阶段的视频Agent创作工具将于2025年夏季推出。
此次发布的模型还包含语音模型Speech 02上的一个功能更新——Voice Design音色设计。Speech-01/02两代模型已经生成了累计超过1.5亿小时的语音,与超30个国家客户实现了合作落地。
在业内看来,这一系列密集发布不仅是对其技术积累的集中展示,更是在全球AI竞赛进入“下半场”的关键节点,为行业发展路径和竞争格局注入了全新变量。
业内人士认为,从底层基础模型优化,到开创性的线性注意力混合架构,再到CISPO和NCR等算法与架构的持续迭代,MiniMax的创新呈现出一种“环环相扣、层层递进”的良性循环。这种“倒逼出来的创新能力”,证明了通过算法和架构的深度优化中国股票配资网股票,可以打破“算力-资本”的壁垒。
广源优配提示:文章来自网络,不代表本站观点。