1月15日,澎湃科技发布报道,指出MiniMax上海稀宇科技有限公司,作为AI领域的独角兽企业,推出了名为01的新系列模型,并对外公布了源代码。这一举措在人工智能领域引起了广泛关注。该系列包括MiniMax - Text - 01和MiniMax - VL - 01两款模型。

模型输入功能强大

MiniMax宣称,其01系列模型在处理超长文本输入时展现出卓越的效率。这一技术突破对于人工智能领域的进步至关重要。该功能能够满足多样化的复杂内容处理需求,尤其在科研、内容创作和信息整合等关键领域展现出巨大的应用潜力。这一特点彰显了模型的强大适应性,并能够为用户提供更加全面和细致的服务。以史诗级的长篇文学作品为例,这一功能的优势尤为显著。

当前,众多AI模型在处理长文本方面面临挑战。然而,MiniMax - 01系列模型在该领域实现了显著突破。这一成果对AI行业产生了积极推动,并引入了创新思维,拓展了新的发展方向。

独特的注意力机制

2025年AI Agent将迎来爆发?MiniMax开源新一代模型,颠覆传统Transformer架构  第1张

MiniMax-01系列模型首次广泛采用线性注意力机制,这一做法表明Transformer架构并非唯一路径。在传统的Transformer架构中,自注意力机制的计算成本较高,这一问题一直困扰着研究者。MiniMax模型经过深入研究,开发出多种技术以提升计算效率,包括稀疏注意力、低秩分解和线性注意力等。特别是线性注意力技术的应用,大幅降低了Transformer的计算复杂度,显著提高了模型处理长输入的效率。这一架构创新对提升模型性能和处理能力具有重要意义。

在实施阶段,对于处理大量数据的大型项目,减少计算复杂度能有效降低资源消耗和时间成本,从而显著提升项目整体推进速度。

性能在多项评测领先

MiniMax - 01系列模型在多任务测试中展现了卓越表现。该模型参数量达到4560亿,单次激活量高达459亿。它能够有效处理长达400万token的文本内容。MiniMax - 01在长文本处理上优于GPT - 4o等顶尖模型。其处理能力是GPT - 4o的32倍,是Claude - 3.5 - Sonnet的20倍,这一数据充分体现了其强大的性能。

构建智能应用场景中,该性能扮演着极其关键的角色。以高级智能客服系统的构建为例,在应对大量繁复的咨询内容时,MiniMax - 01系列模型的高效性能显得尤为突出。

应对Agent发展需求

MiniMax预测,2025年对Agent技术的快速发展极为关键。无论是单一系统还是组合系统,Agent的进步都迫切需要更全面的背景资料。基于此,MiniMax推出了01系列模型,致力于打造复杂Agent的基本功能。这一行动将为未来构建更智能、更复杂的Agent系统提供支持,进而促进人工智能技术向更高层次发展。

在当前的实际应用场景中,无论是多智能体协同的军事模拟系统还是城市交通指挥系统,都显示出对较长的上下文信息的依赖性。所提出的模型恰好具备了这一功能,且其可行性得到了验证。

API定价较低

MiniMax透露,受多因素影响,他们提供API服务的价格处于行业最低水平。具体来看,每百万输入token的费用为一元,每百万输出token为八元。这一策略显著吸引了众多企业和个人开发者。低成本使得更多小型团队和个人能够参与到基于MiniMax-01系列模型的开发项目中。

创业企业与独立开发者普遍关注开发成本,MiniMax - 01系列模型API的低成本定价策略明显提升了其市场竞争力。

模型已投入应用

海螺AI产品已融入MiniMax - 01系列开源模型,并在全球范围内提供相关服务。企业和个人开发者可通过MiniMax开放平台获取API接口。这一举措标志着技术成果向具体产品与服务的成功转化。目前,全球开发者可利用这一先进模型进行创新与探索。

全球众多开发者正在积极寻求性能卓越且价格合理的AI模型,MiniMax - 01系列模型为此提供了新的解决方案。业界普遍关注MiniMax - 01系列模型对AI领域革新的推动作用。欢迎在评论区发表您的看法,并给予点赞及分享。