AI热潮未退!稀宇科技副总裁揭秘:大模型迭代无上限,海外版AI产品增速惊人  第1张

近期,在大模型领域,竞争态势愈发激烈,人们将此现象称为“百模大战”,并认为其导致了资源的无谓消耗。MiniMax公司的刘华针对此现象发表了个人见解,这些观点揭示了当前大模型产业所面临的一些核心问题。

资源应有效分配

众多企业投身基础大模型领域,导致激烈竞争。例如,近期“百模大战”中,众多企业纷纷加入,造成人力和技术资源的巨大浪费。众多企业重复已有成果。实际上,具备实力开发基础大模型的企业为数不多。因此,合理分配资源成为大模型行业亟待解决的关键问题。MiniMax亦认识到这一点,在行业深入发展过程中,更加注重资源的有效利用。

降低错误率是目标

当前大型模型面临较高的错误率挑战。GPT系列的前代模型错误率接近30%,这一高错误率限制了其在严谨生产环境中的应用。MiniMax公司对此问题有所认识,将其长期目标之一设定为降低错误率,目标是将错误率从30%降至2%至3%。为实现这一目标,公司持续进行模型更新迭代,这将促进大型模型在包括生产、研发、科研和设计等多个领域的应用。

提升长文本处理

MiniMax的研发进展顺利,其近期推出的基于MoE和LinearAttention架构的abab7大模型,显著提升了长文本的处理效率。与传统架构相比,这一成果展现了明显的改进。这一进展显示了MiniMax在技术研发上的深入探索。未来,MiniMax有望利用这一架构优势,在更多内容处理领域展开工作。同时,这也凸显了技术创新对于大型模型企业的重要性。

应用功能持续丰富

MiniMax在产品应用方面进行了规划。例如,在海螺AI等平台上,MiniMax将推出更多功能。公司还在艺术创作领域持续投入资源,未来将持续助力艺术创作。比如,将延长AI视频生成时长,这是MiniMax未来发展的关键方向之一。这将吸引更多用户参与MiniMax相关的创作活动,并有助于MiniMax构建完整的生态系统。

吸引高频用户才是关键

刘华指出,在大型模型的推广与进步中,仅追求规模扩张的流量投入并无显著价值。关键在于吸引并保持用户,尤其是那些高频使用的用户。目前,行业内存在一些只重视投放而忽视实际成效的做法,这种做法并无实际意义。企业应侧重于技术实力,以吸引更多真实用户,这有助于在激烈的大模型竞争中稳固地位。

算力要素及使用现状

大模型的发展对算力提出了关键要求。腾讯云的高性能计算集群展现了卓越的运维技术,能够迅速识别并解决问题,确保系统稳定。同时,腾讯云的星脉网络在训练大模型时,能有效降低网络通信比例,提高训练效率。尽管如此,田丰强调,并非所有的大模型训练企业都必须拥有超大规模的算力集群,同时应注重提升GPU资源的利用率以及集群的通信效率。

大模型技术发展遭遇诸多挑战。面对众多新入或正在成长的企业,如何在技术、用户吸引和算力应用等方面构建自身优势,是亟待解决的问题。期待大家积极互动,点赞、转发并深入讨论本文。