阿里通义千问超越Meta Llama,成为全球第一开源模型系列,这是AI新时代的到来吗?  第1张

通义千问成全球第一

2月21日,在上海举办的全球开发者大会(GDC)中,由阿里云魔搭社区主办的论坛备受瞩目。阿里巴巴集团旗下的通义实验室黄斐科学家公布了最新数据,指出通义千问(Qwen)系列模型的总下载量已超过1.8亿次。同时,该系列派生模型的数量已达到九万以上,这一数字超过了Meta的Llama系列。因此,通义千问已成为全球最大的开源模型系列。

Hugging Face等第三方平台对千问给予了高度评价,用户评价普遍积极。黄斐对此充满信心,明确指出:“千问的时代已经到来,Llama的时代已经结束。”这一言论凸显了通义千问在开源模型领域的显著成就。

Qwen2.5 - Max成绩亮眼

今年一月底发布的AI基础大型模型Qwen2.5 - Max,在多场权威评测中表现出色。该模型性能卓越,黄斐认为其表现优于DeepSeek - V3。尽管目前Qwen2.5 - Max尚未超越推理模型DeepSeek - R1,但已充分显现其强大能力。

吴泳铭,阿里巴巴集团CEO,发布了关键资讯。据此信息,通义千问正采用Qwen2.5 - Max技术构建推理模型。该模型即将问世,引发了业界的广泛关注和热切期待。

不同规模模型适配场景

黄斐指出,Qwen2.5版本引入了七种Dense模型,这些模型均采用经典的Transformer架构进行设计。模型规模跨度较大,最小规模为0.5B,而最大规模则达到了72B。

各类规模模型具备独特属性,其运行效率和功能各有不同,设计初衷是为了适应多样化的应用场景。在速度上,小型模型表现更为出色,适合那些对实时性要求高且计算资源受限的环境;而大型模型则在应对复杂任务和高精度输出方面表现出色。

预训练数据高速增长

千问系列不断更新,其预训练数据规模显著增加。在Qwen1.5至72B阶段,数据量从3T增长至18T。

实施规模化法则显著推动了数据量的扩大,这一趋势进一步显著提升了模型的性能表现,加强了其学习能力,提高了信息理解和处理的速度,进而为模型在各类应用场合提供了坚实的支持。

AI Agent潜力巨大

黄斐强调,智能体(AI Agent)作为独立于模型存在的领域,应当受到特殊关注。他预计,在不久的将来,智能体有望成为研究领域的焦点。

人工智能代理在复杂任务处理中扮演了重要角色,近期推理技术的进步已在该领域显现出巨大潜力。这一技术已开始在多个行业应用,如制造业和物流,显著提升了工作效率,同时减少了人力资源的需求。

魔搭社区发展成果瞩目

陈颖达指出,自魔搭社区于2022年11月成立以来,社区发展迅速。截至目前,模型数量已超过4.5万。这些模型涉及多个领域,包括LLM、对话系统、语音识别、文生图、图生视频以及AI音乐创作等。

该社区已向超1100万开发者提供服务。同时,它推出了业内首个产品级开源语音模型——Step-Audio,其参数规模超1300亿。阿里计划在未来三年内,加大AI领域的投资。重点聚焦于三个关键领域。针对通义千问新推出的推理模型,您如何看待其对AI行业发展的潜在影响?