性能超越主流 /b>

马斯克团队传来消息,Grok 3模型及其简化版Grok 3 mini在数学推理、科学逻辑和编程等方面表现卓越,超越了GPT-4o、Claude 3.5 Sonnet等主流模型。这一成就引起了业界的广泛关注,Grok 3因此成为大模型领域的新领军者,为人工智能的发展增添了重要的一章。众多科研机构和公司正聚焦于Grok 3,试图揭开其高性能背后的秘密。

Grok 3横空出世!马斯克的AI新宠能否颠覆整个科技界?  第1张

新增搜索功能 /b>

在发布会上,马斯克阐述了Grok 3的推理模型新增了DeepSearch搜索引擎应用功能。这一新功能的推出,为信息检索领域带来了新的变革机遇。用户在搜索过程中,有望借助Grok 3的该功能,获取更加精确和详尽的信息。此功能预计将重塑搜索引擎市场的现状,吸引更多用户尝试Grok 3。

用户体验好评 /b>

在今晨的约两小时试用中,Andrej发现Grok 3结合深度思考模式的表现略优于DeepSeek - R1和Gemini2.0的Flash Thinking。这一用户评价从侧面凸显了Grok 3的竞争优势。尽管普通用户目前无法体验Grok 3,但此评价已提升他们对该产品的期待,同时也给其他竞争产品带来了压力。

训练未到尽头 /b>

业界观点指出,大模型训练领域尚未达到极致,但技术路线已趋同。尽管Grok 3在基准测试中与GPT - o1相当,但其实际应用效果仍需普通用户验证。数学与代码推理能力的极致展现有待市场验证,大模型训练之路仍漫长。行业内部将涌现更多创新与突破,值得期待。

算力投入巨大 /b>

DeepSeek引领了低成本训练模型的潮流,然而Grok 3却投入了大量资金。其训练阶段共使用了20万张英伟达GPU,计算能力远超Grok 2的10倍。丰富的计算资源显著提高了Grok 3处理大规模数据集的效率,减少了训练周期,增强了结果准确性。这一现象凸显了在大型模型领域,计算资源投入的关键作用。

建设值得借鉴 /b>

田丰强调,Grok 3遵循“以量取胜”的策略,堪称“优质高价”的代表。xAI在基础设施建设方面处于全球领先地位,其20万块GPU集群仅用92天便搭建完成,相比之下,之前10万块GPU的搭建耗时超过120天,且效率更高。这种高效的建设模式对中国算力供应链具有借鉴意义。马斯克透露,Grok 3尚未开源,但按照惯例,其前代产品将开源。至于toB企业客户的使用方式尚未公布,预计今年将公布美国政企客户的使用价格。

业界普遍关注,未来大型模型的发展是否将延续Grok 3的模式,即持续依赖大量算力投入?对此,我们期待您的观点、点赞以及文章的传播。