海外影响发酵
近期,DeepSeek公司新推出的国内大型模型在海外受到了广泛关注。该模型的热度持续上升,吸引了市场的极大关注。众人普遍关心它是否会对AI硬件市场的上游产生影响。在全球科技日益走向全球化的今天,一款新模型的问世可能会引发一系列连锁反应。目前,这款国产模型在国际上的影响力已初见端倪。
市场反馈显示,投资者和相关企业正密切关注相关动态。在此之前,谷歌、Meta等科技巨头在大型模型领域占据领先地位,然而,DeepSeek新模型的问世已对这一格局的稳定性产生了影响。市场的不确定性明显上升。
低成本训练奇迹
DeepSeek公布,其R1预训练服务的费用为557.6万美元。值得关注的是,该模型在装备有2048块英伟达H800 GPU的集群中,仅需55天便完成了预训练。在过往的大规模模型训练案例中,如此低的成本和较短的时间周期较为少见。
与其他企业采用的“大投入换取高回报”的“资金密集型”战略形成鲜明对比。在此之前,AI领域的初创企业,包括OpenAI和Anthropic,在与科技巨头的竞争中,普遍选择了成本高昂的策略。然而,R1的推出仿佛一把颠覆传统的利器,开辟了一条全新的发展道路。
巨头研究应对
此举凸显了Meta公司对DeepSeek的高度重视。
面对不断出现的新竞争者,Meta公司迅速采取了应对策略。在当前激烈的大模型市场竞争中,任何技术上的创新都可能重新定义市场格局。Meta公司正积极向DeepSeek汲取经验,旨在提升自身的市场竞争力。
华尔街的思考
R1的进步不再仅依靠计算能力。这一转变导致华尔街对科技巨头在投资策略上进行了重新考量。市场开始对AI基础设施的大规模投资以及英伟达芯片的需求合理性提出疑问。投资决策通常基于效益和预期回报。
若DeepSeek的成功模式得以广泛推广,行业变革似乎已成必然趋势。众多开发大型模型的团队可能会参考其做法,从而在更少的芯片支持下构建出高效的模型。这一变化或许会减缓英伟达的收入增长速度,进而对众多投资者的利益产生影响。
行业看法分歧
外媒分析认为,DeepSeek若促使AI初创企业采用更少芯片构建模型并快速进入市场,可能对英伟达的营业收入构成影响。这是因为大型模型开发者可能会模仿其采用低配置芯片的做法。然而,美国投资银行分析师Srini Pajjuri提出,这同样可能激发美国科技巨头利用英伟达GPU的领先地位,进一步拉大与对手的差距。
行业形势的复杂性在众多观点中得以展现。一些人聚焦于低成本模式所携带的潜力及其可能对硬件市场带来的变化,与此同时,另一些人则对科技巨头在面临挑战时的应对策略和反击措施表示关注。市场的发展趋势充满变数。
成本降低缘由
李博杰,作为Logenic AI公司的共同创始人,强调R1技术的关键在于其后训练阶段。在这一阶段,所需的数据量和成本均大幅低于预训练时期。这一特性可以比作“站在巨人的肩膀上”,为大幅降低训练成本提供了技术支持。
李博杰提出,AI模型训练成本下降可能对上游AI硬件企业造成影响。当前,AI技术仍处于研发阶段,尽管进展迅猛,却历经多次试验和失误。故此,算力卡及资源仍保持优势,同时,这也使得市场走向充满更多变数。
目前,DeepSeek-R1国产大型模型的问世,促使行业发生了一系列变动。业界对此高度关注,普遍在询问:AI硬件市场是否即将迎来一场重大转型?我们热切邀请广大读者加入讨论,并对本文给予点赞与分享。