新模型发布
这一成就充分体现了Janus - Pro模型的强大能力。
Github社区强调,Janus - Pro是去年对Janus的升级版本。该版本对训练策略进行了优化,丰富了训练数据,同时增加了模型规模。这些调整显著增强了多模式识别和视觉生成能力,尤其是在多模态理解领域,取得了显著进展。
科技股震荡
1月28日晚,DeepSeek事件对全球科技股市场造成了重大影响。美国科技巨头英伟达的股价出现了显著下跌,跌幅高达16.97%。这一变化导致英伟达的市值在一天之内骤减至5890亿美元,创下了单日市值缩水的新纪录。与此同时,英伟达创始人黄仁勋的个人财富也遭受了巨大损失,减少了210亿美元。
《华尔街日报》消息称,周一股市经历剧烈波动,市值缩水近万亿美元。此次震荡促使华尔街重新评估,科技企业在AI基础设施领域的投资以及对于英伟达芯片的需求是否合理。
应用登顶榜单
1月27日早晨起,DeepSeek应用备受瞩目。该应用在苹果中国及美国区的免费APP下载榜单上名列前茅,尤其在美区,其下载量已超越GPT,引发了众多用户的高度关注,彰显了其强大的市场竞争力。
推理大模型问世
1月20日,DeepSeek推出了其推理大型模型DeepSeek - R1。该模型公开了其源代码,证明了其在数学、编程以及自然语言推理领域的强大能力。其性能与OpenAI的o1正式版模型相当。此外,DeepSeek - R1遵循MIT许可协议,允许免费商业使用、任意修改及衍生开发。
R1发布后很快吸引了大量关注,这主要得益于其开源特性、显著降低的费用以及训练成本的大幅减少。据消息,其预训练费用仅为557.6万美元,在2048块英伟达H800 GPU集群上运行55天后便成功完成。这一成就或许将推动业界对大型模型成本进行重新评估。
技术改进显著
与先前Janus版本相较,Janus - Pro版本在多个方面进行了改进。首先,模型的学习效率因训练技术的改进而大幅提升;其次,训练数据的规模得到了扩展,模型得以接触到更多样化的信息,从而增强了其理解和创造能力;此外,模型的规模也有所扩大,这有利于其更高效地应对复杂任务。
Janus-Pro在多模态理解方面实现了显著提升。在执行文本转图像指令时,该系统的遵循度有显著增强。此外,它在文本转图像过程中的稳定性也得到了加强。这些改进显著提高了生成图像的质量和准确性。
服务遭遇挑战
近期,DeepSeek的AI服务需求急剧上升,在短短24小时里,系统故障频发。根据服务状态页面信息,DeepSeek的线上服务近期遭遇了大规模恶意攻击。这一攻击可能引发注册服务拥堵,用户需耐心等待,并尝试重新登录。对于已注册用户,服务访问不受影响。
当前情况下,DeepSeek的核心挑战在于确保服务稳定运行并增强对抗恶意攻击的防御力。对此,您是否相信DeepSeek能迅速应对这些挑战,并在科技界持续展现其卓越表现?欢迎在评论区发表您的看法。同时,请不要忘记点赞和分享这篇文章。