DeepSeek AI模型超越Llama 4引发关注

腾赚网 46 0

幻方量化的AI子公司DeepSeek近日在美国媒体和社交平台上迅速走红。1月24日,TeamBlind平台的一则帖子引起广泛关注,据一名Meta员工透露,公司内部因DeepSeek新模型的出现而陷入恐慌。DeepSeek-V3在性能基准测试中超越了Llama 4,尤其值得注意的是,这家公司仅以550万美元的训练成本就达到了这一成就。

DeepSeek AI模型超越Llama 4引发关注-第1张图片-腾赚网

DeepSeek利用2048块H800显卡,在两个月内训练出了包含6710亿参数的DeepSeek-V3模型,相比Meta使用更多、更先进的硬件完成的Llama 3,效率提高了11倍。此外,1月20日,DeepSeek发布了开源的DeepSeek-R1模型,该模型通过强化学习技术大幅提升了推理能力。短短几天后,AMD宣布将DeepSeek-V3集成至其最新的GPU上,以优化性能表现。这些进展预示着AI应用可能因成本降低而加速普及,中信证券认为这将促进国内AI生态系统的快速发展,特别是在企业管理和教育等领域,AI有望成为用户的得力助手。

抱歉,评论功能暂时关闭!