DeepSeek AI模型超越Llama 4引发关注

腾赚网 2025年01月26日 14:03 105 0

幻方量化的AI子公司DeepSeek近日在美国媒体和社交平台上迅速走红。1月24日，TeamBlind平台的一则帖子引起广泛关注，据一名Meta员工透露，公司内部因DeepSeek新模型的出现而陷入恐慌。DeepSeek-V3在性能基准测试中超越了Llama 4，尤其值得注意的是，这家公司仅以550万美元的训练成本就达到了这一成就。

DeepSeek AI模型超越Llama 4引发关注-第1张图片-腾赚网

DeepSeek利用2048块H800显卡，在两个月内训练出了包含6710亿参数的DeepSeek-V3模型，相比Meta使用更多、更先进的硬件完成的Llama 3，效率提高了11倍。此外，1月20日，DeepSeek发布了开源的DeepSeek-R1模型，该模型通过强化学习技术大幅提升了推理能力。短短几天后，AMD宣布将DeepSeek-V3集成至其最新的GPU上，以优化性能表现。这些进展预示着AI应用可能因成本降低而加速普及，中信证券认为这将促进国内AI生态系统的快速发展，特别是在企业管理和教育等领域，AI有望成为用户的得力助手。

本文地址： https://www.tengzhuan.com/post/737233.html

文章来源：腾赚网