文章来源:
腾赚网
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 wulanwray@foxmail.com 举报,一经查实,本站将立刻删除。
幻方量化的AI子公司DeepSeek近日在美国媒体和社交平台上迅速走红。1月24日,TeamBlind平台的一则帖子引起广泛关注,据一名Meta员工透露,公司内部因DeepSeek新模型的出现而陷入恐慌。DeepSeek-V3在性能基准测试中超越了Llama 4,尤其值得注意的是,这家公司仅以550万美元的训练成本就达到了这一成就。
DeepSeek利用2048块H800显卡,在两个月内训练出了包含6710亿参数的DeepSeek-V3模型,相比Meta使用更多、更先进的硬件完成的Llama 3,效率提高了11倍。此外,1月20日,DeepSeek发布了开源的DeepSeek-R1模型,该模型通过强化学习技术大幅提升了推理能力。短短几天后,AMD宣布将DeepSeek-V3集成至其最新的GPU上,以优化性能表现。这些进展预示着AI应用可能因成本降低而加速普及,中信证券认为这将促进国内AI生态系统的快速发展,特别是在企业管理和教育等领域,AI有望成为用户的得力助手。
抱歉,评论功能暂时关闭!