深度求索发布R1模型,成本效益显著超越对手
双轨转型成为全球高质量发展的核心议题,即将可持续发展与数智化转型相结合。面对资源约束和环境挑战,如何利用先进数智技术推动绿色低碳发展,同时确保经济效益和社会福祉的最大化,是所有利益相关者的重要课题。
近期,人工智能初创公司深度求索发布了新模型R1,引发了关于人工智能发展与算力、能源关系的讨论。R1模型不仅在性能上超越了OpenAI的产品,在成本效益方面也展现出显著优势。硅谷科技媒体将其称为新时代的“斯普特尼克时刻”,标志着科技格局可能被颠覆的新起点。R1的训练成本远低于其他大型模型,这为数据中心运营商提供了大幅削减运营成本的机会。
R1的发布还导致美国科技股和能源股出现剧烈震荡。英伟达等芯片股重挫,纳斯达克指数和标普500指数也有所下跌。市场开始质疑美国科技巨头的高估值,并担忧AI对电力需求增长预期的变化。
尽管深度求索取得了技术进步,但在境外市场仍面临不确定性。然而,其低成本实现高性能的方式引起了全球关注。如果这种方法能被广泛复制,中小型国家或许有机会以更低的成本进入基础模型领域。对于澳新地区的数据中心运营商而言,这缓解了对外部模型安全性和可靠性风险的担忧。
DeepSeek R1的技术特点主要体现在效率与成本控制上。通过混合专家模型、多头潜注意力机制等创新技术,实现了较低算力投入下的高性能表现。这些技术的应用不仅提高了推理效率,还大幅减少了计算量。
DeepSeek R1的出现将重塑全球算力生态,促进分布式数据中心的普及,改变算力产业链的价值分配。在下游应用端,国产算力成本下降将推动人工智能在各行业的渗透,形成“需求牵引供给”的正向循环。更重要的是,DeepSeek探索出了一条低碳AI的发展路径,通过算法优化和硬件协同,大幅降低单位计算任务的能耗和碳排放强度。
尽管DeepSeek R1提升了算力效率,但也可能引发“杰文斯悖论”。更实惠的人工智能技术可能导致需求激增,新兴应用场景的爆发也会加速算力需求的增长。因此,从宏观层面看,DeepSeek R1的技术突破可能无法有效缓解人工智能发展对算力和能源的巨大需求。
面对这一趋势,中国应坚持效率优先、绿色发展的原则,探索具有自身特色的发展路径。既要注重技术创新,提升单位算力的价值,也要加强算力基础设施领域的投入,构建自主可控的算力底座。在能源战略上,应推进算力分布式革命与分布式能源革命协同发展,构建更加清洁、高效、安全、可靠的现代能源体系。