商汤科技分享DeepSeek多模态发展与算力需求

腾赚网 12 0

人工智能热潮持续升温,全球大模型市场玩家加速布局。商汤科技联合创始人林达华博士在闭门交流会上分享了对DeepSeek的看法及未来规划。

DeepSeek的V3和R1版本各具特色。V3通过优化训练效率达到一流水平,尤其在数据处理和算法结构上表现突出。R1则另辟蹊径,采用基于结果监督的强化学习路线,展现出强大的推理能力。这种创新路径不仅提升了模型性能,还降低了训练成本。

面对算力需求问题,林达华认为短期内不会下降。随着DeepSeek推理能力突破,下游应用市场迅速扩展,反而刺激了算力需求增长。当前市场上,国产厂商纷纷推出R1以满足日益增长的需求,使得推理市场供不应求的局面愈发明显。

多模态发展成为行业共识。AI不再局限于语言处理,而是向图像、视频等多模态融合迈进。商汤早在视觉领域积累深厚,正着力构建具备强交互、强推理和长期记忆能力的多模态模型。这不仅是技术演进的方向,更是实现商业闭环的关键。

大模型应用正从简单工具转向高价值核心任务。开源虽加速了技术普及,但真正的竞争力在于与基础设施的深度整合及特定行业的纵深发展。商汤坚持“大装置、大模型、应用”三位一体战略,力求在关键领域突破工业红线,实现规模化应用和高价值变现。

抱歉,评论功能暂时关闭!