DeepSeek发布超越DALL-E 3的多模态模型Janus-Pro

腾赚网 2025年01月28日 09:00 89 0

DeepSeek再度发力，于1月28日发布超越OpenAI DALL-E 3的多模态大模型Janus-Pro。该模型在图像生成基准测试中表现出色，且已开源。除夕夜前夕，工程师们上传了参数量分别为15亿和70亿的两个版本至“抱抱脸”平台。这两个版本基于去年10月发布的Janus模型升级而来，能够在消费级电脑上本地运行，并采用MIT许可证，商用无限制。

DeepSeek发布超越DALL-E 3的多模态模型Janus-Pro-第1张图片-腾赚网

Janus-Pro创新性地采用自回归框架，将视觉编码分为“理解”和“生成”两条路径，在单一Transformer架构下处理，提升了灵活性与性能。尽管目前仅能生成384x384的小尺寸图像，但其表现已优于DALL-E 3等竞品。通过添加7200万张高质量合成图像及约9000万个训练样本，新模型不仅能在文生图方面展现优势，还能对图片进行描述、识别地标、读取文字并介绍图片内容。公司还展示了更多图像生成案例，证明了Janus-Pro的强大功能。

本文地址： https://www.tengzhuan.com/post/737294.html

文章来源：腾赚网