DeepSeek发布超越DALL-E 3的多模态模型Janus-Pro

腾赚网 89 0

DeepSeek再度发力,于1月28日发布超越OpenAI DALL-E 3的多模态大模型Janus-Pro。该模型在图像生成基准测试中表现出色,且已开源。除夕夜前夕,工程师们上传了参数量分别为15亿和70亿的两个版本至“抱抱脸”平台。这两个版本基于去年10月发布的Janus模型升级而来,能够在消费级电脑上本地运行,并采用MIT许可证,商用无限制。

DeepSeek发布超越DALL-E 3的多模态模型Janus-Pro-第1张图片-腾赚网

Janus-Pro创新性地采用自回归框架,将视觉编码分为“理解”和“生成”两条路径,在单一Transformer架构下处理,提升了灵活性与性能。尽管目前仅能生成384x384的小尺寸图像,但其表现已优于DALL-E 3等竞品。通过添加7200万张高质量合成图像及约9000万个训练样本,新模型不仅能在文生图方面展现优势,还能对图片进行描述、识别地标、读取文字并介绍图片内容。公司还展示了更多图像生成案例,证明了Janus-Pro的强大功能。

抱歉,评论功能暂时关闭!