文章来源:
腾赚网
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 wulanwray@foxmail.com 举报,一经查实,本站将立刻删除。
DeepSeek再度发力,于1月28日发布超越OpenAI DALL-E 3的多模态大模型Janus-Pro。该模型在图像生成基准测试中表现出色,且已开源。除夕夜前夕,工程师们上传了参数量分别为15亿和70亿的两个版本至“抱抱脸”平台。这两个版本基于去年10月发布的Janus模型升级而来,能够在消费级电脑上本地运行,并采用MIT许可证,商用无限制。
Janus-Pro创新性地采用自回归框架,将视觉编码分为“理解”和“生成”两条路径,在单一Transformer架构下处理,提升了灵活性与性能。尽管目前仅能生成384x384的小尺寸图像,但其表现已优于DALL-E 3等竞品。通过添加7200万张高质量合成图像及约9000万个训练样本,新模型不仅能在文生图方面展现优势,还能对图片进行描述、识别地标、读取文字并介绍图片内容。公司还展示了更多图像生成案例,证明了Janus-Pro的强大功能。
抱歉,评论功能暂时关闭!