DeepSeek|进军文字生成图像 发布多模态模型Janus-Pro并全部开源
2025-01-28 11:34
近期爆红的内地人工智能新创公司深度求索(DeepSeek),1月28日凌晨在GitHub平台发布了Janus-Pro多模态大模型,进军文字生成图像(文生图)领域。
测试打败OpenAI
相关新闻:DeepSeek|起底创始人梁文锋 17岁考入浙大 36岁管理千亿私募基金
DeepSeek方面表示,该款大模型是2024年11月13日发布的JanusFlow大模型的高级版本。相比前一代模型,Janus-Pro优化了训练策略、扩展了训练数据,模型也更大。通过这些改进,Janus-Pro 在多模态理解和文字到图像的指令跟踪功能方面都取得了重大进步,同时还增强了文字到图像生成的稳定性。
相关新闻:DeepSeek|线上服务遭大规模恶意攻击 暂时仅支持中国手机用户注册
根据DeepSeek发布的测试结果,Janus-Pro在 GenEval 和 DPG-Bench 基准测试中击败了 Stable Diffusion 和 OpenAI 的 DALL-E 3。DeepSeek的展示图显示,在文生图GenEval和DPG-Bench基准测试中,Janus-Pro-7B的准确率较前代Janus大幅提高,准确率测试结果分别为80%和84.2%,高于包括OpenAI DALL-E 3在内的其他对比模型,Janus的准确率分别为61%和79.7%。
目前,Janus系列的4款模型已经开源。
相关新闻:AI争霸︱DeepSeek登中国区App Store首位 科技大老赞:国运级成果
随著 Janus-Pro-7B 的推出,科技业界对于其可能带来的影响高度关注。许多市场观察人士认为,DeepSeek 的突破性技术可能促使竞争对手加速研发,进一步推动 AI 领域的创新发展。然而,这也引发了市场的不安情绪。
最新回应