谷歌Nano Banana掀起的全球创作狂欢尚未消退之际,字节跳动又玩了把大的。近日,字节跳动开始内测最新的豆包·图像创作模型Seedream 4.0。与此前版本相比,Seedream 4.0首次支持多模态生图,同一模型可以实现文生图、图像编辑、组图生成,并在核心能力上迎来了显著提升。
首先,主体一致性增强:无论是文本驱动还是图像驱动,都能稳健保持主体特征,避免“失真”与“错位”。例如输入提示词:“将平视视角改为俯视视角,将近景改为中景,并把画面比例改为 16:9。”Seedream 4.0给出了如下图这样的效果:
其次,多图灵活创作:支持文本、图像的多维组合输入,轻松实现参考生成、融合生成与编辑。例如输入提示词:“根据参考图中两个男生的形象,生成一组动作片分镜,原比例。”生成的效果如下图:
再次,超高清、超高速直出:最高支K分辨率输出,且推理效率大幅优化,2K大分辨率图像生成用时仅需数秒。
从更长远的技术发展视角来看,多模态自由创作正成为大势所趋。无论是文本驱动、图像驱动,还是多图融合,用户都期待能以更自然、更随心的方式与AI协作。
Seedream 4.0内测一出,网友们就把它玩出了花。比如基于多图融合能力,上传两张角色照片,再加上火柴人自拍动作,即可实现同框合影。输入提示词:“将男子和女子合进一张画面,参考姿势。”效果如下图:
或者动动嘴就能给模特一键换时尚穿搭,输入提示词:“给模特穿上的穿搭。”效果如下图:
据了解,字节Seedream 4.0模型将很快在豆包、即梦全量上线,并通过火山引擎开放给企业客户。
栏目编辑:张钰芸 题图来源:采访对象提供 图片来源:采访对象提供
来源:作者:新民晚报 金志刚
【纠错】【责任编辑:篮球幸运鑫】
- 史诗级!特斯拉AI芯片大动作,马斯克发声!丨史诗级!特斯拉AI芯片大动作,马斯克发声!
- 史诗级!特斯拉AI芯片大动作,马斯克发声!丨史诗级!特斯拉AI芯片大动作,马斯克发声!
- 史诗级!特斯拉AI芯片大动作,马斯克发声!丨史诗级!特斯拉AI芯片大动作,马斯克发声!
- 史诗级!特斯拉AI芯片大动作,马斯克发声!丨史诗级!特斯拉AI芯片大动作,马斯克发声!
- 史诗级!特斯拉AI芯片大动作,马斯克发声!丨史诗级!特斯拉AI芯片大动作,马斯克发声!
- 史诗级!特斯拉AI芯片大动作,马斯克发声!丨史诗级!特斯拉AI芯片大动作,马斯克发声!
- 史诗级!特斯拉AI芯片大动作,马斯克发声!丨史诗级!特斯拉AI芯片大动作,马斯克发声!
- 史诗级!特斯拉AI芯片大动作,马斯克发声!丨史诗级!特斯拉AI芯片大动作,马斯克发声!
- 史诗级!特斯拉AI芯片大动作,马斯克发声!丨史诗级!特斯拉AI芯片大动作,马斯克发声!
- 史诗级!特斯拉AI芯片大动作,马斯克发声!丨史诗级!特斯拉AI芯片大动作,马斯克发声!
- 史诗级!特斯拉AI芯片大动作,马斯克发声!丨史诗级!特斯拉AI芯片大动作,马斯克发声!
- 史诗级!特斯拉AI芯片大动作,马斯克发声!丨史诗级!特斯拉AI芯片大动作,马斯克发声!
- 史诗级!特斯拉AI芯片大动作,马斯克发声!丨史诗级!特斯拉AI芯片大动作,马斯克发声!
- 史诗级!特斯拉AI芯片大动作,马斯克发声!丨史诗级!特斯拉AI芯片大动作,马斯克发声!
- 史诗级!特斯拉AI芯片大动作,马斯克发声!丨史诗级!特斯拉AI芯片大动作,马斯克发声!
- 史诗级!特斯拉AI芯片大动作,马斯克发声!丨史诗级!特斯拉AI芯片大动作,马斯克发声!
- 史诗级!特斯拉AI芯片大动作,马斯克发声!丨史诗级!特斯拉AI芯片大动作,马斯克发声!
- 史诗级!特斯拉AI芯片大动作,马斯克发声!丨史诗级!特斯拉AI芯片大动作,马斯克发声!
- 史诗级!特斯拉AI芯片大动作,马斯克发声!丨史诗级!特斯拉AI芯片大动作,马斯克发声!
- 史诗级!特斯拉AI芯片大动作,马斯克发声!丨史诗级!特斯拉AI芯片大动作,马斯克发声!