豆包APP升级文生图一键生成指定文字图片创作门槛再降低
字节跳动旗下的智能AI助手豆包近期迎来了文生图功能的全新升级,这一改进使得用户能够轻松实现一键生成附带指定文本的图片。在生成图片的提示词中,用户只需简单输入如“一张带有‘新年快乐’的图片”,系统即可迅速响应,生成一张包含用户指定文字的图片。目前,这一功能已在豆包APP内开启测试,同时,即梦应用也在小范围内进行了测试。
文生图技术中,精准地在图像中生成文字一直是一个技术难点,尤其是针对中文文字,乱码现象时有发生。相较于英文字母,汉字的结构更为复杂,且字符数量远超前者两个数量级。豆包大模型团队的相关负责人透露,豆包的文生图模型通过整合LLM和DIT架构,显著提升了其原生中文数据的学习能力。在此基础上,团队还进一步强化了汉字的生成能力,从而大幅提高了生成效果。
随着这一功能的推出,众多用户开始尝试利用它制作表情包、梗图漫画,甚至辅助生成海报,并在社交媒体上分享自己的创作。不过,目前该功能仅支持在生成图片时添加文字,暂不支持从已有图片中提取或生成文字。
在社交媒体上,已有即梦内测用户发布了使用这一功能生成的图片,引发了广泛关注和讨论。
豆包的负责人表示,尽管该功能刚刚推出,还在不断完善和优化中,但在绝大多数情况下,豆包已经能够准确生成用户指定的文字。然而,仍有个别情况会出现错字、漏字或小字乱码等问题。他强调:“无论是文字、图片还是音乐生成功能,豆包始终致力于降低创作门槛,帮助用户更好地表达和创造。”
豆包网页版及电脑版也将在不久的将来上线这一功能,为用户提供更多样化的创作平台。