豆包视频生成大模型来了行业又要变天了
【ITBEAR】9月24日消息,字节跳动旗下火山引擎今日在深圳成功举办AI创新巡展,活动中正式推出了两款全新的大模型:豆包视频生成-PixelDance与豆包视频生成-Seaweed。
火山引擎总裁谭待在活动现场发表讲话,强调视频生成领域仍面临诸多挑战,并承诺豆包的两款新模型将持续进化,致力于在解决核心问题上探索更多可能性,并加速AI视频创作的应用落地与拓展。
据ITBEAR了解,豆包视频生成模型在镜头切换方面展现出卓越能力,能够实现自然流畅的多拍动作与复杂的多主体交互。基于DiT架构,该模型支持变焦、环绕、平摇、缩放、目标跟随等多种镜头语言,同时在镜头切换时保持主体、风格、氛围的一致性。
在画面风格上,经过剪映、即梦AI等技术的持续迭代,豆包视频生成模型已具备专业级的光影布局和色彩调和能力。其Transformer结构经过深度优化,可支持3D动画、2D动画、国画、黑白、厚涂等多种风格,并能适配不同电子设备的屏幕比例,适用于电商营销、动画教育、城市文旅、微剧本等多种场景。
目前,新款豆包视频生成模型正在即梦AI内测版中进行小范围测试,预计未来将逐步开放给所有用户。
此次活动还见证了豆包大模型家族的其他重要成员发布,包括豆包音乐模型和同声传译模型,至此,豆包大模型已全面覆盖语言、语音、图像、视频等多种模态。
火山引擎披露的数据显示,截至9月,豆包语言模型的日均tokens使用量已超过1.3万亿,与5月首次发布时相比增长了十倍。同时,多模态数据处理量也分别达到每天5000万张图片和85万小时语音。
关键词:#字节跳动# #火山引擎# #豆包视频生成模型# #AI创新# #多模态数据处理#