豆包视频生成大模型来了行业又要变天了

【ITBEAR】9月24日消息，字节跳动旗下火山引擎今日在深圳成功举办AI创新巡展，活动中正式推出了两款全新的大模型：豆包视频生成-PixelDance与豆包视频生成-Seaweed。

火山引擎总裁谭待在活动现场发表讲话，强调视频生成领域仍面临诸多挑战，并承诺豆包的两款新模型将持续进化，致力于在解决核心问题上探索更多可能性，并加速AI视频创作的应用落地与拓展。

据ITBEAR了解，豆包视频生成模型在镜头切换方面展现出卓越能力，能够实现自然流畅的多拍动作与复杂的多主体交互。基于DiT架构，该模型支持变焦、环绕、平摇、缩放、目标跟随等多种镜头语言，同时在镜头切换时保持主体、风格、氛围的一致性。

在画面风格上，经过剪映、即梦AI等技术的持续迭代，豆包视频生成模型已具备专业级的光影布局和色彩调和能力。其Transformer结构经过深度优化，可支持3D动画、2D动画、国画、黑白、厚涂等多种风格，并能适配不同电子设备的屏幕比例，适用于电商营销、动画教育、城市文旅、微剧本等多种场景。

目前，新款豆包视频生成模型正在即梦AI内测版中进行小范围测试，预计未来将逐步开放给所有用户。

此次活动还见证了豆包大模型家族的其他重要成员发布，包括豆包音乐模型和同声传译模型，至此，豆包大模型已全面覆盖语言、语音、图像、视频等多种模态。

火山引擎披露的数据显示，截至9月，豆包语言模型的日均tokens使用量已超过1.3万亿，与5月首次发布时相比增长了十倍。同时，多模态数据处理量也分别达到每天5000万张图片和85万小时语音。

关键词：#字节跳动# #火山引擎# #豆包视频生成模型# #AI创新# #多模态数据处理#

猜你喜欢

白家电定制风格展现个...: 定制风格，展现个性——不同风格下的专业拍照方法在今天的摄影世界中，不同的风格和技巧可以让照片从平凡到出众，从单一到多维。专业拍摄不仅仅是关于技术操作，更...

白家电 XDP-1大视...: 产品介绍视觉观察的创新改革 1. XDP-1大视场显微镜是一种视场广阔的新型显微镜，同时能兼顾图像清晰，观察舒适，操作方便，立体感强的特性，广泛应用于生物...

白家电威尔泰WT43...: WT4300系列电磁流量计主要技术性能： l 口径： DN10 ~ DN1000 l 测量误差：±0.5% l 电导率：>5µS/cm l 满量程流...

白家电袋装产品大量程...: 袋装产品大量程重量检测秤电源 AC220V±10%，50/60Hz，约 1000VA。称重范围 5～60kg检重精度 ±5g检重速度 ≤60 件/每分钟...

强力推荐