一帧秒创发布“秒创AI视频”功能 支持文字生成4-12秒视频
新壹科技在第十一届中国网络视听大会AIGC和数字人发展论坛上发布了名为“秒创AI视频”的新产品。该产品使用了前沿的DiffusionTransformer技术,实现了从“文本到视频”、“图像到视频”以及“文本图像到视频”的全流程创作。新壹科技将继续优化技术,推出更流畅、更长时长、更符合逻辑的AI视频,同时致力于降低视频模型的训练与生成成本,让更多用户享受AI视频带来的便利和乐趣。
大视频模型是世界模型?DeepMind/UC伯克利华人一作:预测下一帧就能改变世界
【新智元导读】谷歌DeepMind、UC伯克利和MIT的研究人员认为,如果用大语言模型的思路来做大视频模型,能解决很多语言模型不擅长的问题,可能能更进一步接近世界模型。OpenAI开年推出的史诗巨作Sora,将改变视频相关领域的内容生态。虽然视频生成模型面临着如虚假生成和泛化能力等挑战,但它们有潜力成为自主的AI智能体、规划者、环境模拟器和计算平台,并最终可能作为�