马斯克 xAI 放出图转视频预览 AI 模型:单图可生成最高 720p 电影感视频
单图直出720p电影级视频,音频同步飞跃
xAI此次推出的Grok Imagine 1.0版本,最大的亮点在于其“图转视频”能力。用户只需上传一张静态图片,模型便能自动生成一段最长10秒、分辨率达720p的高清视频。更重要的是,视频伴随的音频效果也得到了“大幅提升”,不再是简单的背景音,而是与画面节奏、情绪相匹配的高质量音轨,极大增强了视频的电影感沉浸体验。xAI官方表示,这是“迄今为止最大的飞跃”。
30天狂揽12.45亿视频,模型已被全面调用
从数据上看,Grok Imagine 1.0的市场反响极为热烈。据xAI披露,仅在过去30天内,Imagine模型就生成了高达12.45亿个视频。这一惊人的产量不仅证明了用户对AI视频生成工具的强劲需求,也验证了Grok Imagine在并发处理与生成效率上的能力。目前该模型已全面正式上线,用户可在Grok平台上直接使用其文生视频、图生视频功能。
收购Hotshot团队,夯实视频生成技术根基
为了打造这一顶级模型,xAI早在2025年3月就完成了一笔关键收购——拿下专注AI视频生成的创业公司Hotshot。Hotshot曾独立开发出Hotshot-XL、Hotshot Act One等视频基础模型,其团队在视频生成领域的深厚积累被完整注入xAI。正是这次收购,为Grok Imagine 1.0在分辨率、时长和音频上的突破提供了底层技术支撑,也让xAI在人工智能视频赛道上拥有了可与OpenAI、Meta等玩家正面竞争的核心资产。