阿里HappyHorse突然上线,实测让马斯克和奥尔特曼法庭开撕,还手搓了GTA6
背景
阿里巴巴ATH创新事业部近日悄然上线了其最新研发的视频生成与编辑模型——HappyHorse 1.0(官方译名:快乐小马)。该模型已开启灰度测试,创作者可通过阿里云百炼平台或HappyHorse官网注册使用,普通用户则可在通义千问App中体验其部分功能。
这一模型的上线引发了业界广泛关注,尤其是在盲测平台Arena.ai中,HappyHorse 1.0在文生视频、图生视频、视频编辑三个榜单上均位列第二,仅次于字节跳动的Seedance 2.0。为了验证其实战能力,相关媒体对其进行了多维度的实测。
核心功能与实测表现
HappyHorse 1.0目前支持三种主要功能:文生视频、图生视频与视频编辑。实测显示其在指令遵循、生成速度等方面表现突出,但在细节还原、物理真实性和音画同步方面仍有待优化。
-
文生视频:支持800词超长提示词
在测试中,模型成功解析了长达800词的复杂提示词,并生成了包括拉美街头音乐表演、海边悬崖场景、夜晚侦探画面等视频内容。人物肢体动作、镜头推进、灯光氛围等均符合预期,但音画同步方面存在偏差,如吉他手动作与音频节奏不一致、水滴下落速度失真等。
-
图生视频:可参考多图元素,还原度较高
HappyHorse 1.0支持最多9张图像作为参考。在一次测试中,用户上传了马斯克与奥尔特曼的照片,要求生成二人在法庭激烈争吵的画面。尽管首版未能达到预期,但经过提示词优化后,模型生成了人物表情丰富、背景合理的画面。然而,人物对话语言最初为中文,需进一步调整才能还原真实语境。
-
视频编辑:尚未完全开放
尽管官方宣称支持视频编辑功能,但在实测过程中,该功能始终无法正常使用,具体效果仍有待后续验证。
技术亮点与市场定位
-
生成速度快、分辨率高
HappyHorse 1.0可在2-5分钟内生成一段3s-15s的视频,支持最高1080p分辨率,生成效率在行业内具备一定竞争力。
-
商业化路径明确
模型定价清晰,720P视频生成价格为0.9元/s,1080P为1.6元/s。Pro套餐叠加折扣后分别降至0.44元/s和0.78元/s,具备成本优势。
-
已集成至多个阿里系产品
HappyHorse 1.0已出现在阿里旗下如阿里悟空、MuleRun和JVS Claw等Agent平台中,未来还将通过千问App推出“测一测”视频玩法,让用户生成属于自己的短剧角色片段。
行业反馈与未来展望
多位业内人士在体验HappyHorse 1.0后给出了积极评价,也指出了其当前的不足。
-
技术合伙人李明(麦斯国际)评价:
- 优点:生成速度快、支持1080P、提示词理解能力强。
- 缺点:一致性差、语音机械感强、音画同步和文字渲染仍有明显问题。
-
Flova团队评价:
- 模型在真实感与叙事能力方面表现突出,尤其适合纪录片风格或叙事性内容创作。
- 镜头运动接近实拍,减轻“AI感”,增强沉浸体验。
李明也指出,目前AI视频生成行业普遍存在“抽卡率”高的问题,部分模型的失败率高达50%-60%。HappyHorse 1.0虽然在生成质量上尚有提升空间,但其对提示词的精准理解和输出稳定性,已为创作者节省了不少试错成本。
结语
HappyHorse 1.0的上线标志着阿里巴巴在视频生成领域迈出了坚实的一步。其在生成速度、提示词解析、参考图还原等方面表现出色,但在物理细节、音画同步、文字渲染方面仍需打磨。
从实测案例来看,它不仅能让马斯克和奥尔特曼在法庭上“对撕”,还能手搓出类似GTA6风格的画面。虽然目前还不能完全替代传统视频制作,但作为AI生成工具,它已展现出不俗潜力。随着后续版本的迭代与优化,这匹“快乐小马”或许将在AI视频生成的赛道上跑出自己的节奏。