阿里HappyHorse突然上线,实测让马斯克和奥尔特曼法庭开撕,还手搓了GTA6

背景

阿里巴巴ATH创新事业部近日悄然上线了其最新研发的视频生成与编辑模型——HappyHorse 1.0(官方译名:快乐小马)。该模型已开启灰度测试,创作者可通过阿里云百炼平台或HappyHorse官网注册使用,普通用户则可在通义千问App中体验其部分功能。

这一模型的上线引发了业界广泛关注,尤其是在盲测平台Arena.ai中,HappyHorse 1.0在文生视频、图生视频、视频编辑三个榜单上均位列第二,仅次于字节跳动的Seedance 2.0。为了验证其实战能力,相关媒体对其进行了多维度的实测。


核心功能与实测表现

HappyHorse 1.0目前支持三种主要功能:文生视频、图生视频与视频编辑。实测显示其在指令遵循、生成速度等方面表现突出,但在细节还原、物理真实性和音画同步方面仍有待优化。

  • 文生视频:支持800词超长提示词

    在测试中,模型成功解析了长达800词的复杂提示词,并生成了包括拉美街头音乐表演、海边悬崖场景、夜晚侦探画面等视频内容。人物肢体动作、镜头推进、灯光氛围等均符合预期,但音画同步方面存在偏差,如吉他手动作与音频节奏不一致、水滴下落速度失真等。

  • 图生视频:可参考多图元素,还原度较高

    HappyHorse 1.0支持最多9张图像作为参考。在一次测试中,用户上传了马斯克与奥尔特曼的照片,要求生成二人在法庭激烈争吵的画面。尽管首版未能达到预期,但经过提示词优化后,模型生成了人物表情丰富、背景合理的画面。然而,人物对话语言最初为中文,需进一步调整才能还原真实语境。

  • 视频编辑:尚未完全开放

    尽管官方宣称支持视频编辑功能,但在实测过程中,该功能始终无法正常使用,具体效果仍有待后续验证。


技术亮点与市场定位

  • 生成速度快、分辨率高

    HappyHorse 1.0可在2-5分钟内生成一段3s-15s的视频,支持最高1080p分辨率,生成效率在行业内具备一定竞争力。

  • 商业化路径明确

    模型定价清晰,720P视频生成价格为0.9元/s,1080P为1.6元/s。Pro套餐叠加折扣后分别降至0.44元/s和0.78元/s,具备成本优势。

  • 已集成至多个阿里系产品

    HappyHorse 1.0已出现在阿里旗下如阿里悟空、MuleRun和JVS Claw等Agent平台中,未来还将通过千问App推出“测一测”视频玩法,让用户生成属于自己的短剧角色片段。


行业反馈与未来展望

多位业内人士在体验HappyHorse 1.0后给出了积极评价,也指出了其当前的不足。

  • 技术合伙人李明(麦斯国际)评价:

    • 优点:生成速度快、支持1080P、提示词理解能力强。
    • 缺点:一致性差、语音机械感强、音画同步和文字渲染仍有明显问题。
  • Flova团队评价:

    • 模型在真实感与叙事能力方面表现突出,尤其适合纪录片风格或叙事性内容创作。
    • 镜头运动接近实拍,减轻“AI感”,增强沉浸体验。

李明也指出,目前AI视频生成行业普遍存在“抽卡率”高的问题,部分模型的失败率高达50%-60%。HappyHorse 1.0虽然在生成质量上尚有提升空间,但其对提示词的精准理解和输出稳定性,已为创作者节省了不少试错成本。


结语

HappyHorse 1.0的上线标志着阿里巴巴在视频生成领域迈出了坚实的一步。其在生成速度、提示词解析、参考图还原等方面表现出色,但在物理细节、音画同步、文字渲染方面仍需打磨。

从实测案例来看,它不仅能让马斯克和奥尔特曼在法庭上“对撕”,还能手搓出类似GTA6风格的画面。虽然目前还不能完全替代传统视频制作,但作为AI生成工具,它已展现出不俗潜力。随着后续版本的迭代与优化,这匹“快乐小马”或许将在AI视频生成的赛道上跑出自己的节奏。