独家

背景:神秘模型横空出世,迅速登顶全球榜单

在近期的AI视频生成领域,一个名为Happy Horse-1.0的模型悄然上线Artificial Analysis平台,并迅速在多个赛道中登顶排行榜。该平台采用的是Elo评分机制,由数千名用户在盲测状态下对不同模型的生成结果进行投票,因此具有较高的公信力。

  • Happy Horse-1.0在以下方面表现突出:
    • 文本转视频(无音频)赛道得分1375,远超第二名Seedance 2.0;
    • 图像转视频(无音频)赛道得分1409,刷新榜单纪录;
    • 音视频同步生成赛道同样排名第一。

由于其表现异常亮眼,同时官网信息极为模糊,仅注明“Happy Horse团队开发”,引发了行业内对模型背后研发方的广泛猜测。

模型特性与技术亮点

Happy Horse-1.0的技术架构与其生成效果成为业内关注的重点。其宣称采用了一种统一的Transformer架构,将视频、音频、文本等多种模态在同一个序列中进行联合处理。

架构设计

  • 使用40层单一自注意力Transformer,替代传统“双流架构”;
  • 强调“单流”生成方式,视频与音频在同一过程中同步生成;
  • 无cross-attention机制,进一步统一生成过程;
  • 支持中文(含粤语)、英语、日语、韩语、德语、法语等语言的语音与唇形同步生成。

推理效率

  • 仅需8步去噪即可生成1080P视频;
  • 快速推理:256P视频约2秒,1080P约38秒;
  • 支持从提示词+图片快速生成完整视频(约1分钟);
  • 生成视频中声音与画面形成因果对应,例如篮球入框的碰撞声、倒牛奶时的倒水声等。

此外,Happy Horse-1.0还宣称将全面开源,包括基础模型、蒸馏模型、超分模型及推理代码,进一步引发行业关注。

身份猜测与阿里关联

尽管Happy Horse-1.0官网未明确披露研发单位,但多方信息指向阿里巴巴集团,尤其是其旗下的通义实验室或Wan系列模型研发团队。

  • 技术路径高度吻合阿里过往模型

    • 采用单一Transformer架构,与Wan 2.1/2.7的DiT架构相似;
    • 多模态融合方式与Wan 2.7的“全模态输入”特性一致;
    • 推理效率提升路径也与阿里技术路线保持一致。
  • 人才背景线索

    • 张迪曾主导快手Kling项目,也曾在阿里妈妈任职;
    • 网传该团队可能为淘天集团未来生活实验室。
  • 域名线索

    • 官网中曾出现spaceship.com,与快手关联公司商标重合;
    • 但也有分析指出,该模型更可能不属于字节跳动,因其多轮对比直接“踩”即梦,明显有竞品定位。

综合来看,Happy Horse-1.0大概率是阿里系模型,可能为Wan系列的全新版本或独立项目,目前尚未获得官方确认。

市场反应与传播策略疑点

Happy Horse-1.0的传播路径也被质疑为“精心设计”的结果。

  • 榜单可操作性疑虑

    • 有业内人士指出,AA排行榜存在“可优化”的空间;
    • 通过针对性训练样本,可以在短时间内刷出高分。
  • 传播方式高度营销化

    • 通过折叠微信聊天记录曝光;
    • 官网迅速上线“蹭热度”内容;
    • 流传的视频内容高度单一,缺乏多样性展示。

尽管存在争议,但该模型的生成质量确实引起了用户与行业专家的关注,尤其在画面自然度、镜头调度和音画同步方面表现突出。

影响与未来展望

Happy Horse-1.0的出现,可能意味着视频生成AI正在向统一模态处理、高效率生成、多模态融合的方向演进。

  • 行业技术方向转变

    • 从双流架构向单流架构过渡;
    • 更强调原生音频与视频同步生成;
    • 推理速度成为新竞争点。
  • 对现有模型的影响

    • Seedance、即梦、PixVerse等模型面临直接挑战;
    • 若阿里确认该模型归属,将进一步巩固其在AIGC领域的技术地位;
    • 模型开源后,可能推动中小团队快速跟进。

据消息,Happy Horse-1.0将在近期正式发布,届时将有更多技术细节与应用场景披露。其是否能真正引领新一代视频生成技术,还需进一步观察。