独家
背景:神秘模型横空出世,迅速登顶全球榜单
在近期的AI视频生成领域,一个名为Happy Horse-1.0的模型悄然上线Artificial Analysis平台,并迅速在多个赛道中登顶排行榜。该平台采用的是Elo评分机制,由数千名用户在盲测状态下对不同模型的生成结果进行投票,因此具有较高的公信力。
- Happy Horse-1.0在以下方面表现突出:
- 文本转视频(无音频)赛道得分1375,远超第二名Seedance 2.0;
- 图像转视频(无音频)赛道得分1409,刷新榜单纪录;
- 音视频同步生成赛道同样排名第一。
由于其表现异常亮眼,同时官网信息极为模糊,仅注明“Happy Horse团队开发”,引发了行业内对模型背后研发方的广泛猜测。
模型特性与技术亮点
Happy Horse-1.0的技术架构与其生成效果成为业内关注的重点。其宣称采用了一种统一的Transformer架构,将视频、音频、文本等多种模态在同一个序列中进行联合处理。
架构设计
- 使用40层单一自注意力Transformer,替代传统“双流架构”;
- 强调“单流”生成方式,视频与音频在同一过程中同步生成;
- 无cross-attention机制,进一步统一生成过程;
- 支持中文(含粤语)、英语、日语、韩语、德语、法语等语言的语音与唇形同步生成。
推理效率
- 仅需8步去噪即可生成1080P视频;
- 快速推理:256P视频约2秒,1080P约38秒;
- 支持从提示词+图片快速生成完整视频(约1分钟);
- 生成视频中声音与画面形成因果对应,例如篮球入框的碰撞声、倒牛奶时的倒水声等。
此外,Happy Horse-1.0还宣称将全面开源,包括基础模型、蒸馏模型、超分模型及推理代码,进一步引发行业关注。
身份猜测与阿里关联
尽管Happy Horse-1.0官网未明确披露研发单位,但多方信息指向阿里巴巴集团,尤其是其旗下的通义实验室或Wan系列模型研发团队。
-
技术路径高度吻合阿里过往模型:
- 采用单一Transformer架构,与Wan 2.1/2.7的DiT架构相似;
- 多模态融合方式与Wan 2.7的“全模态输入”特性一致;
- 推理效率提升路径也与阿里技术路线保持一致。
-
人才背景线索:
- 张迪曾主导快手Kling项目,也曾在阿里妈妈任职;
- 网传该团队可能为淘天集团未来生活实验室。
-
域名线索:
- 官网中曾出现spaceship.com,与快手关联公司商标重合;
- 但也有分析指出,该模型更可能不属于字节跳动,因其多轮对比直接“踩”即梦,明显有竞品定位。
综合来看,Happy Horse-1.0大概率是阿里系模型,可能为Wan系列的全新版本或独立项目,目前尚未获得官方确认。
市场反应与传播策略疑点
Happy Horse-1.0的传播路径也被质疑为“精心设计”的结果。
-
榜单可操作性疑虑:
- 有业内人士指出,AA排行榜存在“可优化”的空间;
- 通过针对性训练样本,可以在短时间内刷出高分。
-
传播方式高度营销化:
- 通过折叠微信聊天记录曝光;
- 官网迅速上线“蹭热度”内容;
- 流传的视频内容高度单一,缺乏多样性展示。
尽管存在争议,但该模型的生成质量确实引起了用户与行业专家的关注,尤其在画面自然度、镜头调度和音画同步方面表现突出。
影响与未来展望
Happy Horse-1.0的出现,可能意味着视频生成AI正在向统一模态处理、高效率生成、多模态融合的方向演进。
-
行业技术方向转变:
- 从双流架构向单流架构过渡;
- 更强调原生音频与视频同步生成;
- 推理速度成为新竞争点。
-
对现有模型的影响:
- Seedance、即梦、PixVerse等模型面临直接挑战;
- 若阿里确认该模型归属,将进一步巩固其在AIGC领域的技术地位;
- 模型开源后,可能推动中小团队快速跟进。
据消息,Happy Horse-1.0将在近期正式发布,届时将有更多技术细节与应用场景披露。其是否能真正引领新一代视频生成技术,还需进一步观察。