DaVinci MagiHuman

105 次浏览 2 个月前 AI视频工具

视频生成数字人口型同步开源

DaVinci MagiHuman 是一款开源的AI工具，能从单张照片和音频/文本生成口型同步的说话视频。

扫码查看

DaVinci MagiHuman是什么

DaVinci MagiHuman 是一个基于开源模型的口型同步视频生成工具，用户只需提供一张静态人像照片和一段音频（或文本），即可自动生成与声音高度匹配的说话视频。该项目在GitHub上公开源码，支持本地部署和二次开发，旨在降低AI数字人创作的门槛，让开发者、创作者和研究者都能自由使用。

DaVinci MagiHuman截图

准备素材：一张正面或半侧面的清晰人像照片（jpg/png），以及一段干净无噪音的音频文件。
安装环境：推荐使用Python 3.8+，通过pip install -r requirements.txt安装依赖（预训练模型自动下载）。
运行命令：执行python infer.py --photo path/to/photo.jpg --audio path/to/audio.wav，即可生成带口型的mp4视频。
参数调整：支持修改帧率、视频尺寸、推理步数等参数，平衡质量与速度。