LOADING

热门

JoyGen

2个月前发布 6 00

JoyGen是一个音频驱动的3D深度感知说话人脸视频生成框架。它通过音频驱动生成嘴唇运动和视觉外观合成，旨在实现精确的嘴唇-音频同步和高视觉质量。

收录时间：

2025-02-16

AI大模型 AI工具 # 3D说话人脸生成 # JoyGen # 音频驱动3D说话人脸视频模型 # 音频驱动视频生成

JoyGen

JoyGen

JoyGen是由京东科技与香港大学合作开发的音频驱动 3D 说话人脸视频生成框架，采用一种新颖的两阶段框架。该技术通过音频输入驱动 3D 深度感知模型，实现精确的唇部与音频同步，以逼真模拟说话者的唇部动作和面部表情，生成高度真实的视频内容。JoyGen 主要应用于视频编辑和虚拟交互领域。

技术特点:

音频驱动唇部运动生成： JoyGen 使用 3D 重建模型和 audio2motion 模型，分别预测身份和表情系数，通过将音频特征与面部深度图结合，实现精确的唇部与音频同步。
视觉外观合成：提供高质量的视觉外观合成，确保视频的视觉效果和唇部运动的自然性。
数据集支持： JoyGen 使用了一个包含 130 小时高质量视频的中文说话人脸数据集进行训练。该数据集与开放的 HDTF（高分辨率深度图数据集）结合，支持中文和英文输入。
情感表达： JoyGen 还考虑了音频的情绪特征，能够在生成的动画中自然地表现出人物的情感变化，例如微笑或皱眉等，使生成的视频更加生动和真实。

如何使用JoyGen：

环境搭建：用户需创建一个特定的conda环境，并安装必要的依赖包，包括Nvdiffrast等特定库。
预训练模型下载：获取JoyGen的预训练模型，包括3D模型、音频到运动模型等，这些资源通常在项目GitHub页面上提供。
运行推理：通过执行特定的脚本和参数，用户可以将音频文件转换为带有逼真唇部同步的3D说话人脸视频。

应用场景：

视频编辑：用于编辑和生成高质量的说话人脸视频，适用于各种视频制作和编辑需求。
虚拟主播：为虚拟主播提供精确的嘴唇同步和自然的面部表情。
教育和培训：用于制作教育视频和培训资料，提升视频内容的互动性和生动性。

通过这些功能，JoyGen 在说话人脸视频生成和编辑方面展现了强大的能力。

GitHub：https://github.com/JOY-MM/JoyGen

JoyGen – 音频驱动的3D深度感知说话人脸视频生成框架

数据统计

相关导航

Janus-Pro

Janus-Pro是由 DeepSeek AI 开发的先进多模态 AI 模型，专注于实现图像理解与图像生成的无缝结合。Janus-Pro 通过优化的训练策略、扩展的训练数据和更大的模型规模，在多模态理解和文本到图像生成方面取得了显著进步。

Spark-TTS

Spark-TTS是SparkAudio团队开源的基于大型语言模型（LLM）的高效文本转语音（TTS）工具，无需额外的生成模型，直接从LLM预测的编码中重建音频，实现零样本文本到语音的转换。Spark-TTS支持中英双语，具备跨语言合成能力，可通过参数调整（如性别、音调、语速）生成虚拟说话者的声音，满足多样化需求。

Aidge

Aidge基于阿里巴巴国际数字商业集团的大语言模型和多模态大模型，结合对全球商业的深度洞察，为客户提供全面的国际电商AI云服务。Aidge 聚焦商业场景，让客户的全球经营效果更好，成本更低。Aidge 作为国际电商领域专业前沿且经验丰富的AI服务提供方，拥有极强的多语言能力、本地化能力和营销设计能力，帮助企业客户降低语言和文化门槛，解决中小企业难以获得设计、营销、服务和人才等问题。

BusinessAI

创新在线工具集合

小半WordPress AI助手

小半WordPress AI助手是一款开源、功能强大的 WordPress AI插件，旨在提升用户的写作和文本处理体验。该插件支持 AI 对话聊天、文章生成、文章总结、文章翻译、生成 PPT 等功能，并能够对接 DeepSeek、豆包、通义千问等多种 AI 模型。小半 WordPress AI 助手不仅能够自动朗读 AI 对话内容，还具备文章翻译和语音播放的能力。

Ai好记

Ai好记是一款AI音视频转录与总结，旨在提升用户的学习和工作效率。提供AI播客总结、AI音视频翻译、AI音视频转图文、AI大纲与思维导图、AI音视频总结等功能，适用于学习、工作与创作者场景。

BoloForms

BoloForms是一个面向小型企业的经济实惠的电子签名平台，旨在通过简化文档管理、提高团队协作效率。用户可以使用BoloForms来创建、发送、签署和管理各种文档，包括合同、表单和模板，一切都以固定价格提供，没有任何额外收费。

PicTech AI

免费在线图片翻译

暂无评论

您必须登录才能参与评论！

none

暂无评论...