科学家开发DIRFA:输入图片和音频,可生成说话视频
智能科技 2023-11-17 user639632
11 月 17 日消息,来自新加坡南洋理工大学(NTU Singapore)的科研团队近日开发出了 DIRFA 工具,用户给一张图片以及音频内容,可以自动生成 3D 视频,并实现口型和声音的同步协调。
DIRFA 的全称为 DIverse yet Realistic Facial Animations,训练了超过 6000 多人的 100 万个视频片段,音频片段来自一个名为 VoxCeleb2 数据集的开源数据库,并关联面部表情和头部运动。
研究人员表示,DIRFA 可能会在包括医疗保健在内的各个行业和领域带来新的应用,因为它可以实现更复杂和逼真的虚拟助手和聊天机器人,从而改善用户体验。
DIRFA 还可以作为言语或面部残疾人士的强大工具,帮助他们通过富有表现力的头像或数字表示来传达他们的想法和情感,从而增强他们的沟通能力。
【来源:IT之家】
The End
相关阅读
- 苹果暂停下一代高端头显研发,侧重明年发布更平价Vision Pro
- 一周一涨:特斯拉中国 Model Y 长续航版升至 30.64 万元
- 苹果iOS将迎来重大变革,但中国用户为何无缘?
- 罗振宇辟谣跨年演讲上座率不到三分之一:现场人数还可以
- 微信好友达上限后能看到删除你的人:正在灰度测试中
- 外企杀手!马斯克不去印度建厂原因揭秘:当地赚钱都不一定能花
- 谷歌前CEO谈OpenAI CEO离职:他将公司从一无所有发展到价值900亿美元
- 德勤:2024年AI带动半导体行业复苏,预估5880亿美元、同比增长13%
- 深蓝S05引领汽车行业交互新纪元:智趣融合,重新定义人车交互标准
- 消息称英伟达再为中国开发特供版新旗舰AI芯片