头条
NVIDIA发布Fugatto AI,可创新音效及人声
时间:2024-12-03 08:13
NVIDIA近日推出全新AI模型Fugatto,用于音乐、电影及游戏制作中的音效、人声调整及音乐生成。该模型正式名称为“第一号基础生成式音讯转换器”(Foundational Generative Audio Transformer Opus 1),目前尚未公布上市计划。
据路透及The Verge报道,Fugatto可通过文字指令生成音效或音乐作品,其突破性特色在于能创造新奇声音,如类似狗吠的小号声。
此外,用户可将现有音讯档案汇入Fugatto进行修改,如将钢琴旋律转换为人声吟唱,或改变人声录音的腔调和语气。
NVIDIA应用深度学习研究副总Bryan Catanzaro表示,合成音讯技术已存在50多年,Fugatto等生成式AI工具将为音乐带来更多变革。
然而,娱乐产业对AI技术应用持怀疑态度,特别是近期好莱坞女星Scarlett Johansson控告OpenAI语音生成工具未经授权模仿其声音的事件。
NVIDIA目前使用开源数据和音档训练Fugatto,但尚未决定是否公开该技术。Catanzaro指出,生成式技术存在风险,需谨慎考虑潜在恶意用途。