头条

NVIDIA发布Fugatto AI，可创新音效及人声

时间：2024-12-03 08:13

　　NVIDIA近日推出全新AI模型Fugatto，用于音乐、电影及游戏制作中的音效、人声调整及音乐生成。该模型正式名称为“第一号基础生成式音讯转换器”（Foundational Generative Audio Transformer Opus 1），目前尚未公布上市计划。

　　据路透及The Verge报道，Fugatto可通过文字指令生成音效或音乐作品，其突破性特色在于能创造新奇声音，如类似狗吠的小号声。

　　此外，用户可将现有音讯档案汇入Fugatto进行修改，如将钢琴旋律转换为人声吟唱，或改变人声录音的腔调和语气。

　　NVIDIA应用深度学习研究副总Bryan Catanzaro表示，合成音讯技术已存在50多年，Fugatto等生成式AI工具将为音乐带来更多变革。

　　然而，娱乐产业对AI技术应用持怀疑态度，特别是近期好莱坞女星Scarlett Johansson控告OpenAI语音生成工具未经授权模仿其声音的事件。

　　NVIDIA目前使用开源数据和音档训练Fugatto，但尚未决定是否公开该技术。Catanzaro指出，生成式技术存在风险，需谨慎考虑潜在恶意用途。