百度文心一言上线语音定制功能:2秒完美复刻个人声音
百度日前官方宣布文心一言语音定制功能上线,只需2秒钟,AI 就能完美重建任何一个人的声音,每个人都能拥有自己的AI声优。 用户只需打开文心一言App,选择创建智能体,点击创建自己的声音,随后系统会给出一句话,只需用平时说话的语气念一遍。 约2秒左右即可获得媲美真人、流畅自然的合成效果,并且合成的音频完美保持了朗读这句话时的情感、风格和自然度。 不仅如此,用户还能构建自己的个性化音库,再匹配上虚拟形象,即可快速打造出一个数字分身。 此外,该功能对不同性别、不同年龄的人均适用,尤其是小孩和重口音的兼容效果非常出色,能很好的保留相应的风格和口音,适合中国社会地域分布广泛,口音众多的特点。 而且相比于传统学术领域的语音合成技术,百度新技术有较强的抗噪能力,即使原始录制音频背景嘈杂,依然能够获得流畅的、音质干净的合成效果。 据介绍,之所以能在2秒钟内复刻声音,是因为百度的语音合成新技术,可以让AI真正理解文本和声音的对应关系。 很多时候甚至能理解文本中的情绪,最大程度上保持原声的情感、风格和自然度,因此只需要极短的样本,几秒钟就能完成。
百度日前官方宣布文心一言语音定制功能上线,只需2秒钟,AI 就能完美重建任何一个人的声音,每个人都能拥有自己的AI声优。
用户只需打开文心一言App,选择创建智能体,点击创建自己的声音,随后系统会给出一句话,只需用平时说话的语气念一遍。
约2秒左右即可获得媲美真人、流畅自然的合成效果,并且合成的音频完美保持了朗读这句话时的情感、风格和自然度。
不仅如此,用户还能构建自己的个性化音库,再匹配上虚拟形象,即可快速打造出一个数字分身。
此外,该功能对不同性别、不同年龄的人均适用,尤其是小孩和重口音的兼容效果非常出色,能很好的保留相应的风格和口音,适合中国社会地域分布广泛,口音众多的特点。
而且相比于传统学术领域的语音合成技术,百度新技术有较强的抗噪能力,即使原始录制音频背景嘈杂,依然能够获得流畅的、音质干净的合成效果。
据介绍,之所以能在2秒钟内复刻声音,是因为百度的语音合成新技术,可以让AI真正理解文本和声音的对应关系。
很多时候甚至能理解文本中的情绪,最大程度上保持原声的情感、风格和自然度,因此只需要极短的样本,几秒钟就能完成。