18143453325 在线咨询 在线咨询
18143453325 在线咨询
所在位置: 首页 > 营销资讯 > 行业动态 > 为什么要教小冰唱歌?

为什么要教小冰唱歌?

时间:2022-03-31 06:36:01 | 来源:行业动态

时间:2022-03-31 06:36:01 来源:行业动态

唱歌是微软小冰在人工智能的声音创造方面取得的巨大突破,甚至可以说是语音合成技术领域的最高限。在昨天与媒体的交流中,微软小冰首席语音科学家栾剑透露了微软之所以教小冰唱歌的初衷:第一,在语音领域,唱歌的技术门槛比说话高;第二,音乐的情感表达更加丰富和激烈;第三,音乐是一个很重要的娱乐形式。



微软小冰首席语音科学家栾剑

因此,选择唱歌这样一个极具挑战的领域,一方面能够推进微软小冰人工智能框架在语音方面的研究,另一方面,通过这种更为大众广泛接受的产品和成果,也能更容易获得用户的交互和反馈信息,反过来推动技术的发展。

2015年,我们第一次听到了微软小冰的声音生动活泼、古灵精怪,这样一个萌妹子人设很快俘获了众多消费者的心。虽然那时候的她已经具备了很多声音技能,比如儿化音、中英文混杂的朗读、讲儿童故事等等,但在音乐方面却是一窍不通。

而在短短的四年时间里,小冰是如何快速从一个音痴变成一个唱作歌手的呢?栾剑介绍,小冰的学习渠道有两种,一是和人类歌手学习,二是识别曲谱进行演唱。对于人来说,可能前者是相对简单和广泛的学习方式,但机器恰恰相反,后者的输入方式更加便捷和清晰,能够减少很多误差。

通过参数合成的方法,小冰团队采集了发音、 节拍、旋律这三大音乐元素,并对声谱参数、节奏序列、音高轨迹分别建模,根据三个参数统一构建模型,生成最终声音波形。

和所有的深度学习任务一样,这个过程需要大量数据的支持。然而,在AI唱歌领域,清唱数据却严重缺乏,绝大部分数据都是混杂着伴奏的音轨,这样的干扰对于人声的提取和模型的训练提出了巨大挑战。对此,小冰团队通过人声部分检测、音素时刻对齐、音高轨迹提取等方式弥补了不足。

现在,小冰已经在演唱和作曲方面双开花。比如,在音乐平台中充当虚拟歌手,既可以发单曲,也可以帮助音乐公司完善歌手库;比如,为音乐创作者演唱歌曲小样;再比如,通过音乐生成平台,小冰还可以为音乐创作者提供许多音乐制作的工具。接下来,我们还会把更多的人工智能元素加进去,帮助大家作词、作曲,或者在已有词曲基础上进行修改和完善。在这方面,她会给音乐领域带来巨大的经济价值。栾剑表示。

关键词:

74
73
25
news

版权所有© 亿企邦 1997-2022 保留一切法律许可权利。

为了最佳展示效果,本站不支持IE9及以下版本的浏览器,建议您使用谷歌Chrome浏览器。 点击下载Chrome浏览器
关闭