搜狗输入法“变声”功能上线 支持千人千声一键转换
导读:5月21日搜狗输入法就化身为了现实版的变声“阿笠博士”,正式推出“变声”功能。搜狗输入声键
该功能由搜狗知音团队支持,法功可以将任意说话人的线支声音实时变换到指定说话人的音色。
不再是持千动画,也不再是人千科幻想象,AI再次带来梦想成真一刻。转换
在动画片《名侦探柯南》中,变声阿笠博士送给柯南的搜狗输入声键变声领结是柯南破案的重要道具,得益于它,法功柯南可以将声音伪装成其他人,线支在不暴露身份的持千情况下巧妙破案。
但或许你未曾想过,人千有一天,转换这个变声领结会真的变声出现在现实世界中,并且只需要在手机上轻轻一点就可以实现完美变声。
没错,现在通过搜狗输入法就OK。
现实版“柯南变声领结”
今天(5月21日),搜狗输入法就化身为了现实版的“阿笠博士”,正式推出“变声”功能。
该功能由搜狗知音团队支持,可以将任意说话人的声音实时变换到指定说话人的音色。
简而言之,只要用户在语音输入中输入想说的话,再选择一个喜爱的角色,就会瞬间把声音转化成该角色的声音,效果直逼柯南的“变声领结”。
虽然效果实现起来一步到位,但背后技术实现并不简单。
搜狗知音的语音技术团队,克服了诸多难以想象的现实困难。
其中最核心的问题是,每一个人的音调、音色和语言节奏都不尽相同,正如同世上没有两片相同的树叶一样,世上也没有两个完全相同的说话人。
如何将“千人千声”通过技术处理,变为同一种指定声音,同时还不丢失原说话人的语言习惯?
这不仅搜狗面临的挑战,也是国际上承认的技术难题。
技术剖析
搜狗知音主要从语音表征学习、语音合成等领域的展开突破。
首先,搜狗知音团队使用表征学习技术,先学习到源端说话人语音的音色、内容和韵律三大特征。
其次,将学习到的源端说话人音色特征替换成目标说话人。
最后,基于搜狗知音的端到端语音合成技术,使用内容(源端)、韵律(源端)、音色(目标端)三类特征合成最终变声音频,达到各个方位的相似和自然。
在表征学习上,对目标音色语料进行声纹特征编码,提取说话人的音色embedding,再分别从输入音频中学习内容和韵律embedding。
把“说话人归一化”模块对内容embedding进行统一规整,去除音色信息。
通过对音频特征的压缩编码及特征抽取,学习表征韵律的风格特征。
然后基于表征学习得到的特征,通过Attention和Decoder模块进行加权特征编码,并利用WaveRNN神经网络声码器恢复成波形,最终得到带有目标音色的音频。
这样一来,由源端音色到指定音色的转化就变得轻易而精密了。
在以上技术原理的支持下,搜狗知音的“变声”功能拥有三大功能亮点:
首先,还原度极高,变声到指定角色的音色与该角色的原始音色十分相似,几乎可以做到以假乱真。
其次,自由空间大,搜狗这一“变声”功能对用户本身的音色没有任何限制,每个人均可变声到预先指定的音色,真正具有“任意人变声到同一人”的能力。
最后,搜狗知音打破了音色转换的局限,将用户输入的语音内容、语速、停顿、情感等均转化为超高逼真度的指定角色声音,因此可以达到更自然的变声沟通。
目前,在搜狗知音“变声”功能中可供选择的角色横跨互联网、明星类、动漫类等多个类别,有近20种声音,包含周星驰、蜡笔小新、小猪佩奇等多个经典的角色,甚至还收录了搜狗CEO王小川的声音。
在聊天过程中,用户可以使用他们的声音完成“变装”,增添聊天过程中的趣味程度。
当然,用户一键使用最新技术的背后,也离不开工程师们的付出。
而且在类似的国际前沿的技术突破领域,中国AI公司正在用研究和论文打响名气。
在搜狗知音团队此次最新技术发布前,搜狗还联合清华天工研究院在5月17日的语音顶级峰会ICASSP 2019上,发布了关于“基于模态注意力的端到端音视觉语音识别”的学术论文。
全球AI华山论剑,中国创新正在 making different~
该功能由搜狗知音团队支持,法功可以将任意说话人的线支声音实时变换到指定说话人的音色。
不再是持千动画,也不再是人千科幻想象,AI再次带来梦想成真一刻。转换
在动画片《名侦探柯南》中,变声阿笠博士送给柯南的搜狗输入声键变声领结是柯南破案的重要道具,得益于它,法功柯南可以将声音伪装成其他人,线支在不暴露身份的持千情况下巧妙破案。
但或许你未曾想过,人千有一天,转换这个变声领结会真的变声出现在现实世界中,并且只需要在手机上轻轻一点就可以实现完美变声。
没错,现在通过搜狗输入法就OK。
现实版“柯南变声领结”
今天(5月21日),搜狗输入法就化身为了现实版的“阿笠博士”,正式推出“变声”功能。
该功能由搜狗知音团队支持,可以将任意说话人的声音实时变换到指定说话人的音色。
简而言之,只要用户在语音输入中输入想说的话,再选择一个喜爱的角色,就会瞬间把声音转化成该角色的声音,效果直逼柯南的“变声领结”。
虽然效果实现起来一步到位,但背后技术实现并不简单。
搜狗知音的语音技术团队,克服了诸多难以想象的现实困难。
其中最核心的问题是,每一个人的音调、音色和语言节奏都不尽相同,正如同世上没有两片相同的树叶一样,世上也没有两个完全相同的说话人。
如何将“千人千声”通过技术处理,变为同一种指定声音,同时还不丢失原说话人的语言习惯?
这不仅搜狗面临的挑战,也是国际上承认的技术难题。
技术剖析
搜狗知音主要从语音表征学习、语音合成等领域的展开突破。
首先,搜狗知音团队使用表征学习技术,先学习到源端说话人语音的音色、内容和韵律三大特征。
其次,将学习到的源端说话人音色特征替换成目标说话人。
最后,基于搜狗知音的端到端语音合成技术,使用内容(源端)、韵律(源端)、音色(目标端)三类特征合成最终变声音频,达到各个方位的相似和自然。
在表征学习上,对目标音色语料进行声纹特征编码,提取说话人的音色embedding,再分别从输入音频中学习内容和韵律embedding。
把“说话人归一化”模块对内容embedding进行统一规整,去除音色信息。
通过对音频特征的压缩编码及特征抽取,学习表征韵律的风格特征。
然后基于表征学习得到的特征,通过Attention和Decoder模块进行加权特征编码,并利用WaveRNN神经网络声码器恢复成波形,最终得到带有目标音色的音频。
这样一来,由源端音色到指定音色的转化就变得轻易而精密了。
在以上技术原理的支持下,搜狗知音的“变声”功能拥有三大功能亮点:
首先,还原度极高,变声到指定角色的音色与该角色的原始音色十分相似,几乎可以做到以假乱真。
其次,自由空间大,搜狗这一“变声”功能对用户本身的音色没有任何限制,每个人均可变声到预先指定的音色,真正具有“任意人变声到同一人”的能力。
最后,搜狗知音打破了音色转换的局限,将用户输入的语音内容、语速、停顿、情感等均转化为超高逼真度的指定角色声音,因此可以达到更自然的变声沟通。
目前,在搜狗知音“变声”功能中可供选择的角色横跨互联网、明星类、动漫类等多个类别,有近20种声音,包含周星驰、蜡笔小新、小猪佩奇等多个经典的角色,甚至还收录了搜狗CEO王小川的声音。
在聊天过程中,用户可以使用他们的声音完成“变装”,增添聊天过程中的趣味程度。
当然,用户一键使用最新技术的背后,也离不开工程师们的付出。
而且在类似的国际前沿的技术突破领域,中国AI公司正在用研究和论文打响名气。
在搜狗知音团队此次最新技术发布前,搜狗还联合清华天工研究院在5月17日的语音顶级峰会ICASSP 2019上,发布了关于“基于模态注意力的端到端音视觉语音识别”的学术论文。
全球AI华山论剑,中国创新正在 making different~
(责任编辑:休闲)
推荐文章
-
奈尔克与传说之炼金术士们是一款RPG模拟经营游戏,这款游戏中玩家们可以通过获取金币来建设自己的家园,还可以通过经营城镇获取各种奖励,下面是游戏介绍及预告视频,新作预计冬季上线,大家可以期待一下。发行商
...[详细]
-
【家电资讯-家电新闻 - 行业新闻,作者:编辑】 10月1日,小红书旗下自营电商“小绿洲”正式停止运营,并将于10月31日正式关
...[详细]
-
正在银川有着很多开适夏季玩水的好往背,非常保举小水陪们前往玩耍挨卡哦!那么接下去便让我们一起去看看,银川有哪些开适玩水的最好天面保举吧!详情先容请看下文。1 、沙湖旅游区沙湖位于宁夏石嘴山市仄罗县境内
...[详细]
-
【家电资讯-家电新闻 - 营销视野,作者:编辑】9月26日,海尔智家旗下全球首个场景品牌三翼鸟三周年成果发布会在西安隆重举行。会上,三翼鸟对外展示了三周年的发展历程和落地成果。同时,三翼鸟发布了其三大 ...[详细]
-
随着2018年CJ的到来,各大厂商放出了新游戏预告,可能很多小伙伴也是非常期待,这次腾讯公布了20款新品游戏,其中功能游戏居多,也预示着游戏类型的走向,下面新游戏预告大家可以了解一下。2018Chin
...[详细]
-
比去很多小水陪念到那个北京石花洞往玩,那么只需一天时候的话应当如何公讲的安排路程呢?上里是详细的先容,感兴趣的能够一起看看详情了。上午:8:30到达石花洞景区,采办门票掉队进景区。起尾旅游一层,一层有
...[详细]
-
微硬初级停业开辟经理Kat Carson的LinkedIn小我质料隐现,Xbox正正在开辟两款已公布的受权IP游戏。Carson于2020年插足微硬,自当时起,微硬并出有公布过开适描述的受权IP游戏。
...[详细]
-
又一生成式AI助手将“登机”!谷歌发布多模态Bard助理 交互式AI时代近了?
【家电资讯-家电新闻 - 行业新闻,作者:编辑】 日前在新品发布会上,谷歌正式发布新一代安卓旗舰手机Pixel 8 / Pro系列,搭载Tensor
...[详细]
-
大神是一款非常经典的主机游戏,最近关于游戏登陆steam的消息放出,不过从游戏消息来看,这款作品并不支持中文算是个比较小的遗憾,并且还会锁定30帧,下面消息内容大家可以看看。《大神:绝景版》马上要上线
...[详细]
-
2018天猫单11寻宝大年夜做战如何抢白包 白包弄法攻略大年夜齐
很多小水陪们皆正在等候本年单11的到去,活动确切非常的多,寻宝大年夜做战抢白包便是此中一个活动,去一起看看天猫单11寻宝大年夜做战活动弄法先容吧!2018天猫单11寻宝大年夜做战如何抢白包天猫单11寻
...[详细]
热点阅读

恐怖冒险新游《牧场奇谭》Steam已免费发行
佳能史诗级固件进级 佳能EOS R5告别过热闭机 -
小米推出米家中央空调风管机 3 匹,首发价 5999 元
惠而浦:控股股东格兰仕家用电器合计增持142.81万股公司股份
《暗喻幻想》试玩会活动8月3日大阪站开启
