IT商业科技网

如何让AI发音更像真人?平安语音技术让声音更有温度

来源:IT商业科技网整合    时间:2020-09-25 10:35:19    IT商业科技网

【IT商业科技网讯】你收到的语音到底是不是真人呢?可别那么快就下定论!

近期,不少人遭遇了“本人语音”的电信诈骗。当收到朋友的借钱微信后,人们的第一反应通常是朋友被盗号了,但“朋友”立马补充了一条“真人语音”做确认。许多人往往一听到朋友的声音,便放心将钱转了出去,等到收款后被拉黑,被骗人才恍然大悟朋友的微信真的被盗了。对于类似高技术含量的骗局,人们往往防不胜防。

如何让AI发音更像真人?平安语音技术让声音更有温度

平安科技研究语音技术的科学家们正在努力研究语音防伪技术,并有了突破性的进展,最近,已于国际会议Interspeech2020上发表了专业论文"Improving Replay Detection System with Channel Consistency DenseNeXt for the ASVspoof 2019 Challenge"。

平安科技研究语音技术的科学家表示:AI语音合成并没有想象中那么简单。

六种情绪设定,攻克机器音“情绪”难题

基于20年的客户服务积累,如今平安AI语音平台已实现客服工作的AI覆盖率达83%,解决率接近90%。通过平安智能语音中台的运用,成功赋能超8万位远程坐席。平安AI客服所使用的并不是刻板的电子音,而是非常有人情味的talker。使用过Siri等智能助手的用户对于“机器音”并不会陌生,机器的声音往往是冰冷而生硬的,没有抑扬顿挫的语调,也不会适时地断句。让机器的声音口语化是语音合成遇到的第一个问题。

机器声音的口语化意味着情绪与技术的深度融合,而“情绪识别”早已成为学术界和商业界公认的难点问题。近年来,平安科技的研发团队在该领域的研究中取得了突破性进展,并基于平安特定业务场景,实现了文本情绪识别,通过识别用户或坐席的情绪状态,已可分辨出为正面、负面和中性三大类别。研发团队也将继续把“情绪”作为研发的重点和难点,相信在不久之后,喜怒哀乐终将从机器人的口中传递出来。

通过结合金融行业的属性与平安日常的业务场景,研发团队的科学家为语音机器人配备了4种基于语气来区分语音的合成音库,充分满足营销所需。例如,客服人员交流,需要温和的语气;而电商促销,则需要高兴、积极的语气。尽管目前科学家们对于情感语音仍在探索中,但研发团队已经为不同的情绪风格分别录入了数百句话并导入了语音库中,在收集了一定数量的素材之后,基于素材建造训练模型,再通过模型构架、网络构架的优化,不断地进行机器训练,直到最后机器人拥有与真人相似的语气及情绪,能和人们进行生动、无障碍的自然交流。

多方联合建立方言语音库,让AI成为“地道的中国人”

许多人在学普通话之前,首先学会的“母语”其实是所在地区的方言,如今人群中方言的使用比率依然很高。以上海话为例,平安科技的研发团队针对上海方的言研发做了大量工作,调研显示2019年上海的外地人口比例在4成左右,即便是聚集四面八方“沪漂”的上海,使用上海方言的本地人占比仍能达到6成左右。

对于一个普通人来说,掌握多种方言并不容易,但对于人工智能而言,它可以通过海量的语音训练掌握更多种类的方言。平安科技的科学家认为中国的人工智能,应当是“一个地道的中国人”。除了普通话,地大物博的各地区方言,它也能听得懂才行。

为了可以让AI更好地识别方言,平安科技的科学家们将中国划分为8个方言区。以上海话为例,他们设计了一套详细的上海话规则,给到标注人员去标注。在这其中,还有一个难点就是语音库的建立。

平安科技科研队伍人员来自全国各地,然而来自上海本地的同事仅有两位,无法组件丰富的语言库样本。

为了建立丰富的上海话语言库,平安科技的研发团队与多个上海高校展开合作。找到学校的大学老师,并招募学校里的上海本地同学帮忙录音与标注。目前,平安科技正在研发上海话语音合成模型,提供专业服务的同时也不忘人情味的加入,打破语言边界,让沟通变得方便高效。

截至到目前,平安科技技术研究院语音技术团队结合具体的业务场景,总共梳理了两三万句业务话术,并整理出一些常用的口语标记。接到平安AI客服电话时,听到的是机器实时合成的机器音,并没有冰冷与生硬,而是一种较人性化、较柔和的拟人声音,这是通过大量的机器学习、深度学习来实现的。

技术不断的精进,让机器的学习也不断深入。而无限接近人类的拟人化、人性化,将成为AI未来发展需要攻克的长期命题。未来,平安科技还将继续完善AI学习的数据库,让语音技术在不断实践与训练中获得更人性化的提升,为更多的场景中的智能化运用实现更多助力。未来,平安科技的专业团队将致力于语音防伪技术落地,保障广大群众财产安全,更好地承担社会责任。

【责任编辑:小娟】

声明:来源非IT商业科技网的作品均转载自其它媒体,转载请尊重版权保留出处,一切法律责任自负。文章内容仅供阅读,不构成投资建议,请谨慎对待。投资者据此操作,风险自担。

频道精选
失血、裁员、股价暴跌:Meta 正在成为硅谷的泰坦尼克

失血、裁员、股价暴跌:Meta 正在成为硅谷的泰坦尼克

这一次,扎克伯格面临的困境,比过往任何一次都要更严重。过去一年,Meta的市值蒸发了60%,且这场下沉并没有“触底”的迹象。
Meta 元宇宙 资讯
胖东来也被东北农嫂“绊倒”,农产品销售的水有多深?

胖东来也被东北农嫂“绊倒”,农产品销售的水有多深?

一根玉米,不仅在直播电商江湖掀起一片浪,这浪还拍到了线下卖场。9月30日,东北农嫂与“胖东来召回8.5元玉米”双双登上热搜。
东北农嫂 胖东来 资讯
理想L8Pro版不够Pro 真正的One More Thing不是L7

理想L8Pro版不够Pro 真正的One More Thing不是L7

理想 L8 与 L7 都分别有 Pro 与 Max 版本,主要的差别在前者配备 SS Pro、AD Pro,而后者配备 SS Max、AD Max。正如前文所讲,如果类比 iPhone 的话,其实 L8 Pro/L7 Pro 并不够 Pro。
理想L8 汽车
前副总被监视居住,昔日“果链一哥”欧菲光近况如何?

前副总被监视居住,昔日“果链一哥”欧菲光近况如何?

还记得昔日的“果链一哥”吗?作为苹果产业链曾经的重磅企业,在2019年其手机摄像头模组出货量一度达到全球第一。在失去大客户苹果后,欧菲光现状如何?
欧菲光 果链 资讯
鹏鼎控股背靠富士康盈利大增有隐忧 “果链”上游还香吗?

鹏鼎控股背靠富士康盈利大增有隐忧 “果链”上游还香吗?

继出现了“被iPhone14收割的黄牛”、“iPhone14或成史上销量最差机型”等热搜,内容包括iPhone14跌破发行价、倒贴100元出、郑州富士康拆除iPhone14部分产线等,引发网友热议
鹏鼎控股 富士康 果链 互联网
蜜雪冰城们的瓶装水“混战”:讲水源、玩概念、掀起价格战

蜜雪冰城们的瓶装水“混战”:讲水源、玩概念、掀起价格战

传统食品企业、饮料企业、新茶饮品牌、互联网零食品牌等纷纷加入,大众消费市场有望迎来新一轮的瓶装水之争。
蜜雪冰城 瓶装水 互联网
威马汽车亏损82亿、创始人沈晖年薪12亿上热搜,若上市失败或将

威马汽车亏损82亿、创始人沈晖年薪12亿上热搜,若上市失败或将

在日渐走低的营收状况与巨额亏损数额下,威马创始人、董事长兼首席执行官沈晖的薪酬受到了多方关注。
威马汽车 汽车
G9上市不到两天更改配置单“二次上市”,何小鹏花2亿紧急增持

G9上市不到两天更改配置单“二次上市”,何小鹏花2亿紧急增持

无论是小鹏在G9上市不到48小时内通过火速更改配置单完成“二次上市”,抑或是何小鹏此次对小鹏汽车进行的股票增持,背后都或多或少地体现出小鹏汽车在竞争越加激
小鹏汽车 G9 汽车
黄光裕夫妇今年减持套现达9.6亿港元 以解国美燃眉之急?

黄光裕夫妇今年减持套现达9.6亿港元 以解国美燃眉之急?

近日港交所披露了国美零售大股东黄光裕夫妇在9月14日和9月15日的大手笔减持动作,两天操作了三次,卖出15.28亿股,套现2.95亿港元。
黄光裕 国美 互联网
趣店的动荡与不安:“切割”罗敏,为时已晚

趣店的动荡与不安:“切割”罗敏,为时已晚

经由预制菜风波,背负着巨大争议和“污点”的罗敏,似乎已经成了趣店转型的一大阻碍,比起业务调整,他的卸任传达出更多的信号。
趣店 预制菜 资讯

2017-2019 Copyright © IT商业科技网 备案许可证号豫ICP备18040629号 豫公网安备110102003388号

技术支持:沿亮云科技