查看原文
其他

孙境廷:让机器能听会说,我们来做一场“模仿游戏”

我是科学家 我是科学家iScientist 2022-10-01

11月15日,“我是科学家”将举办第29期活动

“听!奇妙的声音”




本期演讲嘉宾



孙境廷

科大讯飞研究院院长助理

语音识别高级研究员


《让机器能听会说,我们来做一场“模仿游戏”》



孙境廷采访视频:

https://v.qq.com/txp/iframe/player.html?width=500&height=375&auto=0&vid=d320271gqhf  


“不要行驶太快,志玲很担心你。”地图导航软件的播报声音,想必很多人都不陌生。


地图软件导航播报 | Pixabay


这么多地名、指示词,都是林志玲一字一句录的吗?


“其实只录了一部分,大部分是机器合成出来的。”科大讯飞研究院院长助理、语音识别高级研究员孙境廷解释道。


1999年,讯飞创业初期,主攻方向就是语音合成技术——一段文字,让机器朗读出来。“现在这个技术比较常见了,比如列车到站、汽车导航的播报,不可能让一个播音员录这么多信息,上百万条地理位置,其实还是要靠机器合成。”


语音合成技术日渐成熟,讯飞也在研发过程中积攒了诸多经验。“我们知道在连续话语中什么样的韵律变化最自然,什么样的声韵调最符合发音标准。”


讯飞也在研发过程中积攒了诸多经验 | Pixabay


“所以,在这之后我们开始做语音评测。现在小朋友的英语口语考试,或者中文的口语考试,其实背后评分的已经不完全是真正的老师了,而是机器在做辅助评判。”机器可以精准地判断,一个字发音的声母韵母是否饱满,发音声调是否正确。


合成声音、测评声音,再下一步,讯飞想让机器理解声音——语音识别


“比方说,在一场鸡尾酒会里,会有很多人在同时说话,人类天生具有这样的声音处理能力,可以集中在某一个人的声音而忽略其他声音和噪音。机器已经实现了在相对安静的环境下听一个人说话基本不出错的能力,而在不久的将来,我们还要让机器能够在大量语音交叠的场景中,区分出不同的说话人,知道每个人说了什么,这样的话,即使在嘈杂环境中,我们一样可以将语音转成文字,让机器具备真正的交谈能力。”


除了将人类语音转录成文字,语音识别还可以拓展到许多应用场景,比如用声音识别机器故障。“很多机器设备出现故障,肉眼还看不到损坏,但声音已经不同。所以工业、电力、水利等领域,都还有很多机器设备的运维是通过老师傅用耳朵来听。我们希望能把老专家的经验记录下来,让机器学会识别故障,从而减缓巡检人员的工作压力,保障工业生产的安全和高效。”


不只是机器,许多动物状态不对,声音也会更先出现问题。“比如在养猪场,小猪出现呼吸道疾病,可能会先出现咳嗽的症状。有经验的养猪户能听出来,小猪发出哼哼的声音与平时不同。养猪户不可能不休不眠去听小猪的声音,但我们的机器可以一直监听,然后在第一时间进行预警和干预,以防疾病扩散。”


识别设备故障、猪咳嗽声、语音播报、语音操控……讯飞的智能语音技术,已经在支持生产和生活的方方面面。孙境廷介绍,讯飞其实不仅关注项目的实用性,还有人文关怀。


“2018年,央视有一档节目《创新中国》,我们通过20个小时左右的历史配音数据,复刻了一位已故配音艺术家李易老师的声音。”许多李易老师的朋友在看到作品时非常激动——他们没想到还能重新听到离世亲友的配音。


当模拟李易老师声音的人工智能配音响起,李瑞英、朱军、沙桐、邹悦等“央视名嘴”,都感到非常吃惊 | 《创新中国》


讯飞智能语音技术保存、复刻的,还有很多正在消失的方言和小语种。“我们的研究人员真的走到深山里,去拜访那些说方言和小语种的老人,把最原汁原味的声音录下来之后,通过智能语音技术把发音规范保留下来。曾经我们训练了一套藏文的语音合成系统,希望通过这个系统富有韵味、抑扬顿挫的声音,读出一整部《大藏经》。”


孙境廷感慨:“如果我们没有把这些声音录下来,做成语音合成系统,很多濒危语言可能随着历史就消失了。”


2016年,孙境廷问云计算的同事:讯飞的语音识别系统用了多少数据?


同事反问他:你知道银河系的恒星有多少颗吗?


“我们的语音数据和银河系的恒星一样多,你抬头望天,比所有能看到的星星都多。”茫茫星海一般的声音数据:逝去亲友的声音、正在消逝的方言、机器设备的轰鸣声、智能化猪舍里小猪的咳嗽声……各式各样的声音组成了讯飞的声音博物馆。


“讯飞收集了很多声音,但我们想做的,并不仅仅是单纯的声音陈列者。我们承接过很多科研项目,在我看来,它们又不单只是前瞻研究。我们希望用科学的方法做有意义的研究、做有价值的事,希望科大讯飞的事业能为国家、社会做出一些贡献。”


11月15日,欢迎来北京朝阳大悦城·9层晓岛,听孙境廷老师聊聊科大讯飞和智能语音的故事。


监制:吴欧

策划:麦芽杨

编辑:麦芽杨

撰稿:范可鑫

排版:凝音


2020年11月15日14:00-16:30

北京 · 朝阳大悦城 · 9层晓岛

扫描下方二维码立刻报名

(报名11月14日截止)  



名额紧俏,请珍惜到场机会哦~


注意事项

1、不可携带有色或含糖的饮料、书籍、食物、植物、宠物等入场。

2、建议12周岁以上报名,报名时请如实填写年龄。

3、报名后将由工作人员随机筛选:所有幸运入选的观众,将在11月14日之前给您发送短信通知,请您查收短信或自行查看报名状态。

4、现场凭报名通过审核短信入场。

5、请提前准备好北京健康宝,保证健康码为绿码才可进入。

6、请遵守场地防疫要求,全场活动佩戴口罩。


精彩直播同步上线

请关注“我是科学家“在

一直播、网易、腾讯、哔哩哔哩官方主页


我是科学家

一直播

网易

b站


交通贴士

地址

北京市朝阳区朝阳大悦城9层 · 晓岛

(商场4号电梯直达9层,出电梯即到)

周末商场停车位紧张,请尽量使用公共交通

公交

  • 372路,389路,478路,B支8路,B支8路区间

地铁:

  • 6号线青年路站B口

导航定位:朝阳大悦城


欢迎个人转发到朋友圈


点击“阅读原文”立即报名


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存