人民日报出版社主管 人民周刊杂志社主办

010-65363526rmzk001@163.com
首页 > 栏目 > 科学 > 正文

“车载助理”“随行翻译”“会议记录员”……

智能语音技术:角色可变换,服务多场景

都 芃    2024-05-13 10:36:46    科技日报

“关闭车窗、打开空调、降低音乐音量……”在不久前举办的2024(第十八届)北京国际汽车展览会上,有参观者坐进展台上的一辆智能网联汽车,对着智能车机连续发出多个指令。话音刚落,各项指令一一被车辆准确响应。

近年来,我国智能网联汽车产业快速发展,汽车智能化程度不断提升。语音控车正成为汽车产业发展中广泛落地的智能场景。

在本次汽车展览会上,新能源智能网联汽车是绝对主角。不仅多家品牌展出了搭载最新智能成果的新车型,展会也专门开辟出智驾未来展区,集中展示智能网联汽车相关技术成果。

参观体验了多款智能网联汽车后,记者发现,各家品牌车型虽然功能不尽相同,但乘客与汽车之间的交互均围绕语音建立。在语音控车场景下,只需短短一句话,甚至几个词,汽车便可根据乘客指令快速作出相应操作。

本次汽车展览会参展商科大讯飞AI研究院副院长高建清介绍,目前,搭载科大讯飞语音技术的车型可以为海外车主提供对话快速响应、问题回答准确的语音交互服务,已覆盖23个主要语种,搭载车型销往亚洲、欧洲、南美等地的60多个国家和地区。“我们已经与中国汽车‘出海’十强企业中的8家展开合作,助力中国汽车走得更远。”他说。

除了语音控车场景,翻译交流也是智能语音技术应用最广泛的场景之一。在不久前的第四届中国国际消费品博览会上,有外国客商拿着国产品牌翻译机,与在场工作人员你一言我一语地畅聊起来。嘈杂的环境没有影响翻译效果的准确性,不同语言得到了快速、准确的翻译传达,仿佛一名随行翻译就站在身边。

同样借助语音技术实现智能升级的还有会议场景。在数十人参加的会议讨论中,只需拿出智能录音笔,放在会议室一角,每个人的发言均可被精准记录并实现快速转写,甚至还可以一键生成会议总结,大大减少了人工记录工作量。除此以外,智能语音技术的典型应用场景还包括智能家居、智慧教育、手机智能助手等。

多场景广泛应用的背后,是我国智能语音技术近年来的不断突破。语音输入最大的挑战是场景复杂。用户的输入场景情况各异,无处不在的噪声、混响直接影响着语音识别的准确率,进而影响用户的语音交互体验。大模型的发展则给智能语音技术带来了新的前进动力。

高建清介绍,认知大模型的出现,让自然语言处理类任务的上限大幅提升。结合大语言模型更精准的语义理解和更精细的描述能力,各类语音任务也能快速突破效果上限。

“同时,我们也要结合语音属性解耦预训练和语义语音互增强编码等技术,构建起适用于各类场景的语音大模型,让智能语音技术赋能更多场景。”高建清说。

(责编:赵珊)

相关热词搜索:

上一篇:提升科学素养 感受自然之美
下一篇:发展科幻产业,让更多“未来”照进现实

人民周刊网版权及免责声明:

1.凡本网注明“来源:人民周刊网”或“来源:人民周刊”的所有作品,版权均属于人民周刊网(本网另有声明的除外);未经本网授权,任何单位及个人不得转载、摘编或以其它方式使用上述作品;已经与本网签署相关授权使用协议的单位及个人,应注意作品中是否有相应的授权使用限制声明,不得违反限制声明,且在授权范围内使用时应注明“来源:人民周刊网”或“来源:人民周刊”。违反前述声明者,本网将追究其相关法律责任。

2.本网所有的图片作品中,即使注明“来源:人民周刊网”及/或标有“人民周刊网(www.peopleweekly.cn)”“人民周刊”水印,但并不代表本网对该等图片作品享有许可他人使用的权利;已经与本网签署相关授权使用协议的单位及个人,仅有权在授权范围内使用图片中明确注明“人民周刊网记者XXX摄”或“人民周刊记者XXX摄”的图片作品,否则,一切不利后果自行承担。

3.凡本网注明“来源:XXX(非人民周刊网或人民周刊)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。

4.如因作品内容、版权和其它问题需要同本网联系的,请在30日内进行。

※ 联系电话:010-65363526 邮箱:rmzk001@163.com