2022年1月7日,微软正式宣布,在基于微软智能云Azure的深度神经网络TTS(Text-to-Speech)支持下,中国领先的智能电动汽车公司小鹏汽车已经顺利完成其车规级语音助手的升级,进一步提升智能汽车语音助手的技术水准。
目前,购买小鹏汽车P7车型的中国用户,可以通过OTA(Over-The-Air)升级这款可媲美人声的全新智能语音助手“小P”,小鹏汽车也计划通过OTA将这一技术升级引入其他几款车型当中。
据悉,在为期数月的合作中,微软与小鹏汽车携手攻克了语音合成技术应用面临的三个技术挑战:
首先,为了解决汽车场景下的网络抖动问题,高质量保障语音功能的持续运行,小鹏汽车搭建了多级缓存架构,可以提前预置和缓存高质量语音文件,最大程度上降低了该功能对网络的依赖;
其次,为了在不占用过多资源的前提下,依然能提供媲美人类的真实声音体验,小鹏汽车借助了微软智能云Azure的缓存和压缩功能,可以将语音文件压缩到24KHz的采样率和16位的量化水平,大大减少了数据网络和整车算力的资源压力;
最后,双方还在减少合成语音歧义和多音字优化准确性方面做出了诸多改进。
在双方的努力下,全新的车载语音合成功能在语音保真度、功能性和场景优化上都达到了新的水平,小鹏汽车能够在更多的使用场景中部署语音助手,让其成为直观驾驶体验中不可或缺的一部分。