蔚来眼中的 NOMI 到底能做什么?数字座舱要朝着哪个方向发展?蔚来开发 NOMI 的过程遇到了哪些挑战?还有,未来的 NOMI 们将是怎样的?
NOMI > 车载语音助手
2017 年,蔚来发布第一款旗舰 SUV ES8。随着 ES8 上市,NOMI 成为全球首个量产的车载人工智能系统。
NOMI 取自英文 Know Me 的谐音,代表了蔚来对车内智能交互体验的追求——「懂我」。如果你看过科幻电影《Her》,NOMI 就相当于是蔚来版的「Her」。
在蔚来 ES8 和 ES6 开始交付后,NOMI 以智能化、人性化的交互体验,收获了一大批车主和蔚来粉丝的喜爱。
许多人认为 NOMI 就是车内的语音助手,实际上蔚来在 NOMI 上寄予的期望远超于此。
更少为人知的是,NOMI 甚至是蔚来展开智能座舱设计的中心。
不少车企的智能座舱设计是以屏幕为中心,比如拜腾希望通过大屏的设计营造一种坐在客厅交互和娱乐的体验。而蔚来把座舱前方最中心的位置留给了 NOMI。
以 NOMI 为中心,蔚来 ES8 上 9.8 英寸的数字仪表屏、11.3 英寸的中控屏和 10 英寸的 HUD 依次展开。
实际上,再加上中控屏下方支持手机无线充电的区域(手机屏),以及 NOMI 本身的屏幕,这 5 块屏幕就是蔚来数字座舱体验的基础。
开发 NOMI,难在何处?
蔚来 0001 号员工、负责产品管理的助理副总裁李天舒,在 6 月 5 日「汽车之心·行家说」分享上就讲到:
蔚来认为 NOMI 所在的位置是最能体现一辆车灵魂与核心的位置,而其他的屏幕不追求尺寸最大,而是追求合适和好用,并且其他屏幕在一定程度上都在为 NOMI「让位」。
作为 NOMI 开发过程中的产品经理,他回忆:
当时团队想到的让 NOMI 做的第一件事并不是完成复杂的自然语言交互和多轮对话,而是当车主打开车门的那一刻,NOMI 可以把车当成是自己的肌体一样,感受到有人进入车内了,然后它把头扭向有人开门的方向,和用户打个招呼。
「NOMI 与车互为本体,是车辆与用户交流的唯一面容和灵魂。」
作为一个 AI 实体,NOMI 能够通过声音、表情、动作来展示虚拟助手无法完成的精微互动。比如当用户伸手触碰屏幕时,NOMI 可以把自己的头稍微低一点,看看用户想要在屏幕上面做点什么。当用户把手收回来,NOMI 的头又会抬回去。
NOMI 的研发开始于 2015 年,作为一个过去没有其他车企量产过的 AI 实体,李天舒说 NOMI 开发过程中遇到了多重挑战:
第一个问题是 AI 的恐怖谷效应,也就是当 AI 与人在外表或者动作十分相像时,人类会对 AI 产生好感,但同时随着相似度增加,人们又会注意到 AI 与人的细微差别,而产生恐惧的心理;
第二个问题是车规以及工业设计的挑战,类似 NOMI 这样一个几千元级别的偏消费电子的产品,如何与一辆售价 40 - 50 万元级别的豪华车相得益彰,外观上不掉价、不过时;同时这样的 AI 实体要满足车规要求,不能在碰撞试验中增加用户的安全风险;
第三是 NOMI 有了表情、声音和动作之后,这些动作如何进行精密同步,这比语音和 TTS(屏幕上的文字)同步,难度要再增加 1 - 2 个台阶。
为了解决第一个问题,蔚来内部在开发 NOMI 的过程中,从 2015 年到 2018 年很长一段时间内,都要求这个产品不能发出声音,而只是用表情和一些简单的(比如哔哩哔哩)的声音来和用户进行交流,传递情感。
NOMI 团队设计了一整套能够让它与用户进行交流的情感引擎,这套引擎连接起了车辆的底层网关、车机、NOMI 的情感库以及 NOMI 屏幕的电机驱动器等等,这样解决了情感互动以及精微动作同步的问题。
NOMI 的工业设计最后选择了极简的方式实现一个永远不过时的产品形象:外观上团队选择了纯粹的圆形,并且使用了极简的符号来做表情包。NOMI 选择的屏幕规格也相当高,是一块千万像素级别的屏幕。
取与舍
前面讲到,把 NOMI 放在蔚来车辆前方的正中央,让 NOMI 作为车辆与用户交互的中心,从而影响了蔚来车内屏幕整体的布局和尺寸,这是第一层的取舍。
NOMI 在开发过程中,内部有一个原则是:不显示功能。
当时蔚来在设计一个疲劳检测的功能,过去在其他的车上往往会在仪表盘的位置显示一个小茶杯,那是不是在 NOMI 上也显示一个茶杯的图标;或者当用户在泊车时,用 NOMI 来显示指引箭头或者提醒车主挂到 P 档。
说到这里,李天舒问了一个问题:「我们有没有见过在人的脸上去画一个导航箭头?」
答案当然是,没有。
NOMI 的形象是没有嘴的。这与前面提到的 AI 的恐怖谷效应有关。
这是因为增加了嘴部后,会导致对话时声音与嘴型的匹配问题会变得更加复杂。蔚来在尝试 NOMI 没有嘴的设计之后,发现反倒是更加和谐、合理的产品形态。
今天 NOMI 的声音,选择的是一个相对接近于女性,同时偏中性的声音。蔚来在这个声音的挑选上花费了非常大的精力,并且到今天还在持续打磨声音的品质,其中的要求是能够实现非常独特的一个声音质感。
2018 年,蔚来还发布了 NOMI 的第二款产品 NOMI Halo(第一款产品就是大家非常熟悉的圆形的 NOMI Mate)。
NOMI Halo 利用更简洁的形式,采用光晕+声音的形式来和用户实现语音的互动。
轻度剧透:下一代 NOMI
今天的语音技术与 4、5 年前 NOMI 刚刚开始开发时,已经今非昔比。
李天舒谈到,未来,NOMI 会更深度地利用多模态交交互的方式,结合车内各种各样的传感器,利用视觉、听觉、触觉来进行感知,与用户进行交互。
李天舒眼中 NOMI 的未来,是这几个词:第一个会开车,第二个是能懂你,第三个是始终陪伴:
会开车:即自动驾驶;
能懂你:结合视觉、音频、听觉、触觉等多模的方式进行感知和用户行为理解;
始终陪伴:针对每一个用户千人千面的学习,以及用户体验的定制化。
如果将这 3 方面的体验叠加在一起,可以理解为就是类似「Her」带来的体验。
在「汽车之心 · 行家说」的分享里,李天舒还展示了第二代的 NOMI。
第二代的 NOMI 依然是全圆形的设计,采用了车规级的全圆形的 AMOLED 屏幕,能够显示的信息将更加丰富,这样也能够允许 NOMI 来展现更多更为人性化的一面。
最后,NOMI 本身在进化,NOMI 也在通过语音的方式帮助蔚来实现车辆的改进,推动 ES8、ES6 以及后续车型的改进进化。
李天舒提到,到目前为止 NOMI 已经和用户对话了 7000 多万次,每日的对话量在 20 万次以上,这些的数据量是 NOMI 成长的必要因素。
同时,蔚来可以通过 NOMI 记录用户对于车辆的反馈,无论是一些问题改进或者是一些突如其来的灵感。
李天舒说,「其实一个问题发生的场景往往就是在那一个瞬间才最被需要记录和解决。」
对车主而言,NOMI 恰恰好是一个便利实时的反馈渠道。
在这个渠道上,蔚来已经收集到了用户上万条的反馈:比如正在开着自动辅助驾驶,发现一个地方可能体验并没有那么好;或者说突然有了一个灵感,觉得蔚来以后可以这么干。
到目前为止,通过 NOMI 的反馈数量,占到蔚来整个反馈渠道的 40% 以上。
李天舒说,这个数量级充分证明了,人们其实还是更渴望去跟一个有生命的伙伴去对话,去反馈和进行交互,并且慢慢也会依赖上这样的一个形式