近日多家媒体爆料称,特斯拉那颗可支撑全自动驾驶的 AI 芯片 FSD 终于投入使用了。最重要的是,特斯拉的老车型也能通过改装换上全新的 AI 芯片。
特斯拉的这颗芯片,是一种特殊类型的 AI 处理器,可以支持人工神经网络(ANN),也就是我们常听到的机器学习(ML)或深度学习(DL)。
需要指出的是,特斯拉定制开发的这颗 AI 芯片并不意味着特斯拉在 AI 领域取得了反转一切的能力。至于全自动驾驶在现实世界的解决方案,特斯拉也只是刚刚入门。
不过,还有部分人士并不这么看,他们觉得 Musk 已经拿到「尚方宝剑」:特斯拉凭借这颗芯片就能凤凰涅磐,最终引领我们进入全自动驾驶时代。
事实果真如此吗?接下来,我们就来破除迷雾,见识一下特斯拉这颗 AI 芯片的真正实力。
1、有关 AI 芯片的背景知识
AI 芯片到底包含哪些部分?
据汽车了解,传统的计算机需要 CPU(中央处理器)来执行系统工作,比如加载应用程序。
除此之外,大部分现代计算机还要有 GPU(图形芯片)来支撑,它的工作是协助核心处理器完成图形和动画的渲染,让用户能在屏幕上获取有效信息。
在机器学习或深度学习上,除了 CPU,GPU 的角色也突然重要了起来。
总得来说,GPU 从配角变主角,主要还是因为 ANN(人工神经网络) 是个庞大的数值和线性代数问题,而它就是为这样的数字混合而生的。
对开发者来说,GPU 简直是上天的恩赐,谁也没想到它能在 ML/DL 领域发挥如此巨大的功效。
GPU 的隐藏属性「暴露」后,芯片开发者们开始为潜在的市场扩军备战,就连 GPU 的设计都开始为 ML/DL 任务倾斜。
在 FSD 芯片诞生前,特斯拉一直是拿来主义者,它最早与 Mobileye 合作,后又转向英伟达。
现在,特斯拉则希望将命运攥在自己手中,用自研的这颗芯片为 Autopilot 撑起一片天地。
Autopilot 硬件迭代:2.0 - 2.5 - 3.0
在今年 4 月份的 Autonomy Day 大会上,特斯拉祭出了大杀器——FSD 芯片。这背后传达的信息很清晰:就是要用自行研发的技术替代现有的英伟达芯片。
四个多月后,特斯拉工程师们又在 Hot Chips 大会(IEEE 主办,专注于高性能处理器)上对芯片的一些关键组件提供了更多的解析。
这次深度解析也让外界对特斯拉的 FSD 芯片重燃兴趣。
需要注意的是,在大多数人眼里,这种处理器可统称为「AI 芯片」。
这样叫也不为过,但也别对它有太高的期待——AI 芯片目前还无法在预期领域实现全知全能的人工智能。
简单来理解的话,这些芯片根本没有任何类人的推理或常识能力,它只是能力暴增的数值计算设备罢了。
2、围绕特斯拉新芯片的喧嚣与躁动
毫无疑问,Musk 是下定决心要摆脱对英伟达芯片的依赖,在特斯拉的车辆上部署自行设计的 FSD 芯片(由三星代工制造)。
在这件事上,我们需要考虑几个至关重要的问题:
-
对特斯拉来说,自研芯片真的有意义吗?继续坚持拿来主义是不是更明智?
-
如果硬要对比,特斯拉的自研芯片与现成的专用芯片有什么差别?
-
在全自动驾驶上,AI 芯片到底能实现什么?
1)纯硬件方面的重点
有一点需要明确,那就是对 AI 芯片的讨论只不过是全局的一小部分。只是芯片是纯硬件领域的重点罢了。
想发挥硬件实力,还得要有相当好的软件。
显然,那些把特斯拉 FSD 芯片捧上天的人就忘了这一点,没有一套好的软件,再强大的硬件也实现不了全自动驾驶。
这不是否定硬件的重大意义,但硬件只是整场战役的一部分,军功章的另一半显然属于软件。
从现有消息来看,Musk 手里还没有能实现全自动驾驶的软件。
2)设计上的配合与协同
如果要设计一款 AI 芯片,其中一种方案就是得知道芯片需要实现的一系列技术与性能指标。
当然,这样还是属于纸上谈兵,只有不断努力才能扩展 AI 的边界。
对特斯拉来说,硬件工程师面临的一系列情况其实还是限制了他们的发挥。
举例来说,他们必须将功耗控制在一定程度内,否则会对用车成本及续航产生重大影响。
除此之外,新的处理器必须能嵌入老款芯片留下的位置,这就意味着其尺寸和形状必须严格遵循原有设计。
在此期间,还要考虑前代产品的兼容性问题。
另外,自动驾驶芯片的设计还有一些约定俗成的规矩,比如体积、重量、功耗、散热和成本等。
这些硬指标要是满足不了,那么特斯拉迈出的第一步就会摔倒。
2、不恰当的比较
拿特斯拉 AI 芯片与其他厂商同类产品进行比较,合适吗?拿新产品去「打」老产品显然不合适。
也就是说,那些开口就提特斯拉 FSD 比现在的英伟达芯片快多少倍,其实都不怀好意。他们是在暗示特斯拉在此类技术上取得了巨大突破。
其实 FSD 的计算性能在当下市场上并非一骑绝尘的存在,只能说与对手互有胜负。
另一个为了让外行们「高潮」而被大肆宣传的巨额数字,比如特斯拉 AI 芯片上有 60 亿个晶体管。
对普通人来说,60 亿这个数字确实挺唬人,但事实上市场上早就有搭载 200 亿个晶体管的 GPU 产品了。
同时,熟悉硬件的人都知道,仅晶体管数量是无法比较出芯片性能好坏的,而且还要考虑它们的设计用途。
1)初代产品纯属试水
对芯片设计稍有了解的人都知道,初代产品想落地就得经过一段崎岖坎坷。
首先,有些潜在的 bug 必不可少。任何第一代产品都逃不过这个过程。即使 Musk 也不能免俗,时间的沉淀才是最好的解药。
这对芯片来说也是如此。
由于其硅基结构的更改并不容易,因此大多数时候,硬件的问题需要用软件来修补。工程师也会对硬件进行相应的更改和升级,不过这都是迭代多次后的事了。
显然,放弃了拿来主义的特斯拉,也必须面对初代产品带来的各种问题。
相比之下,市场上的现成产品就稳妥得多,毕竟除了原厂工程师,买方也会参与芯片的整合。
此外,在测试和验证上,特斯拉目前是形单影只,因此发现起问题来肯定要慢得多。
2)定制芯片的机会成本
想要用好自主设计的芯片,还有一大堆问题值得注意。
放在特斯拉身上,AI 芯片的成本是第一个需要考虑的问题,如此劳心费力真的值得吗?
在投入资源研发 FSD 时,Musk 到底付出了多少机会成本?
要知道,特斯拉不但要承担昂贵的研发成本,后续的升级与改进成本也得自己承担。在这个时代,芯片的升级进化也得日新月异,这并不是什么一锤子买卖。
除此之外,特斯拉还得养着自己的研发团队。当下的自动驾驶市场,伯乐常有而千里马不常有。即使有人才愿意投靠,也得经过一段时间的培养。
特斯拉走出这一步到底是对是错只有时间能给出答案。Musk 终于能通过 FSD 扼住命运的咽喉,特斯拉无需再仰人鼻息了。
不过,定制芯片带来的一系列蝴蝶效应最终还是要他去化解。
对 Musk 来说,这恐怕是一场精心策划的赌博,同时也意味着一定程度的妥协。
3)冗余要求
从曝光的细节来看,特斯拉设计的两颗芯片并行,以保证安全冗余。
如果两个「大脑」意见不一,那么现有的驾驶状况和动作规划就会作废,随后是下一帧的捕获与分析。
从表面上来看,这样的设计比此前的实时冗余系统高,但我们还是有许多严肃的问题需要考虑。
从好的方面来说,这样的设计确实能防止车辆「做蠢事」,但从本质上来说也只是将错误剔除而已。也就是说,特斯拉的冗余设计也有自己的弱点。
举例来说,如果问题不是只出现一次,而是循环播放,一刻都不停歇,两个「大脑」会持续否定对方,从而一直拖延系统做决定吗?
想象一下,如果你开车时一直不敢做决定会出现什么情况,这并不是什么最优的驾驶策略。
另一个值得考虑的是,两个「大脑」必须高度统一的设定。
这就是业内普遍选择建立一套额外冗余系统的原因,不停重复的缺陷确实非常要命。
除此之外,我们还需要一种自我意识能力,当两个「大脑」无法达成共识时,我们要知道其背后的原因。
当然,从分歧中找寻那些有价值信息的能力更为重要,这样才能提升自动驾驶系统的决策能力。
3、值得赞赏的勇气
许多人赞赏 Musk 的勇气,认为特斯拉敢走出这样一条路确实值得尊敬。
不过,从商业角度来看,这样的选择明智吗?这颗芯片到底会为特斯拉打下百年基业还是成为埋葬它的坟墓?
这是 Musk 押上特斯拉的一场豪赌,特斯拉能否实现真正的自动驾驶就在此一举了。
参考资料:
1. 特斯拉自动驾驶 FSD 芯片 NPU 详解
https://zhuanlan.zhihu.com/p/83810731
2.特斯拉在 Hot Chips 上关于 FSD 的 PPT 整理
https://t.zsxq.com/uvna6q3