无论是对于ADAS还是自动驾驶,行人检测一直是难点之一。除了传统意义上的识别,预测运动轨迹也是行业关注的焦点。相比于前方车辆而言,行人的移动性方向更难预测。
根据此前一份某城市的交管部门的资料显示,平均每年涉及人员伤亡的道路交通事故中因行人横穿道路发生的交通事故占据相当大的比重。
行人过街所表现出的行为特点,大致可以分为四种类型:一是正常型,始终保持均匀步速,稳步前进。二是中途停驻型,行人横越道路的途中,看到车辆较多,停顿不前或犹豫不决。三是中途加快型,这类行人过街多半是走到马路中线后,看到汽车急速驶来,加快步伐抢行过街。四是中途放慢型,这类行人过街通常先是急忙快步奔跑抢行穿越,待到达中线后一看,路上没有汽车来往,于是放慢步速,稳步行进。
在这四种过街类型中后三种类型对安全过街都存在一定的危险,因为此时行人过街的后续行为往往是驾驶员难以预测和估计的,极易造成驾驶员的判断失误而导致操作错误,从而导致悲剧的产生。
从人眼的角度,驾驶者更容易判别行人的意图,但基于摄像头等传感器技术,这种直觉判断并不容易。在自动驾驶场景下,车辆对行人的判断是谨慎的,如果无法判断下一步的运动轨迹,车辆必须在碰到行人的时候,进行减速。
原因是机器无法排除前方行人在本车辆前方徘徊的可能性。有这样一家初创公司,现在正在尝试通过机器学习的方式,来改变和提升车辆感知系统对周围行人、骑自行车者运动轨迹判断能力。
目前,从行业的技术发展来看,感知能力已经有了很大的进步和提升,但整个自动驾驶真正的核心在于决策与控制。
智行者科技CEO张徳兆表示,决策控制第一是行为预测,不是指车的行为预测,而是指我们感知出来的行人,感知出来其他车辆的行为预测,之后做决策。“现阶段我们做自动驾驶最大的挑战并不是目标识别,而是行为理解。”
这家名为Perceptive Automata的公司联合创始人Sam Anthony表示:“我们正在构建一个模块,让自动驾驶车辆能够了解行人在道路上的心态。”这个软件将“赋予机器看一个人的能力,比如:这个人想横穿马路,这个人知道我的车在那里。”
通常,机器学习技术使用可被客观测量的数据来训练算法。但在这样的情况下,对于行人运动意图和轨迹判断并不是很实际。相反,轨迹感知依赖于人的主观判断来提供用于训练其算法的数据。
这家公司安排人观看视频剪辑,然后给出行人标签,以人的视角来给出最佳判断:是否行人试图穿过街道,是否注意到周围车辆。然后,工程师使用这个标记的视频数据集来训练机器学习算法以做出相同类型的判断。
Sam Anthony表示,汽车制造商应该把它看作是一种能有效地读取车辆周围行人心理的附加传感器。然后,这个“传感器”数据可以与摄像头、毫米波雷达、激光雷达和其他硬件传感器的数据进行融合,从而使得自动驾驶的感知和决策更为平滑、有效。
目前,包括Waymo、Uber等自动驾驶公司正从测试中收集数百万英里的传感器数据。他们是否可以通过传感器数据来直接预测行人行为?
Sam Anthony认为,如果你没有行人运动轨迹的预测模型,那么预测行人是否会过马路要困难得多。毕竟,行人可能会站在路边几秒钟等待正确的时机穿过街道。一个自动驾驶汽车最终关心的是行人是否在过马路,而不仅仅是在下一秒他或她是否会这么做。
目前,Perceptive Automata已经成为英伟达的合作伙伴,同时公司的客户还包括汽车制造商和Tier1以及一些初创公司。
类似的技术,在今年大陆集团发布的第五代车规级摄像头MFC500系列也有提及。
这款摄像头不仅可以在光线更暗的情况下使用,同时还可以应付更复杂的交通路况,以及,更精确的识别行人姿态,预测其未来的行动趋势。
MFC500可识别人体的四肢、背包、五官,人体在摄像头的镜头下,变成了移动的分段条形物体,通过软件识别算法,依此可以判别出行人的姿态,包括但不限于行、坐、卧、立等状态,以及判断出大人还是小孩。
另外根据面部识别技术,还可以判断出行人是否低头行走还是注视着车辆,通过这些种种参数,最后计算出行人对于行车安全的系数,以此来对辅助自动驾驶。
视觉识别的关键目的是对行人运动的趋势做出预判,提前预警可能发生的事故。这款摄像头将于2020年投产,定位于多功能摄像头,单颗不仅可以兼顾远近多场景,同时也可以配合其他摄像头,级联完成更丰富的功能应用。