「时来天地皆同力,运去英雄不自由。」——罗隐
「我们倾向于高估一项新技术的短期效应,而低估它的长期影响」——吉姆·哈珀曼
「认识你的时代,带领你的时代」——钱穆
未来十年是智能驾驶的黄金时代。
老司机眼里的智能驾驶
新司机:懂规则,不撞。
机器的感知和认知(理解):
激光雷达(Google):
优点:精准
缺点:贵
基于视觉(Tesla):车周边有超声波传感器,车上面有摄像头。
优点:成本低。
缺点:(Tesla事故)视觉方案会对光照比较敏感,有些意外的情况没有事先被数据库收录。比如之前没有识别横着的大卡车撞了上去。
解决方案:用双目摄像头重构立体世界。【即不用识别它是什么东西,而是去建模知道前面有障碍物。不用认出它。
AI目前的问题:
无限提升准确率,大规模的标注数据如何获取?
预训练,迁移学习,在线学习+自监督学习嵌入式部署:实时性,模型大小和计算量
图像压缩,模型压缩,级联算法,减少region proposal多任务网络
同时识别人,路,障碍等等
认路的司机:不会迷路。(定位问题)XJBD战术
高精度定位(RTK)
惯性
视觉里程计(位移积分):比如西直门立交桥,很多GPS是没法工作的。
同步的建图和定位(SLAM):最开始是机器人的定位。激光雷达贵,所以可以用基于视觉的SLAM
视觉参照物定位:比如识别交通标志,然后跟地图中的交通标志的绝对位置进行映射。
老司机:开得好,开的不肉,有社会性,竞争性
判断态势
评估他方的动机,预测行为
合理获得路权
所以此时传统的监督学习是不够的,要从监督学习到强化学习(泛强化学习,也可以是RNN,MDP),比如利用RNN推理动态物体的特征。与环境的互动,露出一个头,看看其他车的反应诸如此类。
展望
系统需要一个可预期的置信度
高置信度下的自动驾驶的可靠性:需要一辆车开500年。
用的方法是:模拟/仿真和强化学习。
基于模拟器的测试:成本低,可以无线测试【AlphaGo也是】
黑盒子-》可解释性
对抗神经网络,通过生成一些fake例子,来欺骗神经网络。
从weak AI 到 stronger weak AI
融合基于深度学习的车感和背景知识/尝试,基于迁移学习的举一反三,基于贝叶斯的逻辑/因果推理
从动态角度去理解视频(现有的手段都是把视频拆成一些帧),从中推导出运动动态
预测学习
Lecun现在把机器学习分为: 监督学习, 强化学习,预测学习(代替无监督学习),通过当前这一帧去预测下面一帧
介绍了一下自己的公司
最后吴甘沙介绍了一下他现在的创业公司:驭势。然后展示了一下完全的无人驾驶汽车长什么样。里面没有方向盘,完全是类似于一个吧台或者房间。
吴甘沙说了几句话觉得还不错: