阿里达摩院王刚：数据驱动是解决无人驾驶难题的关键技术路径

2021-11-17 15:53来源：新交通

　　10 月 28 日至 29 日，由杭州未来科技城（海创园）管委会指导，DeepTech 主办的世界科技青年论坛暨 “35 岁以下科技创新 35 人”（TR35）全球-亚太区线下发布仪式，在杭州未来科技城成功举办。

　　在 TR35 全球-亚太区线下发布仪式现场，一众顶尖科学家、青年科技人才、科技创业人士对世界科技前沿技术和热点问题进行了探讨、交流。

　　阿里巴巴集团副总裁、达摩院自动驾驶实验室负责人王刚以《无人驾驶从技术到产品再从产品到技术》为主题，分享了他对无人驾驶的看法。一般来说，人们对技术到产品的流程非常熟悉，但是从产品到技术却不是很了解，此次分享，王刚便为大家详细阐述了其中的逻辑区别。

　图 | 阿里巴巴集团副总裁、达摩院自动驾驶实验室负责人王刚

　　瞄准末端无人驾驶，服务 “最后三公里” 需求

　　在大家的普遍认知里，无人驾驶或许离我们还很遥远，但事实上，末端无人驾驶市场却大有可为。

　　王刚指出，阿里达摩院致力于解决 “最后三公里” 的包裹配送需求，瞄准的市场正是末端无人驾驶，并在规模化和产品化方面取得极大进展。目前，达摩院已经在全国 22 个省和 71 个城市开展了常态化物流服务，累计服务接近 200 多个大学校园和社区，配送单量超过一百万单。

　　当然，相比于快递市场或者对物流市场来讲，这样的数字并不值一提，但就无人驾驶领域而言，这个数字已经实现了一个极大的突破，客观上也佐证了达摩院的产品化能力。目前，该产品已辐射了全国大部分地取，东北到哈尔滨、南到广州、西到成都，产品稳定性值得肯定。

　　话题回归到无人驾驶，王刚指出，目前我们针对的只是末端 “最后三公里” 的场景，而作为无人驾驶领域的从业者，其实每个人最想解决的是 “所有场景里都能够自动驾驶” 的难题。

　　王刚表示，“我觉得前面做的一切事情，包括产品化和规模化，都是帮助我们从技术路径上实现目标，所以我们做末端三公里并不只是一个业务决策，更多的是技术决策。”

　　从数据里找规律，重新定义无人驾驶技术路径

　　纵观过去几十年人工智能的发展，几乎所有成功的经验都是基于统计学习。而统计学习的本质就是从数据里面找到规律，如果没有数据，再聪明的科学家也很难找到办法让机器变得更聪明。

　　在王刚看来，数据驱动无疑是解决无人驾驶目前问题的最佳技术路径之一。

　　基于这样的认识和了解，王刚提出，在当前条件下无人驾驶需要解决两个问题：一是如何获取海量数据；二是如何利用数据。

　　那么我们该如何获取海量数据呢？

　　据王刚介绍，其在三年前确定业务和技术方向的时候，就考虑过是否学习谷歌依靠测试车解决 robot taxi 问题。但由于交通场景的复杂性，测试数据和场景都显得过于片面，最终放弃了这个想法。

　　接下来，王刚想到先通过垂直场景解决业务问题，再利用其产生的价值去推动汽车规模化，从而推动更多车辆的部署，当有更多车辆部署的时候，数据的采集就变成了一件自然而然的事，进而推进技术发展。

　　“时至今日，经过不断的技术研发和产品化、规模化的实验，我们初步看到了曙光，在未来几年的技术发展里，我们会从传统的路测驱动走向产品驱动，即从产品再到技术。” 王刚表示。

　　阿里达摩院计划在两到三年内部署一万辆车的规模，覆盖中国所有的大学还有大型的园区、社区，并将今天的累计一百万订单发展成每天配送一百万订单。王刚表示，这一百万订单的背后会积累非常多有意思，对技术带来非常大改变的数据。比如末端场景中经常出现的行人、非机动车等，相比更容易检测、预测的卡车和轿车，这类交通参与者才是无人驾驶里面最头痛的问题。

　　而在达摩院构建的场景下，一辆车日均可检测 4000 万个障碍物，每天与行人和非机动车进行超过 5000 次的交互。随着更多的车辆被部署后，其产生的数据将是难以想象的。

　　获取数据之后，最重要的节点就是掌握利用数据的方法。

　　王刚表示，“数据是一个石油，但是怎么样提炼出来是另外一个同样重要的问题。” 而实现这样的人工智能无外乎三个方向。

　　第一个方向是学习人脑。不过王刚也表示，人脑是非常复杂的结构，很难做到彻底了解，因此不宜在这个方向投入太多的资源。第二个方向是自动化学习，即通过仿真虚拟化场景提高人工智能能力，而不过度依赖人工的经验和能力。第三个方向是小样本学习能力，同样受人的启发。

　　达摩院自动驾驶实验室在自动化学习上做了很多努力，且拥有了独属于自身的差异化竞争优势，分别表现在硬件和工程上。王刚说道，“比如我们做了无人驾驶全链路的自动化学习，包括最困难的决策规划、控制以及定位，而不仅仅是常见的感知和图象识别，这就是我们工程上的差异化。”

　　将智能仿真和强化学习相结合

　　那么如何将智能仿真和强化学习结合在一起呢？

　　王刚表示，谷歌作为世界上最好的 AI 公司之一，其实已经做了类似的探索，那就是阿尔法围棋（AlphaGo）。作为第一个战胜围棋世界冠军的人工智能机器人，AlphaGo 由谷歌旗下 DeepMind 公司戴密斯·哈萨比斯（Demis Hassabis）领衔的团队开发，其主要工作原理正是 “深度学习”。

　　但之所以这样的方法没有大规模应用在机器人和无人驾驶领域，在于其中仍有迫切需要解决的问题。

　　首先是如何仿真场景，因为在围棋领域，仿真是非常容易的，把棋盘画出来就可以了，而无人驾驶却需要构造交通场景，这就需要工程上的投入。

　　其次，从算法上来讲 AlphaGo 是离散空间，而无人驾驶场景却是连续空间，所以达摩院也研发出了基于连续空间的蒙特卡洛树搜索算法，从而让该方法在连续空间里同样得以实现。

　　在王刚看来，积累数据和用好数据都是为了去更好地解决自动驾驶问题。他表示，“目前我们已经基本解决了末端的低速问题，不仅能满足业务需求，还极大地降低了成本。在未来，我和团队将围绕更泛化的场景做进一步的研发，并基于当前的经验以及数据去攻克更大的挑战。”

责任编辑：新交通

您可能更感兴趣的文章

名企动态

阅读排行