在互联网上快速搜索一下,就会出现大量展示无人驾驶汽车事故的视频,这些视频往往会让人开怀大笑。但为什么我们觉得这些行为很有趣呢?这可能是因为它们与人类司机处理类似情况的方式形成鲜明对比。
对我们来说微不足道的日常情况仍然可能对无人驾驶汽车构成重大挑战。这是因为它们是用工程方法设计的,与人类思维的工作方式根本不同。然而,最近人工智能的进步开辟了新的可能性。
具有语言能力的新型人工智能系统——比如ChatGPT等聊天机器人背后的技术——可能是让无人驾驶汽车更像人类驾驶员那样推理和行为的关键。
随着深度神经网络(dnn)的出现,自动驾驶的研究在2010年代末获得了巨大的动力。深度神经网络是人工智能(AI)的一种形式,涉及以一种受人类大脑启发的方式处理数据。这使得处理交通场景图像和视频能够识别“关键因素”,例如障碍物。
检测这些障碍物通常需要计算一个3D方框,以确定障碍物的大小、方向和位置。例如,这个过程适用于车辆、行人和骑自行车的人,它基于类别和空间属性(包括相对于无人驾驶汽车的距离和速度)创建了一个世界的表示。
这是被称为“感知-思考-行动”的自动驾驶最广泛采用的工程方法的基础。在这种方法中,传感器数据首先由深度神经网络处理。然后,传感器数据被用来预测障碍物的轨迹。最后,系统规划汽车的下一步行动。
尽管这种方法具有易于调试等优点,但“感觉-思考-行动”框架有一个关键的局限性:它与人类驾驶背后的大脑机制有着根本的不同。
来自大脑的教训
关于大脑功能还有很多未知之处,这使得将人类大脑的直觉应用于无人驾驶汽车具有挑战性。尽管如此,各种各样的研究努力旨在从神经科学、认知科学和心理学中获得灵感,以改善自动驾驶。
一个长期建立的理论认为,“感觉”和“行为”不是顺序的,而是密切相关的过程。人类通过对环境的行动能力来感知环境。
例如,当准备在十字路口左转时,司机会关注环境的特定部分和与转弯相关的障碍物。相反,感觉-思考-行动方法独立于当前的行动意图处理整个场景。

与人类的另一个关键区别是,深度神经网络主要依赖于他们训练过的数据。当面对场景的轻微异常变化时,它们可能会失败或错过重要信息。
这种罕见的、未被充分代表的情况,被称为“长尾案例”,构成了一个重大挑战。目前的解决方法包括创建越来越大的训练数据集,但现实生活中的复杂性和可变性使得它不可能涵盖所有的可能性。
因此,像感觉-思考-行动这样的数据驱动方法很难推广到看不见的情况。另一方面,人类擅长处理新情况。
由于对世界的普遍了解,我们能够使用“常识”来评估新的场景:实践知识,推理和对人们通常行为的直觉理解的混合,建立在一生的经验基础上。
事实上,驾驶是人类社会互动的另一种形式,常识是解释道路使用者(其他司机、行人、骑自行车的人)行为的关键。这种能力使我们能够在意外情况下做出正确的判断和决定。
模仿常识
在过去十年中,在深度神经网络中复制常识一直是一个重大挑战,这促使学者们呼吁彻底改变方法。最近人工智能的进步终于提供了一个解决方案。
大型语言模型(llm)是ChatGPT等聊天机器人背后的技术,在理解和生成人类语言方面表现出了非凡的熟练程度。他们令人印象深刻的能力源于在不同领域的大量信息上的训练,这使他们能够发展出一种类似于我们的常识。
最近,像gpt - 40和gpt - 40 -mini这样的多模态llm(可以响应用户的文本、视觉和视频请求)将语言与视觉结合起来,将广泛的世界知识与视觉输入的推理能力相结合。
这些模型可以理解复杂的未见场景,提供自然语言解释,并建议适当的行动,为长尾问题提供了一个有希望的解决方案。
在机器人技术中,视觉语言-动作模型(vram)正在兴起,它将语言和视觉处理与机器人的动作相结合。vram在通过语言指令控制机械臂方面取得了令人印象深刻的初步成果。
在自动驾驶中,最初的研究集中在使用多模式模型来提供驾驶评论和运动规划决策的解释。例如,一个模型可能会显示,“我前面有一个骑自行车的人,开始减速”,提供对决策过程的洞察并提高透明度。Wayve公司在将语言驱动的无人驾驶汽车应用于商业层面方面显示出了有希望的初步成果。
驾驶的未来
虽然法学硕士可以解决长尾案例,但它们也带来了新的挑战。评估它们的可靠性和安全性要比“感觉-思考-行动”这样的模块化方法复杂得多。自动驾驶汽车的每个组件(包括集成的llm)都必须经过验证,这就需要针对这些系统量身定制新的测试方法。
此外,多模式llm很大,对计算机资源的要求很高,导致高延迟(计算机操作或通信的延迟)。无人驾驶汽车需要实时操作,而目前的模型无法足够快地产生响应。运行llm还需要大量的处理能力和内存,这与车辆有限的硬件约束相冲突。
目前,许多研究工作都集中在优化llm在车辆中的应用上。我们还需要几年的时间才能在街道上看到具有常识性推理能力的商用无人驾驶汽车。
然而,自动驾驶的未来是光明的。在具有语言能力的人工智能模型中,我们有一个可靠的替代方法来替代感觉-思考-行动范式,这种范式已经接近极限。
法学硕士被广泛认为是实现更像人类一样推理和行为的车辆的关键。考虑到每年约有119万人死于道路交通碰撞,这一进展至关重要。
道路交通伤害是造成5-29岁儿童和青壮年死亡的主要原因。具有类似人类推理能力的自动驾驶汽车的发展可能会大大减少这些数字,挽救无数人的生命。
本文来自作者[admin]投稿,不代表智将号立场,如若转载,请注明出处:https://www.quickloans.com.cn/cskp/202506-1194.html
评论列表(4条)
我是智将号的签约作者“admin”!
希望本篇文章《无人驾驶汽车仍然缺乏常识人工智能聊天机器人技术可能是答案》能对你有所帮助!
本站[智将号]内容主要涵盖:国足,欧洲杯,世界杯,篮球,欧冠,亚冠,英超,足球,综合体育
本文概览: 在互联网上快速搜索一下,就会出现大量展示无人驾驶汽车事故的视频,这些视频往往会让人开怀大笑。但为什么我们觉得这些行为很有趣呢?这可能是因为它们与人类司...