人工智能的顶尖高手:麻省理工学院对安全可靠的飞行自动驾驶仪的特立独行的方法

˂pclass="84dd-a4b8-db7c-5f3a description"˃˂pclass="a4b8-db7c-5f3a-8b4d description"˃麻省理工学院的研究人员开发了一种基于˂strongclass="db7c-5f3a-8b4d-7a33 keylink"˃人工智能的方法来提高自主机器人的安全性和稳定性...

麻省理工学院的研究人员开发了一种基于人工智能的方法来提高自主机器人的安全性和稳定性,成功地解决了“稳定-避免”问题。采用深度强化学习和数学优化两步方法,在模拟喷气飞机上进行了有效测试。这可能会在未来应用于需要安全性和稳定性的动态机器人,比如自动送货无人机。

一个新的AI-baco的Sed方法特点的汽车无名机器人满足了人们的需求安全和稳定的目标相互冲突。

在电影《壮志凌云:马华力》(Top Gun: Maverick)中,由汤姆·克鲁斯(Tom Cruise)饰演的马华力负责训练年轻飞行员完成一项看似不可能完成的任务——驾驶飞机深入岩石峡谷,保持离地面很低,以至于雷达无法探测到,然后以一个极端的角度迅速爬出峡谷,避开岩壁。剧透:在马华力的帮助下,这些人类飞行员完成了他们的任务。

另一方面,一台机器将很难完成同样的搏动任务。例如,对于一架自动驾驶飞机来说,通往目标的最直接的路径与机器避免与峡谷壁相撞或不被发现所需要做的事情相冲突。许多现有的人工智能方法无法克服这种冲突,即所谓的稳定避免问题,并且无法安全地达到目标。

麻省理工学院的研究人员开发了一种机器学习技术,可以自动驾驶汽车或驾驶飞机通过一个非常困难的“稳定-避免”场景,在这个场景中,车辆必须稳定其轨迹以到达并保持在某个目标区域内,同时避开障碍物。图片来源:研究人员提供

麻省理工学院的研究人员开发了一种新技术,可以比其他方法更好地解决复杂的稳定避免问题。他们的机器学习方法达到或超过了现有方法的安全性,同时提供了十倍的稳定性,这意味着智能体在其目标区域内达到并保持稳定。

在一项让马弗里克感到自豪的实验中,他们的技术有效地驾驶了一架模拟喷气式飞机通过一条狭窄的走廊,而没有撞到地面。

“这是一个长期存在的、具有挑战性的问题。“很多人都看过它,但不知道如何处理这种高维和复杂的动态,”威尔逊航空航天助理教授范楚楚说,他是信息与决策系统实验室(LIDS)的成员,也是一篇关于这项技术的新论文的资深作者。

范和第一作者奥斯温·苏一起,他是一名研究生。这篇论文将在机器人:科学与系统会议上发表。

避免稳定的挑战

许多方法通过简化系统来解决复杂的稳定-避免问题,这样他们就可以用简单的数学来解决它,但是简化的结果通常不符合现实世界的动态。

更有效的技术使用强化学习,这是一种机器学习方法,智能体通过试错来学习,并对使其更接近目标的行为给予奖励。但这里确实有两个目标——保持稳定和避免障碍——找到适当的平衡是乏味的。

麻省理工学院的研究人员将这个问题分为两个步骤。首先,他们将稳定-避免问题重新定义为约束优化问题。在这种设置中,求解优化使代理能够达到并稳定其目标,这意味着它保持在某个区域内。So解释说,通过施加约束,它们可以确保智能体避开障碍。

这段视频展示了研究人员如何利用他们的技术有效地驾驶一架模拟喷气式飞机,在这种情况下,飞机必须稳定在靠近地面的目标上,同时保持非常低的高度,并保持在狭窄的飞行走廊内。图片来源:研究人员提供

然后,在第二步中,他们将约束优化问题重新表述为称为铭文形式的数学表示,并使用深度强化学习算法解决它。铭文形式让他们绕过了其他方法在使用强化学习时面临的困难。

“但深度强化学习并不是为了解决优化问题的铭文形式而设计的,所以我们不能直接把它代入我们的问题中。我们必须推导出适用于我们系统的数学表达式。一旦我们有了这些新的推导,我们就把它们与其他方法使用的一些现有的工程技巧结合起来,”So说。

第二名没有加分

为了验证他们的方法,他们设计了一系列具有不同初始条件的控制实验。例如,在一些模拟中,自主智能体需要到达并停留在目标区域内,同时进行激烈的机动以避免与它发生碰撞的障碍物。

当与几个基线进行比较时,他们的方法是唯一一个可以在保持安全的同时稳定所有轨迹的方法。为了进一步推广他们的方法,他们用它来驾驶一架模拟喷气式飞机,这种场景可能会在《壮志凌云》(Top Gun)电影中看到。飞机必须稳定在地面附近的目标上,同时保持非常低的高度,并保持在狭窄的飞行走廊内。

这个模拟飞机模型于2018年开源,由飞行控制专家设计,作为测试挑战。研究人员能否创造一个控制器无法飞行的场景?但是这个模型太复杂了,很难处理,而且它仍然不能处理复杂的场景,范说。

麻省理工学院研究人员的控制器能够防止飞机坠毁或失速,同时稳定到目标,比任何基线都要好得多。

在未来,这项技术可能成为设计高动态机器人控制器的起点,这些机器人必须满足安全和稳定性要求,比如自动送货无人机。或者它可以作为更大系统的一部分来实现。也许只有当汽车在下雪的道路上打滑时,算法才会被激活,以帮助司机安全地导航到稳定的轨道上。

So补充说,在人类无法处理的极端情况下导航是他们的方法真正的亮点。

“我们相信,作为一个领域,我们应该努力实现的目标是为强化学习提供安全性和稳定性保证,当我们在关键任务系统上部署这些控制器时,我们需要为我们提供保证。我们认为这是朝着实现这一目标迈出的有希望的第一步。

展望未来,研究人员希望提高他们的技术,以便在解决优化问题时更好地考虑不确定性。他们还想调查算法在硬件上部署时的工作情况,因为模型的动态与现实世界中的动态之间会存在不匹配。

“范教授的团队已经改进了动态系统的强化学习性能,其中安全很重要。他们创造了控制器,以确保系统能够安全到达目标并无限期地停留在那里,而不仅仅是达到目标,”斯坦利·巴克说,他是石溪大学计算机科学系的助理教授,他没有参与这项研究。“他们改进的配方可以成功地为复杂场景生成安全控制器,包括由空军研究实验室(AFRL)的研究人员部分设计的17状态非线性喷气飞机模型,该模型结合了带有升力和阻力表的非线性微分方程。”

参考文献:“通过铭文形式和深度强化学习求解稳定-避免最优控制”,由Oswin So和Chuchu Fan撰写,2023年5月23日,计算机科学>机器人技术。arXiv: 2305.14154

这项工作的部分资金是由麻省理工学院林肯实验室在特技飞行安全制度项目下提供的。

本文来自作者[admin]投稿,不代表信了号立场,如若转载,请注明出处:https://wak.maigegan.com/xinlehao/4070.html

(30)

文章推荐

发表回复

本站作者后才能评论

评论列表(4条)

  • admin
    admin 2025年09月01日

    我是信了号的签约作者"admin"!

  • admin
    admin 2025年09月01日

    希望本篇文章《人工智能的顶尖高手:麻省理工学院对安全可靠的飞行自动驾驶仪的特立独行的方法》能对你有所帮助!

  • admin
    admin 2025年09月01日

    本站[信了号]内容主要涵盖:

  • admin
    admin 2025年09月01日

    本文概览:大家好,今天小编来为大家解答微乐广东麻将小程序开挂神器这个问题咨询软件客服可以直接加QQ群了解详细,四川微乐麻将外卦神器下载安装的挂在哪里买很多人还不知道,现在让我们一起来看看吧!一、微乐广东麻将小程序开挂神...

联系我们

邮件:88888@sina.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注我们