飞升目标:每架滑翔机的神经网络


鸟会做,但蜜蜂不会。我已经做了一点。这绝对很有趣!

当然,我说的是驾驶滑翔机,这是翱翔爱好者称之为他们的飞行器(几乎其他人都称之为滑翔机)。滑翔机的全部功能是从上升的暖空气流中收集能量。滑翔机没有发动机,但它们有通常的飞机飞行控制装置:方向舵、升降舵、副翼和几乎总是扰流板。( S poiler 警报:你需要它们才能安全着陆。(

仔细想想,用神经网络控制滑翔机的想法似乎是一个非常简单直接的应用。任何机器学习应用程序都需要一个奖励函数,该函数是一个要最大化(或最小化)的度量值,而对于一个飞速发展的应用程序来说,倒数第二个目标是尽可能地高。(最终目标是安全着陆。)仅供参考:滑翔机飞行员使用这个词猛增因为它暗示了ups活动的起伏滑翔意味着下降(如着陆)。

大多数机器学习的标准程序是使用爬山迭代方法。(爬云?)所以对于这个应用,奖励函数只是高度计输出。海拔越高越好,海拔越低越坏。

在你担心我只是对你未来的机器人滑翔机进行假设性的咆哮之前,请放心,一群严肃的科学家已经真正解决了这个问题。他们在今年9月19日发表在《自然》杂志上的一封详细的信中写道:Glider Soaring Via Reinforcement Learning in the Field。问题的简单部分是调整滑翔机的飞行控制(方向舵、升降舵、副翼)。这些是神经网络的输出。当然,神经网络需要输入,但这些也很简单。我们想最大化海拔高度(我们的奖励功能),如果我们能找到空气上升最快的地方,我们就能做到最好。所以我们的输入之一是爬升率。第二个输入有点微妙,尽管你可能通过观察秃鹰或信天翁一会儿就能猜出它是什么。由于鸟类和滑翔机看不到上升的空气柱(热量),它们必须感觉到。鸟类和滑翔机飞行员的策略是直线飞行,直到你的一个翼尖感觉到有一点升力并使飞机倾斜(飞行员的习惯用语是翻滚)。如果你感觉到右边的翼尖上升,然后你轻轻地向右转向,进入无形的上升气流。一旦你进入了这个列,只要你能获得高度,你就可以在里面打圈。最终,柱消失了,你继续翱翔,直到你找到另一个。这差不多就是全部了。

这不是飞行的计算机模拟。他是一个真正的机器人滑翔机模型,翼展2米。它飞过真正的南加州地形。

如果你看看飞行路线,你实际上可以看到上升的热气流被发现,螺旋上升气流被跟随上升到一定高度。在实验过程中,研究人员确实发现了更多关于飞行器方位的东西,这些东西对计算成功的飞行是有用的/必要的。没有什么比我们想象的更简单的了,但是另一方面,最终调整飞行只需要几个其他的变量。

一旦这些额外的输入被装备,飞行器和神经网络就准备好被释放,以最大化高度奖励功能。在这一点上,显然有必要进一步改进。将要高效翱翔的鸟或飞机的一个特征是它有非常轻的重量wing loading:总重量除以机翼面积的比率。这意味着,空气中最小的涡流(湍流)会在平均飞行路径周围造成显著的推挤(噪音)。正如你所能想象的,大量的推挤会导致机翼倾斜(角色)仪器输出相对嘈杂。你不会希望系统学会对每一个小碰撞做出反应,因为使用控制表面的每一次修正都会产生阻力,并消耗一些宝贵的动能/势能。因此,就像其他机器学习问题一样,最耗时和最耗资源的组件之一是确定噪声的特征,然后实施数据清理协议。以下是滑翔机俯仰和爬升率的一些噪音示例:

回想一下,整个飞行方法是完全盲目的。滑翔机只是在热气流中摸索前进。我想他们接下来的步骤是添加一个简单的视觉系统。滑翔机飞行员学会走向新耕的田地或覆盖着沥青的大型停车场。与周围环境相比,这些表面优先受热并产生热量。事实上,在风平浪静的日子里,一条柏油路会产生一种薄的带状热,人们可以沿着这条路来回飞行,以获得相当大的高度增益。因此,一个简单的相机可以探测到最有可能变暖的黑暗区域。或者也许是一个红外线照相机实际测量不同地块的温度会更好。因此,有了指向下一个热点的导航方位的额外变量,就可以改进对上升热气流的随机搜索。我怀疑这是鸟类和飞行员需要的所有输入的97%。

如果这些装置可以实用,它们可能对空中监测(交通、农作物、污染物等)非常有用。)或中继无线网络和蜂窝服务。零功率,非常安静。

当机器人起义的日子到来时,一定要抬头看看天空。我确信这些机器人中的一些会...fly like an eagle