首页 > 金融 > > 正文

小小的大脑，大大的智慧——仿昆虫智能为通用AI带来的新思路

2021-04-17 13:45:39来源：互联网

机器之心分析师网络

作者：Yuanyuan Li

编辑：Joni

本文从视觉、追踪和导航三个方面入手，以近年来的新应用为例，带领读者一窥机器人与昆虫之间奇妙的化学反应。

很多工程师的梦想都是创造出能够在复杂的环境下稳定胜任一系列任务——比如行走和导航——的机器人。为了实现这一目标，早期的研究者们试图将机器人身处的环境抽象化，然后根据其所可能应对的情况和任务制定一系列规则，并赋予机器人一定的推理能力。在这段期间, 全世界范围内也许最成功的机器人是名叫赫伯特的机器人。

赫伯特的前身是由西屋电气工程师 Roy J. Wensley 开发用来远程调用变电系统的机器人 Televox，仅由一组控制单元组成。Televox 本质上是一个声控系统，为了实现远程遥控的目的，该控制单元的一部分放在变电站另一部分则放置于调度员处。调度员可以利用 Televox 将指令转为不同的声音频率发送到另一端，经过解码后再执行相应操作。这一发明成功后，Wensley 进一步开发，并将 Televox 包装为了一个有“脸”、身体和身体的机器人，也就是赫伯特机器人。

图：世界上最早的机器人之一：Herbert Televox 和其开发者 Roy J. Wensley

source: https://medium.com/robotics-today/first-humanoid-robot-ever-87df3ee079b0

用今天的眼光来看，赫伯特也许完全算不上智能，因为它主要是靠规则驱动的，它的行为与人也并不相似。以当时最为人津津乐道的赫伯特作为家庭助手为例，操作人必须按照相对固定的脚本缓慢的向赫伯特传达命令，有时还必须按下特定的按钮来进行选择或确认。因为赫伯特并不能真正理解操作人的语音，它只能识别一系列已经写入系统的指令——还是在固定的音节上。可以说，赫伯特只能在其系统内规定的规则范围内工作，这与今天大行其道的联结主义 (connectionism) 是不同的。

联结主义，又称仿生主义，认为心理现象可以用简单并一致的网络——如神经网络——来描述，不同的行为可以通过这些基础结构之间复杂的互动实现，这与人脑工作的方式相似。因此，联结主义追求用简洁的方式构建有通用性的解法，而规则驱动的算法则是 case by case，有很大的可能会随着环境的复杂度增加而变得过于庞大。

显然，随着拟人机器人的发展，不少学者也转向了其他方向来试图开发更类人、具有更高智能的机器人。一些研究者将目光投向自然界，试图从动物——比如昆虫等结构比较简单的动物——身上利用联接主义进行研究、学习和模仿。这不难理解，从昆虫的神经科学研究上看，昆虫的神经系统比大部分动物都简单很多，使对昆虫的大脑建模相对来说简单。但另一方面，许多昆虫的大脑在大小、重量上都不值一提，有些甚至还“视力其差”，但这并不影响昆虫高效、稳定的完成觅食和协作等复杂的行为。此外，尽管昆虫的身体类型、行为、栖息地和生活方式种类繁多，但各个物种的大脑组织之间仍存在许多令人惊讶的一致性，这表明它们可能是有效，高效和通用的解决方案。[3]

本文从视觉、追踪和导航三个方面入手，以近年来的新应用为例，带领读者一窥机器人与昆虫之间奇妙的化学反应。

一、视觉场景识别 - A Hybrid Compact Neural Architecture for Visual PlaceRecognition

在视觉场景识别领域，流行的算法大致可以分为两类：以深度学习为代表的更多依赖于计算机科学的模型，和利用大脑的特性建模的更多依赖于神经科学的模型。本文作者则旨在结合两类研究的优点，实现新的紧凑而高性能的模型。

视觉位置识别（VPR）是指仅基于图像所提供的视觉线索，而不使用任何其他信息，来识别图像中描绘的位置的任务[6]。对于在现实环境中长时间运行的任何机器人系统或自动驾驶车辆而言，可靠地执行视觉位置识别（VPR）都是一项挑战。因为同一个地方因为时间，如白天 / 夜晚或天气 / 季节周期，的变化可能看起来完全不相似，而多个地方在某些特定的情况下反而可能看起来十分相似。另外一个问题是目前流行的预训练模型大多是在单个图像上训练的，虽然这些模型也取得了很好的成绩，但是期通常会忽略连续图像内所蕴含的时间信息。

而昆虫等生物却能够非常有效地从低分辨率数据中提取有关其环境的信息，它们能够在各种环境条件下（不同光照、对比度等）强大地执行视觉处理任务。一般认为，昆虫对位置的识别主要是通过蕈形体（mushroom bodies）实现的。蕈形体是昆虫或其他节肢动物和一些环节动物如沙蚕脑中的一对结构[7]，其名字来自于其大致半球形的花萼，这个花突通过中枢神经束或花序梗与大脑的其余部分相连。下图标亮了果蝇大脑中的蕈形体。蕈形体的结构可以简化为多层感知器（MLP），它涉及蜜蜂和蚂蚁的嗅觉和视觉信息的分类、学习和识别。这些昆虫的感官接受到经过密集编码和高度处理的输入，并传递给蕈形体，后者则将该信息稀疏地连接到蕈形体内的大量内在神经元。

图：果蝇大脑中的蕈形体

图源：维基百科 https://en.wikipedia.org/wiki/Mushroom_bodies

根据果蝇嗅觉神经回路的工作机制，作者提出了仅包含两层全连接层的 FlyNet 算法（FLA）。图像在预处理后将以 10% 的采样率被输入到第一层网络当中。当第二层全连接层的输出其编码的表示后，仅有 50% 的输出值将被设置被 1，其他则被设置为 0，以获得一个简洁的二进制特征表示。该网络的具体结构如下图所示：

图：FNA 算法图示

图源：Chancan, M., Hernandez-Nunez, L., Narendra, A., Barron, A. B., & Milford, M. (2020). A hybrid compact neural architecture for visual place recognition. IEEE Robotics and Automation Letters, 5(2), 993-1000. https://doi.org/10.1109/LRA.2020.2967324

为了处理图像序列中的时间维度，作者在 FlyNet 上叠加了一个一维连续吸引子神经网络（continuous attractor neural network, CANN）。CANN 也是一个典型的仿生智能例子——一般认为大脑在执行一些计算任务时会采用特定结构的神经网络，CANN 就是基于此而开发的。CANN 由吸引子组成，它们之间有局部连接。此外，网络内有兴奋性与抑制性的两种活动，从而保证网络即能够形成有意义的空间活动，又不会在正反馈的叠加下爆炸。因此一个吸引子可以使用兴奋性和抑制性连接来激发或抑制自身以及附近的吸引子。CANN 在数学表示和结构上具有良好的特性，如空间平移不变性 [8]。

图：（A）朝向编码的一维 CANN 的图示（B）一维 CANN 的稳定状态，每个吸引子对应一个高斯波包活动状态。

图源：Wu, S., Wong, K. Y., Fung, C. C., Mi, Y., & Zhang, W. (2016). Continuous Attractor Neural Networks: Candidate of a Canonical Model for Neural Information Representation. F1000Research, 5, F1000 Faculty Rev-156. https://doi.org/10.12688/f1000research.7387.1

在本文中，由 FlyNet 输出的二进制图像特征将被输入到 CANN 中，如下图所示，以达到对 FlyNet 的输出进行时间滤波的目的。

图：FlyNet+CANN 混合神经网络架构

作者在 Nordland 和 Oxford RobotCar 数据集上 FlyNet + CANN 以及目前的 SOTA 算法进行了对比，指标为 AUC （area under curve）。该数据集内的图像大多为 1000*1000 以上的较高分辨率图像，但在测试 FlyNet + CANN 时作者将其一概下采样为 32*64 的灰度图像。考虑到分辨率的大幅下降，这个信息损失还是很惊人的。个别 SOTA 算法使用了 VGG16 等对图像分别率有要求的结构，因而作者没有将图像也图样下采样到 32*64，但有将最终输出的特征进行下采样到 FlyNet 输出特征一样的维度。

下图显示了 FlyNet + CANN 和 SOTA 算法的对比结构。在 Nordland 数据集上，MPF 表现更好，AUC 达到了惊人的 100%，能够同时在秋冬转换下准确的识别所有位置。FlyNet + CANN 和 SeqSLAM 的表现相似，并且在冬季和夏季的数据上的表现也比较平衡。基于语义的 LoST-X 的精度则在冬季数据上大幅下降，导致了最低的 AUC。

与 Nordland 不同，Oxford RobotCar 数据集带来了日夜转换的挑战。下图中可以看到所有模型在夜景数据上的 AUC 都有或多或少的下降，SeqSLAM 的 AUC 更是降到几乎为零。在这一数据集上，FlyNet + CANN 取得了最高的 AUC 并且在夜景上的表现也没有过多下降。

图：（上）：Precision Recall 曲线（左）Nordland （右）Oxford RobotCar

（下）：AUC （左）Nordland （右）Oxford RobotCar

当然，作者使用基于仿生研究的模型结构的一大目的是获得能耗较低但运行速度够快的模型，根据作者对 1000 张图片的平均位置识别时间的统计，FlyNet + CANN 可以达到每秒 16.66 帧的查询速度，比排名第二快模型还要快 1.5 倍以上。这一点为仿生神经网络对比 CNN 提供了强大的竞争力——即便目前的相关研究也很活跃，但 CNN 的能耗和推理速度仍然为在移动端部署模型带来了不小的挑战。而基于昆虫大脑的 FlyNet + CANN 等神经网络，可以将模型参数控制在百万以内，并且没有在模型表现上落后太多。此外，FlyNet + CANN 也继承了昆虫的另一特性——在低分辨率下进行计算，从计算角度直接保证了模型的实时推理的可行性。

二、追踪 - An autonomous robot inspired by insect neurophysiology pursues moving features in natural environments

计算机视觉和机器人应用往往需要在移动平台上实现强大而有效的目标跟踪算法，但就目前的人工视觉系统的表现而言，在杂乱的背景下检测和跟踪移动物体仍是最具挑战性的任务之一，更遑论对实时系统的部署。而昆虫的视觉系统，则为研究者们提供了一个理想的视觉追踪系统的完美例子。许多飞行昆虫，例如蜻蜓，都能够检测、选择和追捕微小的猎物或同种动物。更令人咋舌的是，昆虫仅有限的视觉分辨率（ 0.5°）、尺寸相对较小的大脑（小于 2 mm 宽）和重量轻和低功率的神经元结构用于处理数据。

本文作者们在之前数年的研究中已经通过细胞内电生理技术来记录昆虫视神经叶内的神经元活动，并确定了一组与目标的检测和追踪相关的神经元，作者将其命名为“小目标运动检测器”（small target motion detectors, STMD)。基于这些生理数据，作者开发了用于局部目标识别的非线性“基础 STMD”（Elementary- STMD， ESTMD）模型（Wiederman 等人，2008），并在 VR 模拟环境中对该追踪系统进行了测试。在本篇论文中，作者主要实现了整套追踪模型在机器人平台上的部署，并在室内和室外环境对该机器人进行了详尽的测试。

下图中，作者给出了整个系统的工作流程，所有功能在 Husky A200（Clearpath RoboticsTM）平台上实现。机器人身上装有一个 Blackfly 相机，用于获取机器人所处环境的视觉输入。相机输出用作昆虫启发的目标跟踪模型的输入，该模型包括：

1）图像预处理（early visual processing）：该模块主要用于模拟飞行昆虫中光学，感光体和大型单极细胞（large monopolar cells ， LMC）的响应特性。由于飞行昆虫的光学器件受到小平面透镜内的衍射和其他形式的光学干涉的限制，针对输入的图像，作者首先使用高斯低通滤波器对这种光学模糊进行建模，这与典型的日间活动昆虫的光学采样相似（Stavenga，2003 年）。为在算法的敏锐度和计算效率之间取得平衡，作者还以 1° 的间隔对捕获的图像进行二次采样。另外，作者选择仅处理 RGB 图像的绿色通道来模拟飞行昆虫运动路径的绿色光谱敏感性。接下来，这一模块中还有时间共同滤波和空间高通滤波，以进一步去除多余的信息。

2）目标匹配滤波（Target Matched Filtering，ESTMD 阶段）：这一模块主要模拟的是昆虫第二视神经网（2nd optic neuropil）内的 Rectifying transient cells（RTC）。RTC 对光增量（ON 通道）或减量（OFF 通道）具有独立的适应性，在实际实现中，作者通过半波整流（half-wave rectification， HWR1）对 ON 和 OFF 通道的分离进行建模。接下来，生成的 ON 和 OFF 的通道数据需要通过快速适应模块，其中适应状态由切换其时间常数的非线性滤波器确定。当输入增加时，时间常数为“快”（3 毫秒），减少时则为“慢”（70 毫秒）。此外，作者使用了强烈的空间中心包围对抗（spatial centre-surround antagonism），使得每个通道周围都抑制了其最近的邻居。时间适应减少了对背景纹理的响应，而强烈的空间中心包围对抗则传达了对局部边缘特征的选择性。在此输出上，作者添加了第二个半波整流，用于消除负值。到了这一步，在前进方向上，小目标将会首先表现为亮度的升高（或下降），经过短暂的延迟后才出现相应的下降（或升高）。为了充分利用这一特征，作者每个通道的输出与相对通道的延迟版本（下图标记为低通滤波器（LP_ESTMD））相乘，然后对输出求和。这能够赋予最终系统足够的目标灵敏度，而与目标相对于背景的对比极性无关。

3）ESTMD 输出融合（Integration and facilitation of ESTMD output）：在这一模块中，处理后的信息将被用于两个方面。一方面，机器人需要根据输入的信息推断追踪目标的位置。输入这一模块的数据首先需要通过双曲正切 “激活” 函数 S（x），以保证所有数据值都在于 0 和 1 之间，其中的最大值将被认为是当前位置估计 r(t)。另一方面，由于目标追踪是一个连续的过程，将此前的信息连续不断的与最新的视觉信息整合起来是必须的。为了模拟昆虫更新信息的融合机制（facilitation mechanism），研究者们可以将当前的位置根据目标速度矢量进行相应的偏移——以作为对目标未来位置的估算——然后加权更新系统地图（Nordstr m 等人，2011; Dunbier 等人，2011; 2012）。在本文中，通过将当前位置估计（r（t））与由 Hassenstein-Reichardt 基本运动检测器提供的目标速度矢量（v（t））的估计值相乘，并乘以采样时间，可以计算出预测目标位置（r’(t+1)）。接下来，作者使用 2D 高斯核 FG（r"）来实现轨迹估计和实际观察到的数据之间的融合。文中使用的 2D 高斯核 FG（r"）相当于昆虫神经元的感受野之间有 50％的重叠。该输出上将被叠加一个低通滤波器（LP_Fac），处理后的信息将会被用于与下一次的输入信息进行融合，以提供目标在此前的运动轨迹。融合的强度由时间常数 τf 控制，其可以决定 r(t) 周围的位置将被增强多久。

4）扫视追踪算法（Saccadic Pursuit Algorithm）：在飞行过程中，昆虫会绕头移动（saccadic head movements），这是一种 “急速” 转弯——即短而快速的偏航转弯以改变注视方向。为了模拟这一行为，在成功的从视觉线索中识别目标并确定其位置后，追踪算法需要决定相应的前进速度，并保持目标始终在自己的视野中心内。当 ESTMD 输出的位置估计从视场中心移出超过 5° 时，机器人会重新扫视自己的视野并计算需要调整的角度，来模拟昆虫行为中看到的这种绕头移动。使目标保持在视野内的特定角度位置。

图：目标追踪的闭环流程

图源：Bagheri, Zahra & Cazzolato, Ben & Grainger, Steven & O"Carroll, David & Wiederman, Steven. (2017). An autonomous robot inspired by insect neurophysiology pursues moving features in natural environments. Journal of Neural Engineering. 14. 046030. 10.1088/1741-2552/aa776c.

在实际测试中，作者使用不同大小——直径 65mm 或 100mm——和不同颜色——黑色、深灰、浅灰、白色等——的泡沫球来代表目标。泡沫球被用类似于鱼线的透明细线悬挂于离地面 50-150cm 的高度，并按照固定的轨迹以 0.06m/s 或 0.12 m/s 的速度前进，以代表慢速和快速的目标。在实验过程中，如果机器人在泡沫球完成其运动轨迹之前能够前进至泡沫球一米之内，就认为追踪成功了。

由于相机硬件的限制，机器人只能以 20 Hz 的频率对所处环境进行采样并跟踪目标。整个实验可以在户外进行，也可以通过将周围环境投影到墙壁上在室内进行。由于室外环境的挑战更强，笔者将着重关注该机器人在室外的表现。

图：机器人的视频输出样例，用以显示室外实验的环境条件。

内部模型对目标检测的影响

如前文提到的，在飞行过程中，昆虫会绕头移动以使目标保持在视野内的特定角度位置。然而，这些扫视运动会导致视网膜图像的频繁且大量的移位。因此，在扫视过程中昆虫需要利用眼睛或身体的运动来调节视觉输入，以将视觉注意力转移到正确的位置。一些研究认为飞行昆虫体内有一种内部模型（internal model）来对这种扫视运动进行预测和计划。为了衡量这种内部模型对于追踪成功率的影响，作者比较了开环（open-loop）和闭环（closed-loop）控制下的追踪成功率。在闭环控制中，机器人系统可以根据运动传感器的信息，将融合了 ESTMD 的输出后的位置信息重新定位到完成扫视运动后的相应位置，而在开环控制实验中机器人则没有这类运动传感器数据。

结果——如下图（a）显示，闭环系统的目标检测成功率的中位数为 59%，而在开环系统中，检测成功的中位数则直接下降到 48％，因而显示了内部模型在跟踪目标检测中的重要作用。

信息融合对目标检测的影响

在机器人系统的第三部分内，作者实现了一个信息协助机制（facilitation mechanism），从而提高目标相对于其周围坏境的对比度。为了量化该协助机制的作用，作者选取了机器人在实验一开始难以尽快检测到目标，但在追踪过程中后来又将其锁定的视频图像。在这些图像中，作者人为的选取目标在第一帧中的位置，并将其作为融合机制中目标的未来位置，从而提供一个对目标位置的初识估计。整个过程可以持续 200 毫秒或 500 毫秒。

接下来，作者比较了在系统成功将目标锁定之前的帧内，系统有（200 ms 或 500 ms）或无目标初始位置估计的目标检测成功率。200 ms 和 500 ms 的目标初始位置的估计和信息融合将成功目标检测的中位数提高到 29％和 34％，相比之下，无目标初始位置的估计情况下的成功率是 3％，如下图（b）所示。这些结果表明，信息融合机制的存在可以有效的将注意力引导到目标位置，从而提高检测成功率。

图：a）内部模型对目标检测的影响， b）信息融合机制可增强目标相对于其周围坏境的对比度

目标对比度的重要性

作者在闭环追踪中量化了目标相对于环境的对比度的影响。下图（a）中的框线图总结了追踪过程中的平均目标对比度，框内的红线是平均对比度的中位数，两端则是 25％和 75％分位数，剩余的红色小点是 outlier。尽管在实验过程中光照条件会发生变化，因此目标对比度也会发生变化，但不同实验的平均对比度中位数实际上是相似的。如果将目标对比度平均分为 5 个水平，并计算其相应的追踪成功率——其中不同的曲线对应机器人在融合位置信息时使用的不同的时间常数 τf ——如图（b）所示，我们可以得出一些有趣的结论。

首先——不出意料的——可以看出高目标对比度对实现高追踪成功率是相当有效的。当目标对比度较低时，由于检测到目标的成功率已经很低，使用不同的时间常数 τf 基本没有任何影响，时间常数的最大影响是当目标对比度大于 0.3 时。作者认为，由于目标对比度在追踪过程中会发生变化，在实际使用时如果能够在目标对比度较高时使用合适的时间常数建立高效的融合机制，并在随后追踪中仅试图 “锁定” 在对比度降低的目标上，将会大大提高追踪的成功率。

图：目标对比度对于追踪成功率的影响

毫无疑问的，本文中受昆虫的生物结构启发而实现的各类模块使得机器人在低目标对比度、存在噪声的环境等的环境中表现的稳健型有了提高，并且系统的成功率与模拟（simulation）计算出的成功率相似。但是，该系统也有一些美中不足的地方 —— 在信息融合机制中，由于需要对目标的未来位置进行估计，对当前目标速度的估计是很重要的。而作者仅简单的使用了目标的当前速度并将分为 “慢”，“中” 或“快”三等。这不可避免的导致了位置估计的误差，从而影响了系统的表现。另外，当机器人运动时，其一定会受到震动产生的力和振动的影响。振动会削弱信息的获取、运动信息的命令输出或将输入信息与输出运动命令相关联的过程。昆虫通过减少振动传递到头部 / 复眼的方式——即头和身体独立转动——来减少其对视觉的影响。这种 “主动视觉” 在本文的机器人系统上并没有被实现。

本文其他的局限性主要来自于硬件系统——在当前的研究中，摄像机的帧数较低（20 fps），因而限制了机器人和目标的速度。而像蜻蜓等昆虫的飞行速度可以达到 6.8 m/s，也就是说，目前在地面上缓慢移动的机器人平台无法像蜻蜓那样处理同等水平的动态能量和运动控制难题。要实现高处理速度和低计算复杂度，就必须转向高速摄像头，并处理随之的数据处理和能耗要求。不难想象，如果以上问题都能够解决的话，该模型最理想的实现平台应该是无人机等空中平台。

三、导航：The Central Complex as a Potential Substrate for Vector Based Navigation

接下来，我们的目标转向在地面上活动的昆虫 —— 蚂蚁等昆虫具有强大的导航能力。一般认为，这类昆虫利用其大脑内的中心复合体（central complex）来实现与导航，方向和空间学习紧密相关的功能，上面的神经回路会通过称为路径整合（path integration ，PI）的过程来跟踪它们在巢外的移动情况。目前，建立在神经生理学和神经解剖学数据基础上的最新模型已经可以解释 PI 系统是如何控制昆虫在巢外环境探索并准确返回巢穴的——通过结合体内的指南针和速度信息，该系统可以不断更新原点矢量（home vector），用以记录目前其相对于巢穴的位置和方向——其中振幅用于记录距离，相位用于记录方向——从而允许昆虫在外行进任意路线之后直接返回巢穴。但是，昆虫不会仅将 PI 系统用于归巢。例如，他们还可以利用该系统存储向量信息（PI vector-memories）以返回到已知的食物位置，并在多个食物位置之间寻找捷径。对昆虫这种行为的实现可以提供基于矢量的丰富导航功能。

本文实现的中心复合体神经模型一共有五层，如下图所示。第一层分为两部分，分别由用于获取智能体（Agent）当前的速度（speed）的 TN_2 神经元和和用于获取前进方向（directional）的 TL 神经元组成。后者包含 16 个输入神经元，每个输入神经元都优先响应一个特定方向 α∈ 。通过判断哪个神经元被激活了，就可以得出智能体的前进方向。在实验中，智能体每走一步都会收到其目前的前进方向 α 和应该前进方向 θ ∈ [0, 2π) 之差的余弦值作为输入。

第二层由 16 个神经元组成，主要作为方向单元（direction cells）用以模拟昆虫体内的 CL1 神经元，这些神经元接收与前一层方向层的输出成比例的抑制输入。这些方向单元划分了方位角空间（azimuthal space ），并互相抑制，从而形成一个环形吸引电路（ring attractor circuit)，然后以正弦曲线形式产生稳定的分布图案。

第三层主要实现指南针（compass）功能，由 8 个神经元组成，它们从前一层中具有相同方向偏好的每对 CL 神经元中获取输入。这些神经元与中心复合体的前脑桥中的 TB1 神经元相同，它们也以类似于环形吸引电路的特定模式相互抑制连接。

第四层负责速度累加（Speed Accumulation），由 16 个神经元组成，主要模拟中心复合体上的 CPU_4 细胞，每个从 8 个 TB1 神经元和上一层的 CL_1 神经元获取输入。这些神经元实际上是一组积分单元（integrator cells ），负责结合方向和速度信息。值得注意的是，其速度输入是受到其相应方向单元的抑制的，因此神经元累积会与航向相反的行进距离，从而创建了原点矢量的分布式表示形式。

到这一步，作者额外添加了“向量记忆”（vector memory）神经元，该神经元可以存储第 4 层的输出状态，进而在该输出到达第 5 层之前对其进行调制（modulation）。具体来说，系统需要将利用记忆神经元的突触权重（synaptic weights）——两个节点之间联系的强度或幅度——实现向量记忆。当智能体发现食物后——当然这在此后的研究中可以被替换为更广泛的事件类型——智能体将会将当前的原点矢量存储到记忆神经元中。这样，智能体可以在之后回到它存储原点矢量的位置。当智能体回到巢穴后，第四层的输出在理想状态下应该为 0 ——因为它距离原点，也就是巢穴的距离为 0——因此，第四层中任何非零的输出都就代表了整个路径中的错误。利用这一“错误向量”，智能体可以对其存储的最后一个向量进行重新校准。

第五层模拟的是中央复合体的 CPU1 神经元，负责输出智能体的转向（steering）。它们接收来自第三层的指南针输入，以及第四层中经过向量内存调制（modulated）的原点向量。根据智能体的行动目的——比如归巢或觅食——神经元可以有选择性的接受输入信息。

图：中央复合体模型中的大概结构和主要连接

图源：Le Mo l, F., Stone, T., Lihoreau, M., Wystrach, A., & Webb, B. (2019). The Central Complex as a Potential Substrate for Vector Based Navigation. Frontiers in psychology, 10, 690.

作者在 Python 2.7 中搭建了模拟环境，主要包括一个巢穴（nest），几个食物点（feeders）和一些障碍物。巢穴和食物点都用圆形表示，并且其直径相对于模拟环境是较小的，但其会散发出一些特定的嗅觉信息，使得智能体在到达巢穴和食物附近后能够被吸引过来。而障碍物则可以是任意形状的，它会在很小的半径范围内发出排斥信号来迫使智能体转向。在测试中，智能体可以从外部参考系中获取有关其前进方向和速度的信息，如果智能体能够成功进入到巢穴或食物的半径范围内，就视为该测试成功。

作者首先测试了向量记忆是否可用于计算两个已知位置之间的捷径（shortcutting）。该测试目的，从几何上来说，如果智能体存储了两个从不同位置指向巢穴的原点矢量 F_1 和 F_2（下图中的绿色箭头和紫色箭头），那么当智能体处于 F_1 时，对 F_1 和 F_2 之间做减法，可以形成一个平行四边形，也就是可以得到从 F_1 直接前往 F_2 的捷径（下图中的深橘色箭头）。

图：昆虫如果利用其存储的向量可以计算多个目的地之间的捷径

图源：Le Mo l, F., Stone, T., Lihoreau, M., Wystrach, A., & Webb, B. (2019). The Central Complex as a Potential Substrate for Vector Based Navigation. Frontiers in psychology, 10, 690.

在实验过程中，智能体需要通过随机游走（random walk）——从而模拟昆虫探索周围环境的行为——独立的发现两处食物点并将其对应的原点矢量存储在向量记忆中。然后，智能体首先需要根据其记忆返回其中一个食物点，其记忆中的另一个原点向量将在到达后被激活，用以计算从当前食物点直接前往下一食物点的捷径。作者衡量了到达第二个食物点的成功率，前往第二个食物点的路径的平直性，以及离开第一个食物点的角度误差。在 212 次实验中，有 193 次智能体成功到达了第一个食物点，这其中到达第二个食物点的成功率高达 89.6%。

图：利用向量记忆寻找捷径。（A）智能体现在有两个不同的向量记忆神经元可用，但一次只能调用一个。（B）当智能体调用第一个向量到达 F1 后，有关 F2 的向量记忆会被激活，并通过向量之间的加减法计算从当前位置前往 F2 的捷径。半透明的线分别代表 100 次重复实验，其中一次实验用实线更清晰的标记出来用作示例。

图源：Le Mo l, F., Stone, T., Lihoreau, M., Wystrach, A., & Webb, B. (2019). The Central Complex as a Potential Substrate for Vector Based Navigation. Frontiers in psychology, 10, 690.

接下来，作者测试了智能体在需要依次访问多个食物点的时候能不能找到全局最短路径（multi-location routes）。这个测试一共有三种情况，第一种情况是正阵列（positive array），智能体一共需要访问五个食物点，每次仅简单的访问最近的下一个食物点就可以形成全局最短路径；第二种情况时负阵列（negative array），智能体需要访问六个食物点，但简单的访问最近邻与全局最短路径是不等价的；第三种情况也是负阵列，智能体需要访问十个食物点。已知在自然界中蜜蜂可以很好的处理前两种情况，但无法在第三种情况中找到最优解。每一种情况的食物点分布和最优路径如下图所示。

图：全局最短路径测试（A）智能体现在有多个不同的向量记忆神经元可用，但一次仍然只能调用一个；（B）正阵列（5 个食物点）测；（C）负阵列（6 个食物点）测试；（D）负阵列（10 个食物点）测试。左：中黑色的箭头的宽度与该线路出现的频率成正比；右上角：智能体最常选择的路线；右下角：单个路径示例

图源：Le Mo l, F., Stone, T., Lihoreau, M., Wystrach, A., & Webb, B. (2019). The Central Complex as a Potential Substrate for Vector Based Navigation. Frontiers in psychology, 10, 690.

在实验开始之前，作者首先保证每个食物点都在 100 次以上随机游走过程被智能体发现，然后对其存储的向量记忆求均值，从而获得关于每个食物点的精确的向量记忆，以排除位置误差在本次实验中的影响。然后在测试中，一次向外旅行（outward trip）对应于一个智能体离开巢穴，根据其向量记忆计算新路线或简单的追踪其记忆，并在找到所有食物点或达到时间限制后返回巢穴。在旅行过程中，智能体可以随时根据当前的 CPU4 激活值减去其向量记忆，产生的最小值所对应的向量记忆将被选择为当前调用的向量记忆，从而驱动智能体的活动路径。由于这类计算没有时间限制，如果最小值正好变化了，它可能在任何时刻调用不同的向量记忆并改变路径。当没有任何向量记忆可以调动后，智能体会直接返回巢穴。

每一种情况都被重复测试了 500 次以上，作者选取了测试中智能体成功在时间限制之内到达每个食物点然后返回巢穴的路径，计算了智能体造访食物点的顺序，完整路线的形状和频率以及食物点间的个别移动。

在第一种情况中（正阵列），智能体一种有 5 ！= 120 条可能的路线来访问此阵列中的 5 个食物点。在 500 次重复实验中，94.20％的智能体都成功完成了测试，其中有 77.71％（r = 366）和 15.07％（r = 71）的智能体使用了两种最佳路线（逆时针和顺时针；5、4、3、2、1 和 1、2， 3、4、5），有 1.49％和 0.64％的智能体选择了次佳路线，仅有不到 3% 的智能体使用另外的 8 中路线，剩余的 108 条可能路线则从来没有被选择过，这与学者们在蜜蜂中观察到的情况非常相似。

在第一个负阵列中，智能体一共有 6 ！= 750 条可能的路线来访问 6 个食物点，有 94% 的智能体都成功的通过了测试。虽然在其中，至于 2.77％的智能体选择了最佳路线（1、2、3、4、5、6），但作者发现有 47.23％的智能体选择了次优路线。剩下的智能体则选择了其他路径，同样的，有大量的路径（711 条）从来没有被选择过。

可能的路径总数随着食物点的增加是呈指数级增长的，在第二个负阵列中，智能体一共有 10！= 3628800 条可能的路线来访问 10 个食物点。所有实验中仍然有 95.40％的智能体成功的完成了测试，但相比于前两种情况，智能体的路径选择更多样化，500 次实验中一共有 371 条不同的路径被选择了。因而，作者也无法像此前的实验一样从中计算出一条具有代表性的典型路径来。相对来说，最经常被选择的四条路径在长度上不是最优的，同时也不是仅仅选择最近邻而形成的路线。接下来的三条最常被选择的路径是最优路径之一，但仅有 1.05％的智能体选择了它们。这次实验的结果显示了强烈的随机性，作者认为主要是由两个原因导致的：1）食物点间较短的相对距离会导致较大的方向误差，2）不同食物点之间的距离相似，导致当前向量记忆的选择更加随机。

整体来说，这篇文章证明了对矢量的操纵是对观察到的昆虫导航系统的高度简约的解释。它既符合解剖学模型，同时在实现上足够简单，产生的结果也与对实际昆虫的观测结果相符。本文中使用的向量记忆是新颖的，它可以校正 PI 机制中积累产生的误差，并且可以有效的在不同目的地之间计算捷径。但本文没有考虑到 PI 机制如何可以与其他导航线索结合起来——众所周知蚂蚁等昆虫会从腹部末端的肛门和腿上的腺体里分泌带有特殊气味的化学物质，以提供气味路标。这在原点矢量的位置不准确的时候将会提供极大的帮助。

结语

很显然，目前以模拟昆虫的功能实现智能系统的研究还处在一个比较早期的阶段，我们要在终端产品上见到这些系统还需要一段时间。但仿昆虫大脑的智能，乃至仿生智能，仍然为更一般的神经启发式 AI 提供了曙光。目前流行的深度学习，能够从大型数据集提取模式并获得超出人类水平的表现。但在半监督和无监督学习领域，开发出能够自我标记新类示例的算法仍然是一个挑战。尽管这些任务对于人类来说似乎微不足道，缺乏推理能力的深度学习算法仍难以与人类的性能相匹配。神经启发的 AI——或仿生智能——则提供了新的机会，因为它可能可以直接跳过我们目前常用的解题思路来解决这些难题。一旦研究者们能取得突破，人类对自然界智能的认知又将再上一个台阶。

参考文献

[1] Chancan, M., Hernandez-Nunez, L., Narendra, A., Barron, A. B., & Milford, M. (2020). A hybrid compact neural architecture for visual place recognition. IEEE Robotics and Automation Letters, 5(2), 993-1000. https://doi.org/10.1109/LRA.2020.2967324

[2] Chance, F. S., Aimone, J. B., Musuvathy, S. S., Smith, M. R., Vineyard, C. M., & Wang, F. (2020). Crossing the Cleft: Communication Challenges Between Neuroscience and Artificial Intelligence. Frontiers in computational neuroscience, 14, 39. https://doi.org/10.3389/fncom.2020.00039

[3] Webb, Barbara. (2020). Robots with insect brains. Science. 368. 244-245. 10.1126/science.aaz6869.

[4] Bagheri, Zahra & Cazzolato, Ben & Grainger, Steven & O"Carroll, David & Wiederman, Steven. (2017). An autonomous robot inspired by insect neurophysiology pursues moving features in natural environments. Journal of Neural Engineering. 14. 046030. 10.1088/1741-2552/aa776c.

[5] Le Mo l, F., Stone, T., Lihoreau, M., Wystrach, A., & Webb, B. (2019). The Central Complex as a Potential Substrate for Vector Based Navigation. Frontiers in psychology, 10, 690. https://doi.org/10.3389/fpsyg.2019.00690

[6] Le, D. C., Youn C. H. (2020). City-Scale Visual Place Recognition with Deep Local Features Based on Multi-Scale Ordered VLAD Pooling. arXiv:2009.09255 **

[7] https://en.wikipedia.org/wiki/Mushroom_bodies

[8] Wu, S., Wong, K. Y., Fung, C. C., Mi, Y., & Zhang, W. (2016). Continuous Attractor Neural Networks: Candidate of a Canonical Model for Neural Information Representation. F1000Research, 5, F1000 Faculty Rev-156. https://doi.org/10.12688/f1000research.7387.1

分析师介绍：

本文作者为Yuanyuan Li。几次转行，本科国际贸易，研究生转向统计，毕业后留在比利时，从事农用机械研发工作，主要负责图像处理，实现计算机视觉算法的落地。欣赏一切简单、优雅但有效的算法，试图在深度学习的簇拥者和怀疑者之间找到一个平衡。

关于机器之心全球分析师网络 Synced Global Analyst Network

机器之心全球分析师网络是由机器之心发起的全球性人工智能专业知识共享网络。在过去的四年里，已有数百名来自全球各地的 AI 领域专业学生学者、工程专家、业务专家，利用自己的学业工作之余的闲暇时间，通过线上分享、专栏解读、知识库构建、报告发布、评测及项目咨询等形式与全球 AI 社区共享自己的研究思路、工程经验及行业洞察等专业知识，并从中获得了自身的能力成长、经验积累及职业发展。

关键词：小小大脑大大智慧

小小的大脑，大大的智慧——仿昆虫智能为通用AI带来的新思路

推荐内容