Emergence of Internal State-Modulated Swarming in Multi-Agent Patch Foraging System
Siddharth Chaturvedi, Ahmed EL-Gazzar, Marcel van Gerven
活性粒子是通过消耗能量来维持持续失平衡运动的实体。 在某些条件下,它们表现出通过协调运动进行自我组织的倾向,例如通过聚合蜂拥而至。 在执行非合作觅食任务时,觅食者出现这种蜂拥行为,例如活性粒子,已归因于环境的部分可观察性,其中另一个觅食者的存在可以作为代理信号,以指示食物源或资源贴片的潜在存在。 在本文中,我们通过模拟多个自走式觅食者以不合作的方式从多个资源补丁中觅食来验证这一现象。 这些觅食者在一个连续的二维空间中工作,具有随机位置更新和部分可观察性。 我们以连续时间循环神经网络的形式发展共享策略,作为觅食者的速度控制器。 为此,我们使用一种进化策略算法,其中策略分发的不同样本在同一次推出中进行评估。 然后我们表明,代理能够学会在环境中自适应地觅食。 接下来,我们展示了在资源补丁不存在时,以聚合的形式在觅食者中出现蜂拥而至。 我们观察到,这种蜂拥行为的强度似乎与觅食者中存储的资源量成反比,后者支持对风险敏感的觅食索赔。 在最小测试中对学习控制器隐藏状态进行经验分析,揭示了他们对存储在觅食者中的资源的敏感性。 抑制这些隐藏状态以表示较少的资源,加速其学习聚合行为。
Active particles are entities that sustain persistent out-of-equilibrium motion by consuming energy. Under certain conditions, they exhibit the tendency to self-organize through coordinated movements, such as swarming via aggregation. While performing non-cooperative foraging tasks, the emergence of such swarming behavior in foragers, exemplifying active particles, has been attributed to the partial observability of the environment, in which the presence of another forager can serve as a proxy s...