Explaining Human Choice Probabilities with Simple Vector Representations
Peter DiBerardino and Britt Anderson
当人们追求随机环境中的奖励时,他们通常会将他们的选择频率与观察到的目标频率相匹配,即使这个政策明显低于最佳。 我们使用“隐藏和寻求”任务来评估这种行为,在这种情况下,追求(寻求)可以切换为避免(隐藏),同时通过改变可能的选择数量来保持概率分布固定或不同的复杂性。 我们开发了一个参与者选择模型,该模型由作为矢量处理的选择频率直方图构建。 我们假设存在避免(隐藏)轮的概率反匹配策略,并将其正式化为概率匹配的向量反射。 我们发现,只有两种基础策略:匹配/对抗和最大化/最小化足以解释一系列房间数和对手概率分布的参与者选择。 这种模式只需要人们有能力记住不同结果的相对频率。 有了这些知识,简单的操作可以构建最大化和最小化策略以及匹配和反匹配策略。 这两种政策的混合物在随机环境中捕捉人类的选择模式。
When people pursue rewards in stochastic environments, they often match their choice frequencies to the observed target frequencies, even when this policy is demonstrably sub-optimal. We used a "hide and seek" task to evaluate this behavior under conditions where pursuit (seeking) could be toggled to avoidance (hiding), while leaving the probability distribution fixed, or varying complexity by changing the number of possible choices. We developed a model for participant choice built from choice ...