Artificial Finance: How AI Thinks About Money
Orhan Erdem, Ragavi Pobbathi Ashok
在本文中,我们探讨了大型语言模型(LLM)如何通过系统地比较它们与全球人类参与者的反应来处理财务决策。 我们向七种领先的LLM提出了一组常用的财务决策问题,包括GPT系列(GPT-4o,GPT-4.5,o1,o3-mini),Gemini 2.0 Flash和DeepSeek R1的五种型号。 然后,我们将它们的输出与来自涵盖53个国家的数据集的人类响应进行比较。 我们的分析揭示了三个主要结果。 首先,LLM通常表现出风险中立的决策模式,在面对彩票类型的问题时,倾向于与预期价值计算一致的选择。 其次,在评估当前和未来之间的权衡时,LLM偶尔会产生与规范推理不一致的反应。 第三,当我们研究跨国相似性时,我们发现LLM的总体反应与来自坦桑尼亚的参与者的反应最为相似。 这些发现有助于理解LLM如何模仿类人的决策行为,并突出其产出中潜在的文化和培训影响。
In this paper, we explore how large language models (LLMs) approach financial decision-making by systematically comparing their responses to those of human participants across the globe. We posed a set of commonly used financial decision-making questions to seven leading LLMs, including five models from the GPT series(GPT-4o, GPT-4.5, o1, o3-mini), Gemini 2.0 Flash, and DeepSeek R1. We then compared their outputs to human responses drawn from a dataset covering 53 nations. Our analysis reveals t...