可信的间隔和可信的集合,如最高的后密度(HPD)间隔,在贝叶斯系统遗传学中形成了一个不可或缺的统计工具,用于系统发育分析和开发。 可用于连续参数,如基本频率和时钟速率,树拓扑的广阔而复杂的空间为定义类似的可信集合带来了重大挑战。 传统的基于频率的方法不足以用于分散的后向,其中采样的树木通常是独一无二的。 为了解决这个问题,我们引入了新颖而有效的方法来估计单个树拓扑的可信水平,使用可处理的树分布,特别是条件Clade分布(CCD)。 此外,我们提出了一个名为α可信CCD的新概念,它封装了CCD,其树木共同构成α概率。 我们提出算法来有效地计算这些可信的CCD,并确定树拓扑和子树的可信水平。 我们评估这些可信的集合方法的准确性,利用模拟和真实的数据集。 此外,为了证明我们方法的实用性,我们使用经过良好校准的模拟研究来评估不同CCD模型的性能。 特别是,我们展示了如何使用可信的集合方法来进行等级均匀性验证并生成经验累积分布函数(ECDF)图,以补充连续参数的标准覆盖分析。
随着进化动力学从理论领域转向应用,算法需要超越简单的模型。 然而,文献中很少有这样的方法。 众所周知,生态和生理因素是现实背景下进化的核心,但考虑到这些因素,这些因素通常会使问题难以适应现有方法。 我们介绍了进化游戏的公式,通过建模作为计算来解释生态学和生理学,并使用它通过强化学习的方法分析定向进化的问题。 这种组合使我们能够在学习控制不断进化的细胞群的算法问题上首次开发出同类结果。 我们证明了在细胞生理学或生态学的先前知识有限的情况下生态进化控制的复杂性,给出了指导进化最一般版本的数学问题的第一个结果,并在人工智能和生物学之间建立了新的联系。
辩证进化产生了复杂的系统发育网络,使他们的解释具有挑战性。 一个典型的方法是在这样的网络中提取树木。 自弗朗西斯和钢铁的开创性论文以来,“哪些物理发育网络是只有额外的弧度?” (2015),基于树木的系统发育网络及其支持树(与给定网络具有相同的根和叶的树)已经进行了广泛的研究。 然而,并非所有的系统发育网络都是基于树木的,对于重新调节进化的研究,识别支持网络而不是树木通常更具生物学相关性。 这项研究概括了Hayamizu对根植二叉系统发育网络的结构定理,该定理为支撑树的各种计算问题提供了最佳算法,以扩展支持树的理论框架以支持网络。 这使我们能够获得三个集合中的每个直接产品特征:所有,最小和最小支持网络,对于给定网络。 每个表征都会产生用于计数和生成每种类型的支持网络的最佳算法。 应用程序包括用于查找具有最少重调(即最小层)的支持网络的线性时间算法。 我们还提供精确和指导性的算法,用于寻找具有最低水平的支持网络,既在指数时间运行,但在相当广泛的重调数字中实用。
信任和回报是经济、社会和其他互动的基础。 虽然信任游戏被广泛用于研究两个玩家之间的交互概念,通常交替扮演不同的角色(即投资者和受托人),但它对多人游戏场景的扩展仅限于玩家只承担一个角色的情况。 我们提出了一个对称的N玩家信任游戏,其中玩家在两个角色之间交替,玩家的回报被定义为他们两个角色的平均值,并驱动进化游戏动态。 我们发现,与现在对称的N-player信任游戏相比,亲社会策略更难发展,而公共产品游戏研究得很好。 特别是,在对称的N-player信任游戏中,信任无论在混合人群中的成本效益如何,都未能发展。 在结构化人群中,非线性回报会对信任的演变产生强烈影响。 相同的非线性可以产生截然不同的结果,这取决于底层网络的性质。 我们的研究结果强调了考虑回报结构和网络拓扑结构在理解亲社会行为的出现和维护方面的重要性。
物种分布模型(SDM)对于测量和预测物种的发生和栖息地的适用性及其与环境因素的关系是必要的。 我们引入了一种新的仅存在SDM与图形神经网络(GNN)。 在我们的模型中,物种和位置被视为两个不同的节点集,学习任务是预测检测记录作为将位置连接到物种的边缘。 使用GNN for SDM使我们能够模拟物种与环境之间的细粒度相互作用。 我们评估该方法在国家生态分析和合成中心(NCEAS)编制的六区域数据集上的潜力,用于基准测试SDM。 对于每个区域,异构GNN模型可与先前基准的单物种SDM和前向神经网络基线模型相媲美或优于。
我们提出了一个词的进化生态学模型,试图通过使用大型语言模型(LLM)的丰富语言表达来扩展进化博弈论和基于代理的模型。 我们的模型使代理之间相互作用的多样化和无限选项的出现和演变成为可能。 在人群中,每个代理都有一个由LLM产生的短词(或短语),并在空间环境中移动。 当代理人相邻时,他们互动的结果取决于LLM基于他们单词之间的关系,失败者的单词被获胜者的单词所取代。 可能发生单词突变,也基于LLM输出。 我们进行了初步实验,假设“强动物物种”会存活下来。 结果表明,从由知名物种组成的初始种群中,许多物种逐渐以平衡的方式出现。 每项试验都展示了不同种群的独特进化,其中一种大型物种占主导地位,如陆地动物,海洋生物或灭绝物种,这些物种是生态专业化的,并且适应了不同极端栖息地的物种。 我们还对大量人口进行了长期实验,展示了不同物种的出现和共存。
预测水平基因转移通常需要比较序列数据,但最近的研究表明,基于字符的方法也可能对这项任务有用。 值得注意的是,完美传输网络(PTN)解释了一组特征的特征的多样性,这些特征很少丢失,但可以横向转移。 描述这些字符的结构是理解更复杂的字符的重要一步。 虽然高效的算法可以从字符数据中推断出这些网络,但它们有时可以预测过于复杂的传输历史。 为了恢复该模型中最简单的可能场景,我们引入了胆量完美的传输网络,这些传输网络是胆怯的树。 这种网络对于在类似树的进化方面不兼容的字符很有用,但这确实适合几乎树的场景。 我们为两个问题提供多项式时间算法:决定是否可以将转移边缘添加到树中,将其转换为胆量PTN,以及决定一组字符是否与胆量兼容,即可以用一些胆量PTN来解释。 我们还分析了由细菌物种树和KEGG作为字符功能组成的真实数据集,并得出了关于解释胆树中字符的困难的几个结论,这为未来的研究提供了几个方向。
我们提出了生物大脑学习回路的设计原理。 该原则指出,几乎任何通过异性可塑性更新的树突权重都可以实现基于梯度的元学习的广义和高效类。 该理论表明,广泛的生物学上合理的学习算法,以及标准的机器学习优化器,可以基于异构电路主题。 这一原则表明,(抗)Hebbian(HBP)和异突唑可塑性(HSP)的现象学可能来自相同的潜在动力学,从而提供了统一的解释。 它还提出了神经可塑性的替代视角,HSP被推广为主要学习和记忆机制,HBP是一种新兴的副产品。 我们提出的模拟表明(a)HSP可以解释神经元的可塑性,(b)HSP可以解释生物学回路的灵活性,(c)梯度学习可以快速产生于不计算任何显式梯度的简单进化动力学。 虽然我们的主要关注点是生物学,但该原则也意味着设计人工智能训练算法和物理可学习的人工智能硬件的新方法。 从概念上讲,我们的结果表明,与共同的信念相反,梯度计算在自然界中可能非常容易和普遍。
Typology是语言学的一个子领域,专注于基于其结构特征的语言的研究和分类。 与研究语言之间历史关系的族谱分类不同,类型学试图通过识别共同属性和模式(称为普遍性)来理解人类语言的多样性。 近年来,计算方法在类型学研究中发挥着越来越重要的作用,能够分析大规模语言数据,并测试有关语言结构和演变的假设。 本文介绍了计算统计建模在类型学中的好处。
在持续的COVID-19大流行中,公共卫生当局和普通民众正在努力在安全和正常之间取得平衡。 不断变化的条件要求发展理论和模拟工具,以精细地描述社会的多个阶层,同时支持对“假设”情景的评估。 尤其重要的是评估潜在检测方法和疫苗接种策略的有效性。 在这里,提出了一个基于代理的建模平台,以模拟COVID-19在小城镇的传播,具有单一个体分辨率。 该平台通过纽约新罗谢尔的真实数据进行了验证 - 这是美国首次注册的疫情之一。 在专家知识的支持下,该模型在统计上的现实人群中包含了传播的详细要素。 除了测试,治疗和疫苗接种选项等相关功能外,该模型还解释了其他症状与COVID-19相似的疾病的负担。 该模型的独特之处在于探索不同的测试方法 - 在医院或驾驶设施中 - 以及可能优先考虑弱势群体的疫苗接种策略。 公共当局的决策可以从该模型中受益,因为它的精细分辨率,开源性质和广泛的功能。
我们提出一个统一的几何框架,用于建模物理、生物和机器学习系统中的学习动力学。该理论揭示了三种基本状态,每种状态都源于可训练变量空间中的度量张量 g 与噪声协方差矩阵 κ 之间的幂律关系 g ∝ κ^a。量子状态对应于 a = 1,描述了一种源自离散平移对称性的薛定谔类动力学。高效学习状态对应于 a = 1/2,描述了非常快速的机器学习算法。平衡状态对应于 a = 0,描述了生物进化的经典模型。我们认为中间状态 a = 1/2 的出现是生物复杂性出现的一个关键机制。
一般计量经济学,特别是小组数据方法,在公共卫生经济学和社会政策分析中变得至关重要。 在这篇讨论论文中,我们采用了一种有益的方法,即可行性通用最小分量(FGLS)来评估秘鲁五岁以下儿童的血红蛋白(调整为海平面)、体重和身高之间是否有统计相关关系。 通过使用这种方法,我们可能会找到一个工具,使我们能够确认秘鲁机构和当局在目标变量之间考虑的关系是否朝着对抗慢性营养不良和发育迟缓的正确方向前进。
多维缩放(MDS)是一种用于微生物生态学数据分析的降维技术,它代表多变量结构,同时保留样品之间的成对距离。 虽然它的改进增强了按样本组揭示数据模式的能力,但这些基于MDS的方法需要事先假设进行推理,限制了其在一般微生物组分析中的应用。 在这项研究中,我们引入了一种新的基于MDS的戒律,F-informed MDS,它根据F统计,即共享共同和不同特征的组之间的分散比例来配置数据分布。 使用模拟组合数据集,我们证明所提出的方法对超参数选择是健壮的,同时在整个协调过程中保持统计意义。 评估降维的各种质量指标证实,F-informed MDS在保护本地和全球数据结构方面与最先进的方法相当。 它应用于与硅藻相关的细菌群落,表明这种新方法在解释社区对宿主的反应方面的作用。 我们的方法提供了与统计测试结果一致的MDS的有根据的改进,这对于微生物学和生态学中更广泛的组成数据分析是有益的。 这种新的可视化工具可以纳入标准微生物组数据分析。
No more items to load.