42digest首页

定量方法研究快报

用 AI 跟踪日新月异的定量方法领域进展

Boltzina: Efficient and Accurate Virtual Screening via Docking-Guided Binding Prediction with Boltz-2

Boltzina:通过基于Boltz-2的对接引导结合预测实现高效准确的虚拟筛选

在基于结构的药物发现中,使用传统分子对接方法进行虚拟筛选可以快速执行,但在预测准确性方面存在局限性。最近提出的Boltz-2在结合亲和力预测方面实现了极高的准确性,但每个化合物在GPU上需要约20秒的处理时间,难以应用于数十万到数百万化合物的大规模筛选。本研究提出了Boltzina,这是一个新颖的框架,既利用了Boltz-2的高准确性,又显著提高了计算效率。Boltzina通过省略Boltz-2架构中的限速结构预测步骤,直接从AutoDock Vina对接构象预测亲和力,从而实现了准确性和速度的双重优势。我们在MF-PCBA数据集的八个测定上进行了评估,结果表明虽然Boltzina的性能低于Boltz-2,但与AutoDock Vina和GNINA相比,它提供了显著更高的筛选性能。此外,通过减少循环迭代和批处理,Boltzina实现了高达11.8倍的加速。进一步地,我们研究了多构象选择策略以及结合Boltzina和Boltz-2的两阶段筛选方法,提出了根据应用需求优化准确性和效率的方法。这项研究代表了将Boltz-2的高精度预测应用于实际规模筛选的首次尝试,为计算生物学提供了一个兼顾准确性和效率的流程。Boltzina可在github上获取:https://github.com/ohuelab/boltzina。

生物分子 计算工程、金融与科学 机器学习
DrugReasoner: Interpretable Drug Approval Prediction with a Reasoning-augmented Language Model

药物推理器:具有推理增强语言模型的可解释药物批准预测

药物发现是一个复杂且资源密集型的过程,对优化研究投资至关重要的早期预测批准结果。 虽然经典的机器学习和深度学习方法在药物批准预测中显示出希望,但它们有限的可解释性限制了它们的影响。 在这里,我们介绍了DrugReasoner,一种基于LLaMA架构的基于推理的大型语言模型(LLM),并通过组相对策略优化(GRPO)进行了微调,以预测小分子批准的可能性。 DrugReasoner将分子描述符与结构相似的批准和未经批准的化合物的比较推理相结合,产生预测以及逐步的理由和信心评分。 DrugReasoner在验证集上分别获得0.732的AUC和0.725和0.718的F1得分,在测试集上分别取得了0.725和0.718的强劲表现。 这些结果优于常规基线,包括逻辑回归,支持向量机和k近邻,并且相对于XGBoost具有竞争性能。 在外部独立数据集上,DrugReasoner的表现优于基线和最近开发的ChemAP模型,实现了0.728的AUC和0.774的F1分数,同时保持高精度和平衡的灵敏度,证明了现实世界场景中的稳健性。 这些发现表明,DrugReasoner不仅提供了有竞争力的预测准确性,而且还通过其推理输出增强了透明度,从而解决了人工智能辅助药物发现的一个关键瓶颈。 这项研究强调了推理增强LLM作为药物决策可解释和有效的工具的潜力。

机器学习 人工智能 定量方法
Learning Explainable Imaging-Genetics Associations Related to a Neurological Disorder

与神经疾病相关的可解释成像-遗传学协会

虽然成像遗传学对于解开大脑结构和神经系统疾病遗传变异之间的复杂相互作用有很大的希望,但传统方法仅限于简单的线性模型或缺乏可解释性的黑箱技术。 在本文中,我们介绍了NeuroPathX,这是一个可解释的深度学习框架,它使用由交叉注意力机制驱动的早期融合策略,以捕获来自MRI的大脑结构变化与从遗传学数据中提取的既定生物学途径之间的有意义的相互作用。 为了增强可解释性和鲁棒性,我们在注意力矩阵上引入了两个损失函数 - 一种专注于最显着相互作用的稀疏损失和路径相似性损失,在整个队列中强制执行一致的表示。 我们在自闭症谱系障碍和阿尔茨海默病上验证了NeuroPathX。 我们的结果表明,NeuroPathX优于竞争基线方法,并揭示了与疾病相关的生物学上合理的关联。 这些发现强调了NeuroPathX推进我们对复杂大脑疾病的理解的潜力。 代码可在https://github.com/jueqiw/NeuroPathX 查阅。

机器学习 人工智能 定量方法
Sparse Autoencoders for Low-N Protein Function Prediction and Design

用于低N蛋白功能预测和设计的稀疏自动编码器

从氨基酸序列中预测蛋白质功能仍然是数据稀缺(low-N)机制的核心挑战,当只有少量的测定标记的序列函数数据可用时,限制机器学习引导的蛋白质设计。 蛋白质语言模型(pLMs)通过提供进化知情的嵌入和稀疏自动编码器(SAE)使这些嵌入分解为可解释的潜在变量,捕获结构和功能特征。 然而,SAEs对低N功能预测和蛋白质设计的有效性尚未得到系统的研究。 在这里,我们评估在微调ESM2嵌入方面训练的SAE,涉及不同的健身外推和蛋白质工程任务。 我们表明,SAEs,只有24个序列,在健身预测中始终优于或与其ESM2基线竞争,这表明其稀疏的潜伏空间编码紧凑且具有生物学意义的表征,从有限的数据中更有效地概括。 此外,转向预测性潜伏物利用pLM表示中的生物图案,在83中产生顶级适应性变体

机器学习 定量方法
DeepAtlas: a tool for effective manifold learning

DeepAtlas:有效多边学习的工具

流形学习建立在“多形假说”的基础上,该假说假设认为高维数据集中的数据来自低维流形。 当前的工具生成数据的全局嵌入,而不是用于数学定义流形的本地地图。 这些工具也无法评估多面假设是否适用于数据集。 在这里,我们描述了DeepAtlas,一种算法,可以生成数据本地社区的低维表示,然后训练深度神经网络,这些神经网络映射到这些局部嵌入和原始数据之间。 拓扑失真用于确定数据集是否来自流形,如果是的话,则来自其维度。 测试数据集的应用程序表明DeepAtlas可以成功学习多形结构。 有趣的是,许多真实的数据集,包括单细胞RNA测序,不符合多形假说。 在数据来自流形的情况下,DeepAtlas 构建了一个可以生成式使用的模型,并承诺允许将强大的工具从微分几何应用于各种数据集。

机器学习 定量方法

最新研究

药物安全评估研究中自我监督的大规模肾脏异常检测

所有临床前药物开发都需要肾脏异常检测。 它涉及对每份药物安全研究数百到数千张全幻灯片图像进行耗时且昂贵的检查,其中大部分是正常的,以检测任何指示毒性作用的细微变化。 在这项研究中,我们提出了第一个用于肾脏毒理学的大规模自我监督异常检测模型,涵盖158种化合物的药物安全性评估研究。 我们使用从UNI基础模型(FM)中提取的特征来探索这种规模肾脏异常检测的复杂性,并表明这些特征上一个简单的k-nearest邻居分类器是偶然的,表明仅FM生成的特征不足以检测异常。 然后,我们证明,应用于相同特征的自我监督方法可以实现优于机会的性能,接收器操作特性曲线下的区域为0.62,负预测值为89。

计算机视觉与模式识别图像与视频处理定量方法
arXiv

基于模拟的酵母中年推断

染色质折叠和细胞中染色体的空间排列在DNA复制和基因表达中起着至关重要的作用。 不当的染色质折叠可能导致故障,并随着时间的推移,疾病。 对于真核生物来说,中心体对于适当的染色体分离和折叠至关重要。 尽管使用基因组的新测序和注释分析进行了广泛的研究,但酵母中的中心位置仍然难以推断,在大多数物种中仍然未知。 最近,全基因组染色体构象捕获与下一代测序(Hi-C)相结合,已成为研究染色体结构的领先方法之一。 最近的一些研究使用Hi-C数据给出了每个中心体的点估计,但这些方法高度依赖于良好的预定位。 在这里,我们提出了一种新的方法,根据实验性的Hi-C地图和模拟接触地图,以随机的方式推断出萌芽酵母中所有中心的位置。

机器学习 (统计)机器学习定量方法
arXiv

为什么游泳池,当你可以流动? 使用 GFlowNets 进行主动学习

基于池的主动学习的可扩展性受到评估大型未标记数据集的计算成本的限制,这一挑战在药物发现的虚拟筛选中尤为严重。 虽然像贝叶斯主动学习(Bayesian Active Learning by Disagreement,BALD)这样的积极学习策略优先考虑信息样本,但当扩展到包含数十亿样本的库时,它仍然是计算密集型的。 在这项工作中,我们介绍了BALD-GFlowNet,这是一个规避此问题的生成式主动学习框架。 我们的方法利用生成流网络 (GFlowNets) 直接采样对象与 BALD 奖励成比例。 通过将传统的基于池的获取替换为生成式采样,BALD-GFlowNet实现了独立于未标记池大小的可扩展性。 在我们的虚拟筛选实验中,我们表明BALD-GFlowNet实现了与标准BALD基线相当的性能,同时产生了更多结构多样化的分子,为高效和可扩展的分子发现提供了有希望的方向。

机器学习人工智能定量方法
arXiv

朋友或敌人

微生物生态学的一个基本挑战是确定细菌在不同环境条件下是否竞争或合作。 随着基因组规模代谢模型的最新进展,我们现在能够在实验上模拟数千对不同环境环境中数千对细菌之间的相互作用。 这些方法可以生成大量数据,这些数据可以通过最先进的机器学习算法来揭示驱动交互的机制。 在这里,我们介绍了Friend或Foe,一个由64个表格环境数据集组成的汇编,由超过26M的共享环境组成,用于从两个最大的代谢模型集合中采样的超过10K对细菌。 Friend或Foe数据集用于广泛的机器学习任务 - 监督,无监督和生成 - 以解决细菌相互作用的具体问题。 我们为每项任务提供了最新的模型,我们的结果表明,机器学习可以成功地应用于微生物生态学。 超越,对Friend或Foe汇编的分析可以揭示细菌相互作用的可预测性,并突出细菌如何推断和驾驭它们关系的新研究方向。

定量方法机器学习
arXiv

通过知识图驱动的分析框架实现唐氏综合症研究

Trisomy 21导致唐氏综合症,这是一种多方面的遗传性疾病,具有不同的临床表型,包括心脏缺陷,免疫功能障碍,神经发育差异和早发性痴呆风险。 跨研究的异质性和分散的数据挑战了全面的研究和转化发现。 NIH INCLUDE(Investigation of Co-Coccurring conditions across the Lifespan to Understand Down syndromE)计划已经收集了协调的参与者级数据集,但实现其潜力需要综合分析框架。 我们开发了一个知识图驱动平台,将9项INCLUDE研究(包括7,148名参与者,456种条件,501种表型和37,000多种生物标本)转化为统一的语义基础设施。 使用Monarch Initiative数据的跨资源丰富将覆盖范围扩大到4,281个基因和7,077个变体。 由此产生的知识图包含超过160万个语义关联,通过图嵌入和基于路径的推理进行假设生成AI就绪分析。 研究人员可以通过SPARQL或自然语言界面查询图形。 该框架将静态数据存储库转换为动态发现环境,支持跨研究模式识别,预测建模和唐氏综合症中基因型-表型关系的系统探索。

定量方法人工智能数据库机器学习
arXiv

数据相对平滑的蛋白质发现与跳跳采样

通过学习迭代逆转噪音过程,扩散模型已经成为一类强大的生成模型。 它们生成高质量样本的能力已经超越了高维图像数据扩展到其他复杂领域,如蛋白质,其中数据分布通常稀疏且分布不均匀。 重要的是,色度本身是不均匀的。 从经验上讲,我们观察到,虽然一小部分样本位于致密的簇中,但大多数样本在整个数据空间中占据不同稀疏的区域。 现有方法在很大程度上忽略了这种数据依赖性的可变性。 在这项工作中,我们引入了一个数据依赖平滑的Walk-Jump框架,该框架使用内核密度估计(KDE)作为预处理步骤来估计每个数据点的噪声量表σ,然后训练具有这些数据依赖ς的分数模型。 通过将局部数据几何学纳入去噪过程,我们的方法解释了蛋白质数据的异质分布。 经验评估表明,我们的方法在多个指标上产生了一致的改进,突出了数据感知sigma预测在稀疏,高维设置中生成建模的重要性。

机器学习定量方法
arXiv

数据驱动的发现数字双胞胎在生物医学研究中

最近的技术进步扩大了高通量生物数据集的可用性,使生物医学系统或患者的数字孪生的可靠设计成为可能。 这种计算工具代表了驱动扰动或药物反应的关键反应网络,可以指导药物发现和个性化治疗。 然而,他们的发展仍然依赖于人类建模者费力的数据集成,因此迫切需要自动化方法。 物理中数据驱动的系统发现的成功,植根于干净的数据集和明确的管理规律,激发了在生物学中应用类似技术的兴趣,这带来了独特的挑战。 在这里,我们回顾了从生物时间序列中自动推断数字孪生的方法,其中主要涉及符号或稀疏回归。 我们根据八个生物和方法论挑战来评估算法,这些挑战与嘈杂/不完整的数据、多种条件、先验知识集成、潜在变量、高维度、未观察到的变量衍生物、候选库设计和不确定性量化有关。 根据这些标准,稀疏回归通常优于符号回归,特别是在使用贝叶斯框架时。 我们进一步强调了深度学习和大型语言模型的新兴作用,这些模型可以实现创新的先验知识集成,尽管必须改进这种方法的可靠性和一致性。 虽然没有一种方法可以解决所有挑战,但我们认为,学习数字孪生的进步将来自混合和模块化框架,结合了基于化学反应网络的机械基础,贝叶斯不确定性量化以及深度学习的生成和知识集成能力。 为了支持它们的发展,我们进一步提出了一个基准框架,以评估所有挑战的方法。

定量方法机器学习机器学习 (统计)
arXiv

当许多树去战争

众所周知,同一n叶上的任何两棵树都可以由具有n-2网点的网络显示,并且有两棵树不能由网点较少的网显示。 但是需要多少个网点来显示多棵树呢? 对于 n 叶子上的任何一组 t 树,有一个带有 (t - 1)n 的 reticulations 的琐碎网络,显示它们。 为了做得更好,我们必须利用树的共同结构,将不同树的非平凡的子树嵌入到网络的同一部分。 在本文中,我们表明,对于t ∈ o(√(n)),有一组t树,几乎没有共同的结构可以利用。 更准确地说,我们显示任何 t∈ o(√(n)),都有 t 树,因此显示它们的任何网络都有 (t-1)n - o(n) 重调。 对于 t ∈ o(n),我们得到一个稍微弱的绑定。 我们还证明,对于任何常量 c > 0 的 t 树,已经有一组 t 树不能由具有 o(n n) 重调的网络连接显示,与已知 O(n n) 的上界数匹配到常量因子足以显示所有有 n 叶子的树。 这些结果基于简单的计数参数,并扩展到未根的网络和树。

组合数学离散数学定量方法
arXiv

ImmunoAI:使用梯度增强机器学习与热力学-水力描述符和3D几何界面拓扑学的加速抗体发现

人类甲硝病毒(hMPV)对儿科,老年人和免疫功能低下的人群构成严重风险。 传统的抗体发现管道需要10-12个月,限制了它们适用于快速爆发反应。 该项目引入了ImmunoAI,这是一种机器学习框架,通过使用在热力学,流体力学和3D拓扑界面描述仪上训练的梯度增强模型来预测高亲和力候选者,从而加速抗体发现。 策划了213个抗体抗原复合物的数据集,以提取几何和物理化学特征,并训练了LightGBM回归器,以高精度预测结合亲和力。 该模型将抗体候选者搜索空间减少了89个

定量方法机器学习生物分子
arXiv

Boltzina:通过基于Boltz-2的对接引导结合预测实现高效准确的虚拟筛选

在基于结构的药物发现中,使用传统分子对接方法进行虚拟筛选可以快速执行,但在预测准确性方面存在局限性。最近提出的Boltz-2在结合亲和力预测方面实现了极高的准确性,但每个化合物在GPU上需要约20秒的处理时间,难以应用于数十万到数百万化合物的大规模筛选。本研究提出了Boltzina,这是一个新颖的框架,既利用了Boltz-2的高准确性,又显著提高了计算效率。Boltzina通过省略Boltz-2架构中的限速结构预测步骤,直接从AutoDock Vina对接构象预测亲和力,从而实现了准确性和速度的双重优势。我们在MF-PCBA数据集的八个测定上进行了评估,结果表明虽然Boltzina的性能低于Boltz-2,但与AutoDock Vina和GNINA相比,它提供了显著更高的筛选性能。此外,通过减少循环迭代和批处理,Boltzina实现了高达11.8倍的加速。进一步地,我们研究了多构象选择策略以及结合Boltzina和Boltz-2的两阶段筛选方法,提出了根据应用需求优化准确性和效率的方法。这项研究代表了将Boltz-2的高精度预测应用于实际规模筛选的首次尝试,为计算生物学提供了一个兼顾准确性和效率的流程。Boltzina可在github上获取:https://github.com/ohuelab/boltzina。

生物分子计算工程、金融与科学机器学习定量方法
arXiv

药物推理器:具有推理增强语言模型的可解释药物批准预测

药物发现是一个复杂且资源密集型的过程,对优化研究投资至关重要的早期预测批准结果。 虽然经典的机器学习和深度学习方法在药物批准预测中显示出希望,但它们有限的可解释性限制了它们的影响。 在这里,我们介绍了DrugReasoner,一种基于LLaMA架构的基于推理的大型语言模型(LLM),并通过组相对策略优化(GRPO)进行了微调,以预测小分子批准的可能性。 DrugReasoner将分子描述符与结构相似的批准和未经批准的化合物的比较推理相结合,产生预测以及逐步的理由和信心评分。 DrugReasoner在验证集上分别获得0.732的AUC和0.725和0.718的F1得分,在测试集上分别取得了0.725和0.718的强劲表现。 这些结果优于常规基线,包括逻辑回归,支持向量机和k近邻,并且相对于XGBoost具有竞争性能。 在外部独立数据集上,DrugReasoner的表现优于基线和最近开发的ChemAP模型,实现了0.728的AUC和0.774的F1分数,同时保持高精度和平衡的灵敏度,证明了现实世界场景中的稳健性。 这些发现表明,DrugReasoner不仅提供了有竞争力的预测准确性,而且还通过其推理输出增强了透明度,从而解决了人工智能辅助药物发现的一个关键瓶颈。 这项研究强调了推理增强LLM作为药物决策可解释和有效的工具的潜力。

机器学习人工智能定量方法
arXiv

与神经疾病相关的可解释成像-遗传学协会

虽然成像遗传学对于解开大脑结构和神经系统疾病遗传变异之间的复杂相互作用有很大的希望,但传统方法仅限于简单的线性模型或缺乏可解释性的黑箱技术。 在本文中,我们介绍了NeuroPathX,这是一个可解释的深度学习框架,它使用由交叉注意力机制驱动的早期融合策略,以捕获来自MRI的大脑结构变化与从遗传学数据中提取的既定生物学途径之间的有意义的相互作用。 为了增强可解释性和鲁棒性,我们在注意力矩阵上引入了两个损失函数 - 一种专注于最显着相互作用的稀疏损失和路径相似性损失,在整个队列中强制执行一致的表示。 我们在自闭症谱系障碍和阿尔茨海默病上验证了NeuroPathX。 我们的结果表明,NeuroPathX优于竞争基线方法,并揭示了与疾病相关的生物学上合理的关联。 这些发现强调了NeuroPathX推进我们对复杂大脑疾病的理解的潜力。 代码可在https://github.com/jueqiw/NeuroPathX 查阅。

机器学习人工智能定量方法
arXiv

用于低N蛋白功能预测和设计的稀疏自动编码器

从氨基酸序列中预测蛋白质功能仍然是数据稀缺(low-N)机制的核心挑战,当只有少量的测定标记的序列函数数据可用时,限制机器学习引导的蛋白质设计。 蛋白质语言模型(pLMs)通过提供进化知情的嵌入和稀疏自动编码器(SAE)使这些嵌入分解为可解释的潜在变量,捕获结构和功能特征。 然而,SAEs对低N功能预测和蛋白质设计的有效性尚未得到系统的研究。 在这里,我们评估在微调ESM2嵌入方面训练的SAE,涉及不同的健身外推和蛋白质工程任务。 我们表明,SAEs,只有24个序列,在健身预测中始终优于或与其ESM2基线竞争,这表明其稀疏的潜伏空间编码紧凑且具有生物学意义的表征,从有限的数据中更有效地概括。 此外,转向预测性潜伏物利用pLM表示中的生物图案,在83中产生顶级适应性变体

机器学习定量方法
arXiv

DeepAtlas:有效多边学习的工具

流形学习建立在“多形假说”的基础上,该假说假设认为高维数据集中的数据来自低维流形。 当前的工具生成数据的全局嵌入,而不是用于数学定义流形的本地地图。 这些工具也无法评估多面假设是否适用于数据集。 在这里,我们描述了DeepAtlas,一种算法,可以生成数据本地社区的低维表示,然后训练深度神经网络,这些神经网络映射到这些局部嵌入和原始数据之间。 拓扑失真用于确定数据集是否来自流形,如果是的话,则来自其维度。 测试数据集的应用程序表明DeepAtlas可以成功学习多形结构。 有趣的是,许多真实的数据集,包括单细胞RNA测序,不符合多形假说。 在数据来自流形的情况下,DeepAtlas 构建了一个可以生成式使用的模型,并承诺允许将强大的工具从微分几何应用于各种数据集。

机器学习定量方法
arXiv

下一层:增强基础模型,为计算病理学中的本地补丁提供结构保护和注意力引导学习,以全球上下文意识

基础模型最近已成为计算病理学中强大的特征提取器,但它们通常省略了利用组织的全球空间结构和诊断相关区域之间的局部上下文关系的机制 - 理解肿瘤微环境的关键因素。 多个实例学习(MIL)仍然是遵循基础模型的重要下一步,设计了一个框架,将补丁级特征汇总到幻灯片级预测中。 我们介绍了 EAGLE-Net,一种结构保护、受关注的 MIL 架构,旨在增强预测性和可解释性。 EAGLE-Net集成了多尺度的绝对空间编码,以捕获全局组织架构,一个顶级K邻域感知损失,将注意力集中在局部微环境上,背景抑制损失,以尽量减少误报。 我们在大型泛癌数据集上对EAGLE-Net进行了基准测试,包括三种用于分类的癌症类型(10,260张幻灯片)和7种用于生存预测的癌症类型(4,172张幻灯片),使用三种不同的组织学基础骨干(REMEDIES,Uni-V1,Uni2-h)。 在整个任务中,EAGLE-Net实现了高达3个

定量方法人工智能机器学习 (统计)
arXiv

关于人类医学基因组学中生成式AI应用的系统综述

尽管传统的统计技术和机器学习方法对遗传学,特别是遗传性疾病诊断做出了重大贡献,但它们经常与复杂的高维数据作斗争,这是最先进的深度学习模型现在解决的挑战。 基于变压器架构的大型语言模型(LLM)在需要上下文理解的非结构化医疗数据的任务中表现出色。 本系统综述研究了LLM在罕见和常见疾病的遗传研究和诊断中的作用。 在PubMed,bioRxiv,medRxiv和arXiv中进行了基于关键字的自动搜索,针对遗传学中诊断和教育中的LLM应用研究,并删除不相关或过时的模型。 共分析了172项研究,突出了基因组变异识别,注释和解释中的应用,以及通过视觉变压器的医学成像进展。 主要研究结果表明,虽然基于变压器的模型显着推进了疾病和风险分层,变体解释,医学成像分析和报告生成,但将多模态数据(基因组序列,成像和临床记录)集成到统一和临床稳健的管道中仍然存在重大挑战,在临床环境中面临可推广性和实际实施的限制。 本综述全面分类和评估LLM在改变遗传性疾病诊断和支持遗传教育方面的当前能力和局限性,作为驾驭这个快速发展领域的指南。

机器学习计算与语言定量方法
arXiv

阿诺德:一个广义的肌肉变压器政策

控制人体的高维和非线性肌肉骨骼模型是一个基础的科学挑战。 最近的机器学习突破预示着一些政策,即掌握个人技能,如接触,物体操纵和肌肉骨骼系统中的运动,具有许多自由度。 然而,这些代理只是“专家”,为单一技能实现了高性能。 在这项工作中,我们制定了阿诺德,一个掌握多项任务和实施例的通称政策。 Arnold将行为克隆和微调与PPO相结合,在从灵巧的对象操作到运动等14项具有挑战性的控制任务中实现专家或超级专家的性能。 一个关键的创新是Arnold的感官运动词汇,是异构感官模式、目标和执行器语义的构成表示。 Arnold通过变压器架构利用这个词汇来处理每个任务的可变观察和动作空间。 该框架支持高效的多任务,多系体学习,并促进快速适应新任务。 最后,我们分析了Arnold,以提供有关生物运动控制的见解,证实了最近关于跨任务肌肉协同作用的有限可转移性的研究结果。

机器人学人工智能机器学习定量方法
arXiv

在不确定性下约束满意度的预测模块化方法 - 在连续单克隆抗体生物类似药生产中应用于糖基化

本文提出了一种基于模块化的方法,用于过程优化和控制的约束处理。 这在一定程度上是由于最近对基于学习的方法的兴趣,例如,在生物生产中,在不确定性下进行约束处理是一个挑战。 拟议的约束处理程序称为预测过滤器,与自适应约束保证金和约束违规成本监视器相结合,以尽量减少由于模型不确定性和干扰而违反软约束的成本。 该模块可以与任何控制器结合使用,并且基于最小修改控制器输出,在最小平方意义上,因此约束在考虑的视界内得到满足。 提出的方法具有计算效率,适用于实时应用。 该方法的有效性通过使用中国仓鼠卵巢细胞连续单克隆抗体生物类似药生产中糖基化约束满意度的现实模拟案例研究来说明,为此,代谢网络模型由23个细胞外代谢物和126个反应组成。

系统与控制最优化与控制定量方法
arXiv

基准测试 肝数据集可解释脑出血分类的类激活图方法

可解释人工智能(XAI)已成为医学成像研究的重要组成部分,旨在提高深度学习模型的透明度和临床信任度。 这项研究调查了脑出血诊断,重点是通过类激活映射(CAM)技术进行可解释性。 开发了一个管道,使用9种最先进的CAM算法从分类模型中提取像素级分割和检测注释,这些算法应用于多个网络阶段,并在Hemorica数据集上进行了定量评估,该数据集独特地提供了切片级标签和高质量分割掩码。 包括Dice,IoU和像素的重叠在内的指标用于基准CAM变体。 结果表明,最强本地化性能发生在EfficientNetV2S的第5阶段,HiResCAM产生最高边界框对齐,AblationCAM实现了最佳像素级Dice(0.57)和IoU(0.40),代表了强大的精度,因为模型仅经过训练,无需分割监督。 根据目前所知,这是定量比较脑出血检测CAM方法的f irst作品之一,建立了一个可重复的基准,并强调了XAI驱动的管道在临床上有意义的AI辅助诊断的潜力。

计算机视觉与模式识别定量方法
arXiv

避免跨越作为一种视觉搜索策略

虽然视觉搜索看起来基本上是随机的,但存在几个oculomotor偏差,因此saccade方向和长度的可能性取决于以前的扫描路径。 与最近的固定相比,更长的路径历史的影响更难量化。 使用运动生态学中常用的步选框架,并分析45秒观看“沃尔多在哪里”的数据,我们报告了一种新的记忆依赖效应,这种效应在个体之间也有很大差异,我们将其称为自我交叉回避。 这是saccades避免在扫描路径中较早穿过的趋势,并且当两者都有小幅度时最为明显。 我们通过将真实数据与从空间统计的无记忆近似生成的合成数据进行比较来展示这一点(即马尔科维亚非参数模型,随着时间的推移,球形长度的匹配分布)。 最大可能性拟合表明,当包括扫描路径的最后≈7秒时,这种效果最强。 效果大小与众所周知的历史依赖形式如抑制回归相当。 包括自我交叉惩罚术语在内的参数化概率模型能够重现骰子长度和自我交叉的联合统计数据。 我们还量化了个体战略差异,以及他们对每个参与者查看的六幅图像的一致性,使用混合效应回归。 避免交叉倾向较高的参与者平均显示较小的骶散长度和更短的固定持续时间,但没有显示更多的水平,垂直,向前或反向saccades。 总之,这些结果表明,避免交叉是一种局部导向的策略,有助于和补充抑制返回,从而探索视觉场景。

神经元与认知计算机视觉与模式识别定量方法
arXiv