相关分类
最新研究
量子增强集成GAN在连续生物制造中的异常检测
连续生物制造工艺的开发需要稳健且早期的异常检测,因为即使是微小的偏差也可能影响产量和稳定性,导致调度中断、周产量降低和经济性能下降。这些工艺本质上具有复杂性,并展现出过程变量之间复杂关系的非线性动力学特性,因此先进的异常检测方法对于高效运行至关重要。在这项工作中,我们提出了一种基于生成对抗网络(GANs)集成的新型框架,用于连续生物制造中的无监督异常检测。我们首先建立了一个基准数据集,模拟小分子生产连续过程中的正常和异常操作状态。然后我们证明了基于GAN的框架在检测由突然原料变异性引起的异常方面的有效性。最后,我们评估了使用混合量子/经典GAN方法(包括模拟量子电路和真实光子量子处理器)对异常检测性能的影响。我们发现混合方法能够提高异常检测率。我们的工作展示了混合量子/经典方法在解决复杂连续生物制造过程中实际问题的潜力。
使用大型语言模型可扩展的科学兴趣分析
研究概况有助于表面科学家的专业知识,但往往已经过时。 我们开发和评估两种基于语言模型的方法可以生成科学兴趣简介:一种是总结PubMed摘要,一种是使用医学主题标题(MeSH)术语,并将其与研究人员的自写配置文件进行比较。 我们在哥伦比亚大学欧文医学中心为595名教师收集了标题,MeSH术语和摘要;自编自演的个人资料为167。 使用GPT-4o-mini,我们生成配置文件,并通过自动指标和蒙蔽人工审查来评估它们。 与自写配置文件的词法重叠率很低(ROUGE-L,BLEU,METEOR),而BERTScore表示中等语义相似性(基于MeSH的F1:0.542;基于抽象的0.555)。 释义引用产生了0.851,突出了度量灵敏度。 TF-IDF Kullback-Leibler 发散(基于 MeSH 的8.56;基于抽象的8.58)提出了不同的关键字选择。 在人工审查中,77.78%的基于MeSH的配置文件被评为良好或优秀,93.44%的案例中的可读性受到青睐,在67.86%的比较中,小组成员更喜欢基于MeSH的基于抽象的配置文件。 总体而言,大型语言模型可以大规模生成研究人员配置文件;MeSH衍生的配置文件往往比抽象派生的配置文件更具可读性。 机器生成和自写配置文件在概念上有所不同,人类摘要引入了更多新颖的想法。
使用新开发的 4DN FISH Oics 格式共享染色质跟踪数据集
NIH共同基金4D核聚(4DN)项目的一个关键产出是公开发布关于人类细胞核和基因组结构的数据集。 近年来,多路复用荧光原位杂交(FISH)和FISH组学方法迅速扩大,使单细胞中的染色质组织定量,有时与RNA和蛋白质测量一起。 这些方法加深了我们对3D染色体结构如何与健康和疾病中的转录活性和细胞发育相关的理解。 然而,由于没有标准化的数据交换规范,染色质追踪FISH组学实验的结果仍然难以分享,重复使用和分析。 基于最近发布的显微镜元数据标准,我们引入了4DN FISH Omics Format-Chromatin Tracing(FOF-CT),这是一个社区开发的标准,用于各种成像技术的处理结果。 目前的研究通常使用两种表示之一:球和棍子,其中基因组片段表现为单个荧光点或体积,表示它们为单分子定位的云。 本手稿侧重于球棒方法,包括来自Wang等人开创性研究的方法。 (2016)和相关技术。 我们描述了FOF-CT结构,并在4DN数据门户和OME图像数据资源(IDR)中呈现新沉积的数据集,突出了它们重用、集成和建模的潜力。 我们还概述了示例分析管道,并说明了通过标准化的、符合 FAIR 标准的染色质跟踪数据集来实现的生物见解。
生命系统中时间与自我参照的开放性问题
生命系统展现出一系列基本特征:它们是主动的、自我参照的、自我修改的系统。本文探讨这些特征如何为传统科学方法带来挑战,以及为何需要新的理论和形式框架。我们引入了"自然时间"(物理过程的持续当下)与"表征时间"(伴随生命本身出现的过去、现在和未来框架)之间的区分。表征时间使得记忆、学习和预测成为可能,这些是生命系统生存所必需的功能。通过进化、胚胎发生和变态等例子,我们展示了当自然时间将自我参照循环展开为发展螺旋时,生命系统如何应对由此产生的明显矛盾。传统的数学和计算形式主义在建模自我参照和自我修改系统时难以避免悖论。我们指出了建模自我参照系统的有前景的新方向,包括域理论、余代数、遗传编程和自我修改算法。这对生物学、认知科学和社会科学具有广泛意义,因为自我参照和自我修改不是需要避免的问题,而是生命系统的核心特征,必须对其进行建模才能理解生命无限开放的创造力。
渐进性神经退行性疾病中时间相对多组学数据的频率域分析:一种具有四能扩展的量子-经典混合方法
渐进性神经退行性疾病,包括阿尔茨海默病(AD),多发性硬化症(MS),帕金森病(PD)和肌萎缩侧索硬化症(ALS),表现出复杂的非线性轨迹,挑战确定性建模。 对多体和神经成像数据进行传统的时间域分析通常无法捕获隐藏的振荡模式,从而限制了预测的准确性。 我们提出了一个理论数学框架,使用傅里叶和拉普拉斯变换将时间序列数据转换为频率或s域,通过哈密尔顿公式对神经元动力学进行建模,并使用量子经典混合计算与变异量子特征解器(VQE)进行增强模式检测。 这种理论结构是未来在神经退行性疾病量子增强分析中的经验工作的基础。 我们将其扩展到具有三个假想轴(i,j,k)的四体表示,以模拟多态哈密尔顿人在多方面疾病中,从量子神经形态计算中绘制,以捕获纠缠的神经动力学<cit.>。 这种方法利用量子优势处理高维振幅相位数据,实现异常检测和频率签名分析。 潜在的临床应用包括使用s域生物标志物识别具有快速进展或治疗阻力的高风险患者,由量子机器学习(QML)的先例支持,达到高达99.89
FedCVD++:通过参数和非参数模型优化进行心血管风险预测的通信效率联邦学习
心血管疾病(CVD)每年导致全球超过1700万人死亡,突显了对隐私保护预测系统的迫切需要。 我们引入了FedCVD++,这是一种增强的联邦学习(FL)框架,它集成了参数模型(逻辑回归,SVM,神经网络)和非参数模型(Random Forest,XGBoost)用于冠心病风险预测。 为了应对关键的FL挑战,我们提出:(1)在Framingham数据集上评估的随机森林通信开销减少70个的树子集采样(4,238记录),Fedive CVD++实现了最先进的结果:联合XGBoost(F1 = 0.80)超过其集中对应物(F1 = 0.78),联合随机森林(F1 = 0.81)与非联邦性能相匹配。 此外,我们的通信高效策略可降低3.2倍的带宽消耗,同时保留 95 与现有的FL框架相比,FedCVD++提供高达15个
NIRS:急性护理中非侵入性呼吸支持的基础学
目标:开发非侵入性呼吸支持(NIRS)本体,以支持急性护理环境中的知识表现。 材料和方法:我们使用Web本体语言(OWL)语义和Protege开发了NIRS本体,以组织临床概念和关系。 为了在分层结构之外实现基于规则的临床推理,我们添加了语义Web规则语言(SWRL)规则。 我们通过添加17个假设性患者临床情景来评估逻辑推理。 我们使用电子重症监护室(eICU)协作研究数据库的SPARQL查询和数据来检索和测试有针对性的推断。 结果:本体在882个公理中具有132个类,12个对象属性和17个数据属性,这些轴心建立了概念关系。 为了标准化临床概念,我们添加了350个注释,包括基于受控词汇的描述性定义。 SPARQL查询通过检索适当的患者结果成功验证了所有测试病例(规则),例如,由于急性呼吸衰竭而接受HFNC(高流量鼻管)治疗2小时的患者可以避免内气管插管。 讨论:NIRS本体正式代表特定领域的概念,包括通风方式,患者特征,治疗参数和结果。 SPARQL对临床情景的查询评估证实了本体支持基于规则的推理和治疗建议的能力,为一致的文档实践,集成到临床数据模型以及对NIRS结果的高级分析奠定了基础。 结论:我们将NIRS概念统一成一个本体论框架,并通过评估假设的患者情景和与标准化词汇的对齐来证明其适用性。
解释性AI框架量化中医药原则,以增强与现代生物医学的整合
传统的中医诊断和治疗原则,通过几个世纪的试错临床实践建立,直接将患者特异性症状模式映射到个性化的草药疗法。 这些经验的整体映射原则提供了有价值的策略,以应对现代生物医学中还原主义方法的剩余挑战。 然而,缺乏定量框架和分子级证据限制了它们的可解释性和可靠性。 在这里,我们展示了一个基于古代和经典中医公式记录训练的AI框架,以量化症状模式 - 草药治疗映射。 有趣的是,我们发现经验性中医的诊断和治疗与AI模型中的编码解码过程是一致的。 这使我们能够使用模型对中医原理的定量表示来构建可解释的中医嵌入空间(TCM-ES)。 通过广泛而广泛的中医患者数据进行验证,中医-ES提供了中医实践和治疗功效的通用量化。 我们通过对应对齐进一步将生物医学实体映射到中医-ES中。 我们发现中医-ES的主要方向与关键的生物学功能(如代谢,免疫和稳态)显着相关,并且该疾病和草药嵌入接近性与其在人类蛋白质相互作用组中的遗传关系一致,这证明了中医原理的生物意义。 此外,中医-ES揭示了潜在的疾病关系,并提供了评估现代疾病药物对临床疗效的替代指标。 最后,我们构建了一个全面而综合的中医知识图谱,该图谱预测疾病与靶点、药物、草药化合物和草药疗法之间的潜在关联,为疾病分析和药物开发提供了中医知情的机会。
通过MedScrab增强知识保留:交互式手机游戏
不遵守药物治疗方案对慢性病的管理构成了巨大的挑战,往往导致健康并发症和复发入院。 解决这一差距,我们的团队设计了一个创新的手机游戏,旨在提高普通人群中的药物依从性和信息保留。 使用Amazon Mechanical Turk,参与者被招募并分配到两个队列中:一个参与我们的手机游戏,另一个使用有关药物的信息小册子。 这两个队列都接受了干预前测验,然后是各自的干预,并以干预后测验结束。 主要的结果措施包括测验分数和游戏持续时间的差异。 调查包括243名具有同质基线属性的参与者。 与手机游戏互动的参与者与干预前得分相比,他们在干预后得分显着提高。 我们观察到明显的相关性为0.346(p<0.001),强效介质效应大小为0.641(0.503 - 0.779)。 虽然游戏的持续时间和干预后得分没有直接的相关性,但在投入更多时间参加比赛的参与者中,参与后得分的趋势很明显。 我们开发的交互式手机游戏展示了潜力,作为赋予患者和护理人员的引人入胜的工具。 以增加保留的方式提供关键药物信息和潜在的副作用,从而减轻药物的不依从性。 未来的研究工作应侧重于优化和扩大此类移动界面的应用,以加强公共卫生计划。
使用大型语言模型(LLM)的路线图,以计算生物学的例子加速跨学科研究
大型语言模型(LLM)是强大的人工智能(AI)工具,改变了研究的方式。 然而,由于对幻觉、偏见和对研究的潜在危害的担忧,他们在研究中的使用遭到了怀疑。 这些强调了清楚地了解LLM的优势和劣势以确保其有效和负责任的使用的重要性。 在这里,我们提出了将LLM整合到跨学科研究中的路线图,其中跨不同领域的有效沟通,知识转移和协作至关重要,但往往具有挑战性。 我们研究了LLM的功能和局限性,并提供了详细的计算生物学案例研究(关于HIV反弹动力学的建模),展示了与LLM(ChatGPT)的迭代相互作用如何促进跨学科合作和研究。 我们认为,LLM最好用作人类在环路框架内的增强工具。 展望未来,我们设想负责任地使用LLM将加强创新的跨学科研究,并大大加快科学发现。
分子领域的智能通信:生物纳米物联网中的神经网络
生物纳米物联网(IoBNT)的最新进展正在为医疗健康领域的创新应用奠定基础。这些设计用于在人体内运行、通过互联网远程管理的纳米设备,被寄望于能够及时检测并应对潜在疾病。在这一愿景中,由于单个纳米传感器的能力有限,一个固有挑战随之产生:具体而言,纳米传感器需要相互通信以实现集群协作。为了研究这种集群能力的边界,本综述重点关注分子通信(MC)信道中数据驱动的通信策略,将其作为连接纳米传感器的手段。凭借机器学习(ML)方法应对MC信道动态特性的灵活性和鲁棒性,MC研究界经常采用神经网络(NN)架构。这一跨学科研究领域涵盖多个方面,包括使用NN促进MC环境中的通信、其在纳米尺度的实现、NN的可解释方法以及用于训练的数据集生成。在本综述中,我们对MC领域NN架构的最新趋势、其在纳米尺度实现的可行性、应用的可解释人工智能(XAI)技术以及数据集的可获取性与生成最佳实践等方面进行了全面分析。此外,我们还提供了开源代码库,展示了基于NN的方法以支持关键MC场景的可重复研究。最后,我们指出了新兴的研究挑战,如鲁棒的NN架构、生物集成的NN模块和可扩展的训练策略。
泰勒权力法发现后六十年:从生态和统计普遍性,通过主要数字分布和临界点信号,到复杂网络的异质性和稳定性
首先发现L。 R. 泰勒(1961年,自然),泰勒的权力定律(TPL)使用功率函数(V=aM^b)将平均(M)人口丰度和一组昆虫种群的相应方差(V)相关联。 TPL在科学,社会科学和人文科学的众多领域展示了其“通用性”。 这种普遍性激发了两个主要的探索:一个来自数学家和统计学家,他们可能本能地以类似于高斯分布的中心极限定理的收敛定理做出反应,另一个来自生物学家,生态学家,物理学家等,他们对潜在的潜在生态或组织机制更感兴趣。 在过去的60年中,TPL研究产生了一个时髦的景观,有三个相对不同的时期(1960-80年代;90年代-2000年代和2010年代)跨越两个抽象和物理世界。 已经确定并审查了这一景观的八个主题,包括人口空间聚集和生态机制,TPL和倾斜的统计分布,TPL的数学/统计机制,样本与人口TPL,人口稳定性,同步性和临界点的预警信号,复杂网络上的TPL,巨生物群落中的TPL和微生物组。 三个未来的研究方向,包括促进两个方面之间的互惠相互作用,异质性测量,以及在进化背景下的探索。 TPL研究的意义包括实际,TPL捕获的人口波动与农业,林业,渔业,野生动物保护,流行病学,肿瘤异质性,地震,社会不平等,股票流动性不足,金融稳定,临界点事件等有关;理论上,TPL是权力法的一种形式,与相变,普遍性,规模不变性等有关。
关于健康研究中离散事件模拟研究的可重复性:使用开放模型的实证研究
计算研究的可重复性对于确保透明度、可靠性和可重用性至关重要。 计算可重复性的挑战已经在几个领域被记录下来,但在这种情况下,医疗保健离散事件模拟(DES)模型尚未得到彻底检查。 这项研究评估了8个已发表的医疗保健DES模型(Python或R)的计算可重复性,这些模型被选择用于代表不同的上下文,复杂性和多年的出版。 存储库和文章也根据指南和报告标准进行评估,提供对其与可重复性成功关系的见解。 每个模型需要长达28小时的故障排除结果,其中50个复制和50个关键障碍,包括没有开放许可证,报告参数和编码参数之间的差异,以及缺少代码来产生模型输出,运行场景和生成表格和数字。 解决这些问题往往需要作者付出相对较少的努力:增加开放许可证并分享用于制作文章的所有材料。 提出了可采取行动的建议,以加强模拟建模者和审查员的可重复性做法。
单细胞组学时代的细胞机质
单细胞组学技术通过对单个细胞进行高分辨率分析,改变了我们对细胞多样性的理解。 然而,这些数据集前所未有的规模和异质性需要强大的数据集成和注释框架。 细胞本体(CL)已成为实现FAIR(可查找,可访问,可互操作和可重复使用)数据原则的关键资源,为规范细胞类型提供标准化,与物种无关的术语 - 形成广泛平台和工具的核心组成部分。 在本文中,我们描述了CL在这些平台和工具中的各种用途,并详细介绍了正在进行的改进和扩展CL内容的工作,包括添加转录组定义类型,与包括人类细胞图谱和脑计划细胞图谱网络在内的主要地图集密切合作,以支持他们的需求。 我们涵盖了协调经典和转录组细胞类型定义,集成标记和使用大型语言模型(LLM)以提高CL工作流程的内容和效率的挑战和未来计划。
植物生物电预警系统:人与植物电磁通信的五年调查
我们以五年的系统研究为基础,对植物生物电对人类存在和情绪状态的反应进行了全面调查。 使用定制的植物传感器和机器学习分类,我们证明植物产生与人类接近,情绪状态和生理条件相关的不同生物电信号。 基于ResNet50架构的深度学习模型通过植物电压谱图实现了97个对人类情绪状态进行分类,而具有洗牌标签的控制模型仅实现了30个综合了跨越2020-2025年的多个实验的发现,包括个人识别(66预测,以及对人类语音和运动的反应)。 我们提出,这些现象代表了进化的抗草动物预警系统,植物在物理接触之前通过生物电场变化检测接近动物。 我们的研究结果挑战了对植物感官能力的传统理解,并建议在农业,医疗保健和人与植物相互作用研究中的实际应用。
EPFL-Smart-Kitchen-30:带有3D运动学的密集注释烹饪数据集,以挑战视频和语言模型
理解行为需要在执行复杂任务时捕获人类的数据集。 厨房是评估人类运动和认知功能的绝佳环境,因为从切碎到清洁的厨房里自然会出现许多复杂的动作。 在这里,我们介绍了EPFL-Smart-Kitchen-30数据集,该数据集是在厨房环境中的非侵入性运动捕捉平台中收集的。 九个静态RGB-D相机,惯性测量单元(IMU)和一台头戴式HoloLens 2耳机用于捕捉3D手,身体和眼球运动。 EPFL-Smart-Kitchen-30数据集是一个多视图动作数据集,具有同步的外中心,以自我为中心,深度,IMU,眼睛凝视,身体和手动学,跨越16个受试者的29.7小时烹饪四种不同的食谱。 动作序列被密集注释,每分钟33.78个动作片段。 利用这个多模态数据集,我们提出了四个基准,通过1)一个视觉语言基准,2)一个语义文本到运动生成基准,3)一个多模态动作识别基准,4)一个基于姿势的动作分割基准。 我们期待EPFL-Smart-Kitchen-30数据集为更好的方法以及理解生态有效人类行为本质的见解铺平道路。 代码和数据可在https://github.com/amathislab/EPFL-Smart-Kitchen查阅。
人工同理心:基于AI的心理健康
许多人患有心理健康问题,但并非每个人都寻求专业帮助或获得心理健康护理。 人工智能聊天机器人越来越成为那些患有精神障碍或只是想找人交谈的人的首选。 本文介绍了对以前使用聊天机器人的参与者的研究,以及对大型语言模型(LLM)聊天机器人进行基于场景的测试。 我们的研究结果表明,人工智能聊天机器人主要被用作“五分钟治疗师”或作为非判断伴侣。 与会者赞赏聊天机器人的匿名性和缺乏判断力。 然而,人们担心隐私和敏感信息的安全性。 基于场景的LLM聊天机器人测试突出了其他问题。 一些聊天机器人一直令人放心,使用表情符号和名字来增加个人接触,并很快建议寻求专业帮助。 然而,存在一些限制,如语气不一致,偶尔不适当的反应(例如,随意或浪漫),以及缺乏危机敏感性,特别是在承认红旗语言和适当升级的反应方面。 这些发现可以为技术和心理健康行业提供信息,了解如何更好地利用人工智能聊天机器人在具有挑战性的情感时期支持个人。
在生物导体社区中学习和教授生物数据科学
现代生物研究越来越具有数据密集型,导致对生物数据科学有效培训的需求不断增长。 在这篇文章中,我们概述了Bioconductor项目内的关键资源和最佳实践 - 一个专注于组学数据分析的开源软件社区。 本指南为该领域的学习者和教育者提供了宝贵的参考。
沉默不是共识:通过鲶鱼代理破坏多剂LLM中的协议偏见进行临床决策
大型语言模型(LLM)在临床问题回答方面显示出强大的潜力,最近的多代理框架通过协作推理进一步提高了诊断准确性。 然而,我们确定了一个反复出现的沉默协议问题,其中代理人在没有足够批判性分析的情况下过早地收敛诊断,特别是在复杂或模棱两可的情况下。 我们提出了一个名为Catfish Agent的新概念,这是一个角色专业化的LLM,旨在注入结构化的异议和对抗沉默的协议。 受组织心理学“鲶鱼效应”的启发,鲶鱼剂旨在挑战新出现的共识,以激发更深层次的推理。 我们制定两种机制来鼓励有效和具有上下文意识的干预:(i)一种基于案例难度调节代理参与的复杂意识干预,以及(ii)为平衡批评和协作而阐述的音调校准干预。 对9个医疗Q A和3个医疗VQA基准的评估表明,我们的方法始终优于单代理和多代理LLM框架,包括领先的商业模式,如GPT-4o和DeepSeek-R1。
开放和可持续的人工智能:生命科学的挑战、机遇和前进的道路
人工智能(AI)最近在生命科学领域取得了变革性突破,扩大了研究人员以前所未有的能力解释生物信息的可能性,几乎每天都有新的应用和进步。 为了最大限度地提高对基于人工智能的生命科学研究不断增长的投资的回报,并加速这一进展,解决人工智能方法迅速采用导致的长期研究挑战的加剧已成为当务之急。 我们回顾了由于可重用性和可重复性问题,人工智能研究成果的信任度增加,并强调了它们对环境可持续性的影响。 此外,我们还讨论了人工智能生态系统的碎片化组成部分,以及缺乏最佳支持开放和可持续人工智能(OSAI)模型开发的指导途径。 作为回应,这一视角引入了一套实用的OSAI建议,直接映射到AI生态系统的300多个组成部分。 我们的工作将研究人员与相关的人工智能资源联系起来,促进了可持续、可重复使用和透明的人工智能的实施。 基于生命科学社区的共识,并与现有努力保持一致,这一视角的产出旨在帮助未来制定政策和指导人工智能实施的结构化途径。