物理学
Physics
加速器物理
Accelerator Physics
应用物理学
Applied Physics
大气与海洋物理学
Atmospheric and Oceanic Physics
基于硅光子学的AI加速器(SPAA)被认为是有前途的AI加速器,可实现高能效和低延迟。 虽然许多研究人员专注于提高SPAA的能源效率和延迟,但他们的物理安全性直到最近才受到关注。 虽然提供强大的光学神经网络推理方法至关重要,但它们的成功和采用取决于它们提供安全执行环境的能力。 为此,本文提出了PrometheusFree,一种能够并发检测激光故障注入攻击的光学神经网络框架。 本文首先对SPA提出了激光故障注入攻击的示例性威胁,能够将光学神经网络引入错误分类。 然后通过开发同时检测激光故障喷射攻击的技术来解决本文中的威胁。 此外,本文介绍了波长划分扰动(WDP)技术的一种新颖应用,其中利用波长依赖的矢量矩阵乘法(VMM)结果来提高故障攻击检测精度。 模拟结果表明,PrometheusFree实现了超过96%的攻击引起的错误预测召回,因为使用WDP技术将攻击成功率平均降低了38.6%。 与以前的技术相比,PrometheusFree将平均攻击成功率限制在0.019,减少了95.3%。 实验结果证实了并发检测的优越性以及WDP方法所赋予的攻击检测能力的提升。
广域荧光显微镜的解决能力受到失焦背景的限制,因为它的轴向分辨率低,特别是对于密集标记的生物样本。 为了解决这个问题,我们开发了基于深度学习的EPI-TIRF跨模式网络ET2dNet,无需硬件修改即可从单个广域图像实现TIRF可比的背景减法和轴向超分辨率。 该模型采用物理信息混合架构,与注册的EPI-TIRF图像对协同监督学习,并通过具有点差功能的卷积进行自我监督的物理建模。 该框架确保了显微镜目标的卓越概括,使很少的适应新的成像设置。 对细胞和组织样品进行严格的验证证实了ET2dNet在背景抑制和轴向分辨率增强方面的优越性,同时保持与横向分辨率改进的去卷积技术的兼容性。 此外,通过知识蒸馏扩展这一范式,我们开发了ET3dNet,这是一个专门的三维重建网络,可以产生人工制品减少的体积结果。 ET3dNet即使输入图像堆栈缺乏背景源,也能有效地去除失焦背景信号。 该框架通过提供易于部署的算法,使轴向超分辨率成像更容易获得,该算法可避免额外的硬件成本和复杂性,显示出活细胞研究和临床组织病理学的巨大潜力。
最近快速部署数据中心基础设施,用于在云中执行大型语言模型(LLM)和相关人工智能(AI)应用,预计在不久的将来将产生指数增长的能源消耗。 在本文中,我们提出并分析了变压器模型的实现,该模型是现代LLM的基石,通过市售互补的金属氧化物半导体(CMOS)图像传感器(CIS)平台构建了新颖的大型光电神经元(OEN)。 所有所需的光电器件和电子电路集成在芯片中,尺寸仅为约2厘米乘3厘米,GPT-3的175亿度参数仅使用40nm CMOS工艺节点以前所未有的12.6 POPS速度进行推断,同时具有74 TOPS / W的高功率效率和19 TOPS /mm2的高功率效率,均超过相关数字电子器件约两个数量级。 量化格式和硬件诱导错误的影响是数值调查的,并且显示影响最小。 我们的研究为模拟神经处理单元(NPU)提供了一条新的实用路径,以补充现有的数字处理单元。
偏振解决的近红外成像通过测量眼部组织反射的光的偏振状态,除了其强度之外,还为眼动跟踪增加了一种有用的光学对比度机制。 在本文中,我们演示了如何使用这种对比度来实现眼动追踪。 具体来说,我们证明由偏振过滤-阵列相机组成的偏振眼动(PET)系统与线性偏振近红外照明器相结合,可以揭示角膜上的颅骨和凝视信息模式的可跟踪特征,在强度仅图像中基本上不存在。 在346名参与者中,基于PET数据的卷积神经网络机器学习模型在名义条件下和眼睑闭塞,眼睛缓解变化和瞳孔变化的情况下,相对于容量匹配的强度基线,第95百分位绝对凝视误差减少了10-16%。 这些结果将光组织偏振效应与人机交互的实际收益联系起来,并将PET定位为未来可穿戴设备的一种简单,强大的传感模式。
我们引入了基于电荷传送的量子密钥分布(QKD)原语:通过本地操作和经典通信(LOCC)在纠缠的多体地面状态上,Alice的单位选择引导Bob的本地电荷移位的标志,该信号直接编码密钥位。 相对于能量传送方案,电荷信号是位对称的,以单一基测量,并且明显更坚固到逼真的噪声和模型缺陷。 我们在横向领域 Ising 模型、星耦合和一维链上实例化协议,获得两个量子比特的闭合结果,并且对于较大的系统,通过精确的对角化、电路级模拟和原理证明硬件运行来确认性能。 我们量化对经典位翻转和局部量子噪声的弹性,确定符号完整性,因此关键正确性的机制。 这些结果位置电荷传送作为一种实用,低速QKD原始兼容的近期平台。
荧光分子断层扫描(FMT)是荧光探针的非侵入性3D可视化的一种有前途的技术,但由于固有的不良倾向和对不准确或通常未知的组织光学特性的依赖,其重建仍然具有挑战性。 虽然深度学习方法已经显示出希望,但其监督性质限制了训练数据以外的推广。 为了解决这些问题,我们提出了μNeuFMT,一个自我监督的FMT重建框架,它将隐性基于神经的场景表示与光子传播的显式物理建模集成在一起。 它的主要创新在于共同优化重建过程中的荧光分布和光学特性(μ),消除了对组织光学或预调训练数据进行精确事先知识的需求。 我们证明,μNeuFMT即使具有严重错误的初始值(0.5×至2×的地面真实性),也能可靠地恢复准确的荧光团分布和光学系数。 广泛的数值、幻影和体内验证表明,μNeuFMT在各种异构场景中优于常规和监督的深度学习方法。 我们的工作为稳健和准确的FMT重建建立了新的范例,为在复杂的临床相关场景中(如荧光引导手术)中更可靠的分子成像铺平了道路。
为数字内容提供有形形式的触觉显示器可以改变计算交互。 然而,实现感知保真所需的分辨率、速度和动态范围仍然具有挑战性。 我们展示了一个触觉显示器,通过充满毫米级光点像素的光机械表面直接将投射的光转换为可见的触觉图案。 像素通过光模拟热气体膨胀将入射光转化为机械位移,产生响应时间2至100毫秒的毫米刻度位移。 使用投影光进行电力传输和寻址使这些显示器具有很高的可扩展性。 我们演示了光学驱动的显示器,具有高达1,511个可定位像素 - 比任何先前达到可比性能的触觉显示器多几倍的像素。 感知研究证实,这些显示器可以再现具有高保真度的不同时空触觉模式。 这项研究为由光驱动的实用,多功能的高分辨率触觉显示器奠定了基础。
实现高保真,紧凑的RGD成像带来了双重挑战:传统的紧凑型光学在整个景深与RGB锐度作斗争,而仅软件的单眼深度估计(MDE)是一个依赖于不可靠的语义先验的不良问题。 虽然具有DOE等元素的深光学可以编码深度,但它们在制造复杂性和色差方面引入了权衡,从而损害了简单性。 为了解决这个问题,我们首先介绍了一种新的生物启发的全球形单中心透镜,围绕它,我们构建了仿生单心成像(BMI)框架,这是一个整体的共同设计。 这种光学设计自然地将深度编码到其深度变化点扩散函数(PSF)中,而不需要复杂的衍射或自由形式元素。 我们建立了一个严格的基于物理的前进模型,通过精确模拟光学降解过程来生成合成数据集。 该模拟管道与双头、多尺度重建网络共同设计,该网络使用共享编码器共同回收高保真万能(AiF)图像和从单个编码捕获的精确深度图。 广泛的实验验证了拟议框架的最先进的性能。 在深度估计中,该方法的Abs Rel为0.026,RMSE为0.130,明显优于领先的软件方法和其他深度光学系统。 对于图像恢复,系统实现了0.960的SSIM和0.082的感知LPIPS得分,从而证实了图像保真度和深度精度之间的优越平衡。 这项研究表明,生物启发,完全球形光学与联合重建算法的集成构成了解决高性能紧凑型RGD成像的内在挑战的有效策略。 源代码将在https://github.com/ZongxiYu-ZJU/BMI上公开。
Ptychography已成为使用相干光源进行高分辨率、无损成像不可或缺的工具。 ptychographic数据的处理关键依赖于稳健,高效和灵活的计算重建软件。 我们介绍了Pty-Chi,这是一个建立在PyTorch上的开源ptychographic重建包,它通过自动区分方法统一了最先进的分析算法。 Pty-Chi提供一套全面的重建算法,同时支持先进的实验参数校正,如正交探头松弛和多片建模。 利用 PyTorch 作为计算后端,可确保与供应商无关的 GPU 加速、多设备并行化以及无缝访问现代优化器。 面向对象的模块化设计使Pty-Chi具有高度的可扩展性,使研究人员能够对新成像模型进行原型设计,集成机器学习方法,或在其核心组件之上构建全新的工作流程。 我们通过具有挑战性的案例研究证明了Pty-Chi的能力,这些案例研究涉及有限的连贯性,低重叠和扫描过程中的不稳定照明,这突出了其准确性,多功能性和可扩展性。 通过社区驱动的发展和开放的贡献,Pty-Chi提供了一个现代化的,可维护的平台,用于推进计算分形图,并在同步加速器设施内外实现创新的成像算法。
随着技术的进步,光子集成电路(PIC)在规模和复杂性上正在迅速扩展,现代设计集成了数千个组件。 然而,光子学的模拟自定义布局性质,曲线波导结构和单层路由资源施加了严格的物理约束,例如最小弯曲半径和波导交叉处罚,这使得手动布局成为事实上的标准。 这个手动过程需要数周才能完成,并且容易出错,这对于大型PIC系统来说基本上是无法扩展的。 现有的自动化解决方案已经采用了在具有数十个组件的小型基准上采用力导向放置,具有有限的可操作性和可扩展性。 为了填补电子光子设计自动化(EPDA)工具链中的这一根本空白,我们提出了第一个GPU加速的路由知情放置框架。 它具有非对称弯曲感知线长功能,具有波导路由拥塞和可路由最大化的交叉点的显式建模。 同时,使用条件投影来逐步执行各种用户定义的布局约束,包括对齐,间距等。 这种受限的优化通过自定义块式自适应 Nesterov 加速优化器加速和稳定,确保稳定和高质量的收敛。 与现有方法相比,我们的方法可以为大规模PIC生成高质量的布局,在几分钟内所有基准的平均路由成功率为94.79%。 通过将放置与物理感知路由紧密耦合,我们的方法为自动化PIC设计建立了新的范式,将智能、可扩展的布局合成带到下一代EPDA的最前沿。 我们的代码是开源的https://github.com/ScopeX-ASU/Apollo。
多模光纤成像需要在测量值和测量矩阵之间进行严格的匹配,以实现图像重建。 但在实际应用中,由于系统配置未知或任意光纤弯曲后实时对齐困难,往往无法获得测量矩阵,导致传统重建算法出现故障。 本文介绍了一种新的不匹配重建理论,用于在测量矩阵未知时解决图像重建问题。 我们首先提出不匹配方程和设计匹配和校准解决方案算法来构建一个新的测量矩阵。 此外,我们还在附录中提供了这些方程和算法的详细证明。 实验结果表明,在低噪声水平下,构造矩阵可用于传统重建算法中的匹配对,并成功重建原始图像。 然后,我们分析噪声、计算精度和正交性对重建性能的影响。 结果表明,提出的算法具有一定程度的稳健性。 最后,我们讨论这个理论的局限性和潜在的应用。 代码可用:https://github.com/yanglebupt/mismatch-solution。
反向传播学习算法是现代人工智能的主力军,在物理神经网络中很难实现。 均衡传播(EP)是一种具有可比效率和强大的现场培训潜力的替代品。 我们将 EP 学习扩展到离散和连续的复杂值波系统。 与以前的EP实现相反,我们的方案在弱耗散方案中有效,并且很容易适用于广泛的物理设置,即使没有定义明确的节点,其中可训练的节点间连接也可以被可训练的本地潜力取代。 我们测试由广义Gross-Pitaevskii动力学控制的驱动耗散激子-极子凝聚态的方法。 关于标准基准的数值研究,包括简单的逻辑任务和手写的数字识别,证明了稳定的收敛,在物理系统中建立了一条实际的路线,其中系统控制仅限于局部参数。
土壤养分和含水量是显著影响农业生产产量的两个关键因素。 因此,监测和测量含水量和土壤类型是关键要求。 这项研究提出了以对称十字形槽为中心的光子晶体的二维结构。 交叉插槽充当谐振器,插槽周围的光子晶体调整谐振器的共振频率,以增强谐振器内的模式限制。 各种谐振模式位于2.1 GHz,5.2 GHz和8.1 GHz频段,分别对应于S频段,C频段和X频段。 这些波段用于比较吸收,而上谐振模式的顺序为20 GHz。 使用平面波方法(PWM)进行带状结构分析。 谐振频率使用3D电磁(EM)模拟软件计算,该软件使用有限元素方法(FEM),位于光子晶体波段结构的辐射模式区域。 改变入射角对传感器的吸收特性有微不足道的影响,无论 incident angle如何,都能产生准确的传感结果。 使用这种设计可以最大限度地提高传感器的灵敏度,在2.1 GHz谐振频率下产生85.4%的灵敏度,这比单列基于光子晶体的SIW高得多,导致2.1 GHz的灵敏度为50.6%,其中GHz的顺序发生频率偏移。 相比之下,在拟议的设计中,频率移位是按MHz的顺序排列的,从而产生超高灵敏度。
我们通过多AI-agent系统演示了第一个跨域跨层4级自主光网络。 现场试验显示,分布式AI训练生命周期中的任务完成率为98%,比使用最先进的LLM的单个代理高3.2倍。
在本文中,我们研究了Sobolev梯度技术在最小化量子力学和非线性光学中与及时和困难的非线性问题相关的几个薛定谔功能的问题中的应用。 我们表明,这些梯度在最小化方法中作为传统选择下降方向的先决条件,并展示了一种计算上廉价的方法,使用离散傅里叶基础和快速傅里叶变换来获得它们。 我们表明,Sobolev预处理比传统技术提供了很大的融合改进,用于以最小的能量和固定状态寻找解决方案,并建议使用任意线性运算符对方法进行概括。
我们提出了一种新的计算近眼显示方法,通过住宿不变性解决立体显示器中的边缘-适应冲突问题。 我们的系统集成了折射透镜目镜与新型波前编码衍射光学元件,与预处理卷积神经网络协同工作。 我们采用端到端学习来共同优化波前编码光学和图像预处理模块。 为了实现这种方法,我们开发了一种可区分的视网膜图像形成模型,该模型可以限制眼睛光学引入的光圈和色差。 我们进一步将神经转移功能和对比度灵敏度功能集成到损失模型中,以考虑相关的感知效应。 为了解决离轴失真,我们将位置依赖性纳入预处理模块。 除了基于模拟进行严格的分析外,我们还制造设计的衍射光学元件并构建台式设置,演示了多达四个二极子的深度范围的住宿不变性。
新兴的通用计算畸变校正(CAC)范式为轻量级和高质量成像提供了一个鼓舞人心的解决方案,在镜头库(LensLib)上训练的通用模型,可以盲目地解决任意镜头畸变。 然而,现有LensLibs的覆盖范围有限,导致训练有素的模型对看不见的镜头的推广不良,其微调管道也仅限于镜头描述已知的案例。 在这项工作中,我们介绍了OmniLens,这是一种通用CAC的灵活解决方案,通过(i)建立一个令人信服的LensLib,全面覆盖预训练强大的基础模型,以及(ii)通过快速LensLib到特定域适应,使模型适应任何特定的镜头设计,具有未知的镜头描述。 为了实现这些目的,提出了基于Evolution的自动光学设计(EAOD)管道,以生成具有逼真的畸变行为的丰富各种镜头样本。 然后,我们根据对透镜畸变诱导的降解中的暗通道先验的统计观察,设计一个无监督的正则化术语,用于在一些易于访问的真实捕获的图像上进行高效的域调整。 广泛的实验证明,EAOD生成的LensLib有效地开发了一种具有强大概括能力的通用CAC模型,该模型还可以在PSNR中将非盲透镜特异性方法提高0.35-1.81dB。 此外,拟议的域适应方法显着改善了基础模型,特别是在严重畸变的情况下(PSNR中最多为2.59dB)。 代码和数据将在https://github.com/zju-jiangqi/OmniLens上提供。
现代镜头设计的高度非凸优化景观需要广泛的人类专业知识,导致效率低下和有限的设计多样性。 虽然自动化方法是可取的,但现有方法仍然仅限于简单的任务或生产具有不理想图像质量的复杂镜头。 从哺乳动物神经发育中的突触修剪机制中汲取灵感,这项研究提出了OptiNeuro - 一种新颖的自动镜头设计框架,首先产生不同的初始结构,然后逐步消除低性能镜头,同时通过梯度优化来改进剩余的候选。 通过完全自动化复杂的非球形成像镜头的设计,OptiNeuro展示了准人级性能,以最少的人工干预确定了多个可行的候选者。 这种进步不仅提高了镜头设计的自动化水平和效率,还促进了以前未知的镜头架构的探索。
我们使用超薄纳米光子金属相机应对坚固,狂野成像的挑战。 Meta-lenses由纳米级散射器的平面阵列组成,与传统屈光光学相比,其尺寸和重量都会显着减少。 然而,严重的色差、明显的光散射、窄光谱带宽和低光效率继续限制其实际采用。 在这项工作中,我们提出了一种用于野生成像的端到端解决方案,该解决方案将金属体比传统光学器件薄几倍,具有针对实用金属相机优化的定制多图像恢复框架。 我们的方法集中在一个轻量级卷积网络上,与一种记忆高效的突发融合算法相结合,该算法自适应地纠正噪声,饱和剪切和快速序列中的镜头引起的扭曲。 对各种真实世界手持捕获的广泛实验表明,我们的方法始终优于现有的突发模式和单图像恢复技术。 这些结果指向了在日常成像应用中部署基于金属的相机的实用路线。
超快光和射频(RF)信号的检测对于从高速通信到高级传感等应用至关重要。 然而,传统探测器从根本上受到其内在带宽的限制,限制了精确的宽带信号测量。 在这里,我们展示了一种神经形态光子处理方法可以克服这一限制,从而实现超越探测器带宽的精确宽带信号检测。 关键思想在于光子储层网络中输入波形的时空编码,该编码重建单个探测器无法访问的高频组件。 我们通过实验演示了高速光相信号的检测,使用片上硅光子学库的有效带宽扩展超过8倍。 这种方法为高速光和射频信号处理提供了一个可扩展和可集成的平台,为超快光子学和下一代通信系统开辟了新的机会。
继续滚动加载更多