AI基础研究具身智能 AI金融

本网站上的内容仅供参考，不提供医疗或其他专业建议，不代表活水快报、贡献者或合作伙伴的观点。

© 2024-2025 活水快报 - 42Digest.

|

京ICP备2024044642号-15

无序系统与神经网络研究快报

相关分类

凝聚态物理学

Condensed Matter

无序系统与神经网络

Disordered Systems and Neural Networks

材料科学

Materials Science

介观与纳米尺度物理学

Mesoscale and Nanoscale Physics

凝聚态物理学

Condensed Matter

无序系统与神经网络

Disordered Systems and Neural Networks

材料科学

Materials Science

介观与纳米尺度物理学

Mesoscale and Nanoscale Physics

最新研究

限制玻尔兹曼机器上的无数据集重量初始化

在前馈神经网络中,已经开发了无数据集重初始化方法,如LeCun,Xavier(或Glorot)和He初始化。这些方法根据特定分布(例如,高斯或均匀分布)随机确定重量参数的初始值,而无需使用训练数据集。据作者所知,这种无数据集的权重初始化方法尚未开发用于受限制的玻尔兹曼机器(RBM),这是由两层组成的概率神经网络。在这项研究中,我们根据统计机械分析为Bernoulli-Bernoulli RBMs导出了无数据集权重初始化方法。在拟议的权重初始化方法中,权重参数来自高斯分布,零均值。高斯分布的标准差是根据我们的假设优化的,即两层之间提供更大层相关性(LC)的标准差提高了学习效率。 LC的表达是基于统计力学分析得出的。标准差的最佳值对应于 LC 的最大点。提出的权重初始化方法在特定情况下与Xavier初始化相同(即当两个层的大小相同时,层的随机变量为{-1,1}-二进制,所有偏置参数为零)。拟议的权重初始化方法的有效性在使用玩具和现实世界数据集的数值实验中得到证明。

机器学习 (统计)无序系统与神经网络机器学习

构建具有近似消息传递的构态预测间隔

构图预测已成为构建预测间隔的有力工具,该预测间隔以无分布方式有效。然而,其评估可能具有计算成本,特别是在高维设置中,尺寸和样本大小都很大且具有可比的幅度。为了在广义线性回归的背景下应对这一挑战,我们提出了一种基于近似消息传递(AMP)的新算法,通过近似合格分数的计算,使用完整的构象预测加速预测间隔的计算。我们的工作弥合了现代不确定性量化技术和涉及AMP算法的高维问题工具之间的差距。我们在合成和真实数据上评估我们的方法,并表明它产生的预测间隔接近基线方法,同时速度要快一些。此外,在高维极限和数据分布假设下,AMP计算的合格分数收敛到精确计算的合格分数,从而允许在高维度上对构象方法进行理论研究和基准测试。

机器学习 (统计)无序系统与神经网络机器学习

高维多指数模型中弱学习能力的基本计算极限

多索引模型 - 函数仅依赖于其投影在子空间上的非线性变换 - 是使用神经网络研究特征学习的有用基准。本文研究了本假设类中高效可学习性的理论边界,侧重于用一阶迭代算法弱恢复其低维结构所需的最小样本复杂性,在高维方案中,样本 n=α d 的数量与协方差维度 d 成正比。我们的发现分为三部分:(i)我们确定在哪些条件下,可以通过任何 α>0; (ii) 单序算法的单步学习一个微不足道的子空间,如果琐碎子空间是空的,我们为一个简单的子空间的存在提供了必要和充分的条件,其中只能在某个样本复杂度 α>α_c 之上学习方向,其中α_c标记了计算阶段的过渡。在一组有限但有趣的真正困难的方向 - 类似于平价问题 - α_c被发现存在差异。最后,(iii)我们表明,不同方向之间的相互作用会导致复杂的分层学习现象,当耦合到更容易时,可以依次学习方向。我们详细讨论了与这些功能相关的大楼梯图片(并将其与原始楼梯进行比较)。我们的理论建立在一阶迭代方法中近似消息传递的最优性之上,在广泛的算法中划定了基本的可学习性极限,包括受过梯度下降训练的神经网络,我们在此背景下进行了讨论。

机器学习无序系统与神经网络计算复杂性

l_0-norm正则化的压缩传感相图

无噪音压缩传感是一个两步设置,允许对稀疏信号进行采样,然后在不丢失信息的情况下重建它。 LASSO算法基于正则化,为解决这个问题提供了一种高效和稳健的算法,但它在压缩率非常高的制程中失败。在这里,我们介绍了基于-规范正则化的两种算法,这些算法在测量矩阵的 Gaussian 设计设置中的压缩率方面优于 LASSO。这些算法基于近似调查传播,这是近似消息传递类中的算法家族。在大型系统限制中,它们可以通过状态进化方程进行严格的跟踪,并且可以精确预测可能完美信号重建的范围压缩速率。我们还提供了 -orm 无噪声抗压传感模型的统计物理分析。我们展示了复制对称状态和1步复制对称断裂(1RSB)状态的存在,以实现足够低的规范正则化。我们算法的恢复限制与 1RSB 解决方案的行为相关联。

信息论无序系统与神经网络

序列多指数模型和深度注意力网络学习的基本极限:高维渐近和尖锐的阈值

在本手稿中,我们研究了深度注意力神经网络的学习,该网络被定义为多个自我关注层的组成,具有并列和低等级权重。我们首先建立此类模型的映射,以对多索引模型进行排序,将广泛研究的多索引模型泛化到顺序协方差,为此我们建立了许多一般结果。在贝叶斯最优学习的背景下,在大尺寸D和可数数量样本N的极限中,我们对最佳性能以及该设置中最著名的多项式时间算法(即近似消息传递)的性能进行了尖锐的渐近表征,并表征了优于随机预测性能所需的最小样本复杂性的尖锐阈值。我们的分析特别揭示了不同层是如何依次学习的。最后,我们讨论如何在现实的设置中也可以观察到这种顺序学习。

机器学习无序系统与神经网络

学习生成扩散的可解决模型:理论和见解

在这份手稿中,我们考虑了学习由双层自动编码器进行参数化的流动或基于扩散的生成模型的问题,该模型通过在线随机梯度下降训练,在具有底层低维流形结构的高维目标密度上。我们对学习模型生成的样本分布的低维投影进行了严格的渐近表征,特别是确定其对训练样本数量的依赖。基于此分析,我们讨论了模式崩溃如何产生,并导致模型在生成模型在生成的合成数据上重新训练时崩溃。

机器学习无序系统与神经网络

小奇值问题:变形金刚模型的随机矩阵分析

这项工作分析了预训练变压器模型中重量矩阵的奇异值光谱,以了解信息如何存储在光谱的两端。使用随机矩阵理论(RMT)作为零信息假说,我们将与RMT的协议作为随机性和偏差的证据作为学习的证据。令人惊讶的是,我们观察到,不仅从最大的奇异值(通常的异常值)中,而且从最小的值中,从RMT明显背离。将相关的奇异向量与激活协方差矩阵的特征向量进行比较,表明在违反 RMT 的地方存在相当大的重叠。因此,数据中的重要方向被小奇异值及其向量以及大值捕获。我们通过经验来证实这一点:将偏离RMT的奇异值归零,使语言模型的困惑远远超过从批量中删除值,在微调最小十进制后,可能是频谱中第三最有影响力的部分。为了解释与小奇异值链接的向量如何比那些链接到较大值的向量携带更多的信息,我们提出了一个线性随机矩阵模型。我们的发现强调了频谱低端被忽视的重要性,并为基于SVD的大型语言模型的修剪和压缩提供了理论和实践指导。

机器学习无序系统与神经网络

由代理异质性诱导的最佳羊群形成

对生物系统中蜂拥而至的研究已经确定了自我组织的集体行为的条件,激励了分散策略的发展,以协调无人机和其他自动驾驶汽车的动态。以前的研究主要集中在代理之间时间变化交互网络的作用,同时假设代理本身是相同的或几乎相同的。在这里,我们偏离了传统的假设,研究代理之间的个体间差异如何影响蜂群动力学的稳定性和收敛性。我们表明,具有最佳分配异构参数的成群的代理显着优于其同质的对应物,在各种控制任务中实现20-40%的收敛到所需的形成。这些任务包括目标跟踪,羊群形成和障碍物机动。在通信延迟的系统中,即使对相同的代理来说,异质性也可以实现收敛。我们的结果挑战了多智能体控制的现有范式,并将系统障碍作为一种适应性的分布式机制,以促进群体性动态的集体行为。

无序系统与神经网络系统与控制动力系统最优化与控制

神经网络的批量边界分解

我们将批量边界分解作为理解深度神经网络训练动力学的新框架。从随机梯度下降公式开始,我们表明拉格朗日可以重组为数据无关的散装项和数据依赖边界项。批量捕获网络架构和激活函数设置的内在动力学,而边界反映了输入和输出层训练样本的随机相互作用。这种分解暴露了深层网络背后的局部和均匀结构。作为自然扩展,我们基于这种分解开发神经动力学的场上理论公式。

机器学习无序系统与神经网络高能物理 - 唯象学

使用Quantum Monte Carlo模拟单元的学习阶段

我们建议使用“spin-opstring”,源自Stochastic系列扩展量子蒙特卡洛(QMC)模拟作为机器学习(ML)输入数据。它提供了QMC模拟单元的紧凑,内存效率表示,将初始状态与操作符字符串相结合,该字符串通过想象时间编码状态的演化。使用受监督的ML,我们展示了输入在捕获常规和拓扑相变方面的有效性,以及在预测非局部可观测物的回归任务中。我们还通过在一个量子系统上训练模型并成功预测另一个量子系统,并展示了在较小的系统尺寸上训练的模型很好地扩展到较大的系统,从而展示了在较小的系统尺寸上训练的自旋声波数据的能力。重要的是,我们在准确预测量子相变时,说明了自旋自旋与常规自旋配置相比具有明显的优势。最后,我们展示了自旋-opstring的固有结构如何为ML预测的可解释性提供了一个优雅的框架。使用两种最先进的可解释性技术,Layer-wise Relevance Propagation和Shapley Additive exPlanations,我们展示了ML模型从输入数据中学习和依赖于物理上有意义的特性。这些发现共同确立了自旋-opstring作为量子多体物理学中ML广泛适用和可解释的输入格式。

强关联电子无序系统与神经网络机器学习机器学习 (统计)

正在和神经网络之间的通信

使用Ising模型计算是未来计算技术的核心,如量子退火,糖尿病量子计算和热力学经典计算。传统上,计算值等同于地面状态。本文将具有地面状态的计算与自旋平均值进行计算,允许计算在高温下进行。然后,它引入了Ising设备和神经网络之间的系统对应关系,以及一个简单的方法,可以在Ising类型的硬件上运行训练的前馈神经网络。最后,提供了一个数学证明,这些实现总是成功的。

无序系统与神经网络新兴技术机器学习量子物理学

二进制感知器计算间隙 – 参数 fl RDT 视图

最近的研究表明,非对称二进制感知器(ABP)可能表现出所谓的统计计算差距,其特征是出现两个相过渡约束密度阈值:(i)可满足性阈值α_c,ABP成功/未能作为存储内存运行;和(ii)算法阈值α_a,低于/高于哪个可以/不能有效地确定ABP的重量。我们考虑对完全提升的随机二元性理论(fl RDT)[85]进行特定的参数化利用,并研究其潜在的ABP算法含义。随着一个通过 fl RDT 提升水平的进展,发现了显著的结构参数变化。在前两个级别上,所谓的 $̧ 序列 - 一个关键的参数化f RDT组件 - 是(自然)递减型。然后将此类现象学在较高水平上的变化与α_c-α_athreshold变化相关联。也就是说,在第二层上,混凝土数值给出了临界约束密度α=α_c≈0.8331。虽然通过较高水平的进展减少了这一估计数,但已经进入第五级,我们观察到令人满意的收敛水平,并获得α≈0.7764。这允许绘制两个引人注目的平行:(i) 获得的约束密度估计值与聚类碎片化的范围α∈(0.77,0.78)(据信是导致局部改进算法失败的原因)的显着参数[17,88];和(ii)观察到的$̧序列现象学的变化与负Hopfield模型的显着变化非常匹配,其中最近出现了接近类似类型的高效算法。

机器学习 (统计)无序系统与神经网络信息论机器学习

使用变形金刚学习伪数:排列的协和生成器,课程和可解释性

我们研究变形金刚模型学习由Permuted Congruential Generators(PCGs)生成的序列的能力,Permuted Congruential Generators(PCGs)是一个广泛使用的伪随机数生成器(PRNGs)家族。 PCG通过将一系列位向移位,XOR,旋转和截断应用于隐藏状态,从而对线性对数发生声响(LCG)施加了大量额外的困难。我们表明,变形金刚可以成功地对来自不同PCG变体的看不见的序列进行上下文预测,这些序列超出了已发布的经典攻击。在我们的实验中,我们使用多达5000万个模型参数和具有多达50亿个令牌的数据集将模数扩展到2^22。令人惊讶的是,我们发现即使输出被截断到单个位,也可以通过模型可靠地预测。当训练过程中将多个不同的PRNG一起呈现时,模型可以共同学习它们,从不同的排列中识别结构。我们演示了具有模量 m 的缩放定律:近乎完美预测所需的上下文序列元素数量随着 √(m) 的增长而增长。对于较大的模数,优化进入扩展的停滞阶段;在我们的实验中,学习moduli m ≥ 2^20需要结合来自较小模数的训练数据,这表明了课程学习的关键必要性。最后,我们分析嵌入层并揭示一种新的聚类现象:模型自发地将整数输入分组到位旋转不变的聚类中,揭示表示如何从较小的模量传递到较大的模数。

机器学习无序系统与神经网络密码学与安全

深度学习的统计物理:在插值附近对多层感知器进行最佳学习

三十年来,统计物理学一直为分析神经网络提供了一个框架。一个长期存在的问题仍然是其解决深度学习模型的能力,这些模型捕获了丰富的功能学习效果,从而超越了迄今为止分析的狭窄网络或内核方法。我们通过多层感知器的监督学习研究积极回答。重要的是,(i)其宽度缩放为输入维度,使其比超宽网络更容易进行特征学习,并且比窄网络或具有固定嵌入层更具表现力;(ii)我们专注于具有挑战性的插值机制,其中可训练参数和数据的数量是可比的,这迫使模型适应任务。我们考虑匹配的师生设置。它为学习随机深度神经网络目标提供了基本限制,并有助于识别足够的统计数据,描述随着数据预算的增加,通过优化训练的网络所学到的东西。丰富的现象学随着各种学习转变而出现。通过模型对目标的“专业化”获得足够的数据最佳性能,但很难达到被理论预测的次优解决方案所吸引的训练算法。专业化在层层之间不均匀地发生,从浅层传播到深层,但也分布在每层的神经元之间。此外,更深层次的目标更难学习。尽管简单,但贝叶斯最优设置提供了关于深度,非线性和有限(比例)宽度如何影响特征学习系统中的神经网络的见解,这些神经网络可能与其相关。

机器学习 (统计)无序系统与神经网络统计力学信息论

复杂自旋玻璃拓扑的概率计算优化

旋转玻璃系统作为随机相互作用的无序磁铁的晶格,在磁化理论和应用对广泛的硬组合优化问题具有重要意义。然而,尽管做出了持续的努力,但获得高精度和效率的算法仍然难以捉摸。由于它们的拓扑结构是低k-partite,因此系统非常适合使用概率位(P-bits)的概率计算(PC)方法。在这里,我们介绍了复杂的自旋玻璃拓扑结构,解决了在Ising机器的模拟PC实现。首先,我们考虑了随机生成并在文献中发现的一些三维爱德华兹 - 安德森立方旋转眼镜作为基准。其次,与其他最先进的技术相比,斜面拓扑被确定为比较优势的可能候选者,并模拟了一系列尺寸。我们发现,如果假设硬件的完美并行化,则找到给定质量解决方案所需的迭代次数具有恒定的扩展,系统大小超过饱和点。因此,PC架构可以通过连接以系统大小线性缩放的多个P位来交换其他方法的计算深度。这种恒定的扩展被证明存在于许多解决方案的特质上,达到一定的极限,超出资源限制限制了进一步的调查。饱和点在拓扑和品质之间有所不同,并且在找到地面真理的极限中变得成倍地困难。此外,我们证明我们的PC架构可以在几分钟内以与最先进的量子退火机相同的质量解决自旋玻璃拓扑结构,并对其在硬件上的实现做出适度的假设。

无序系统与神经网络新兴技术量子物理学

代表性相似性与有限神经元的光谱分析

了解神经记录和计算模型之间的表示相似性对于神经科学至关重要,但由于可以同时记录的神经元数量的限制,因此难以可靠地测量。在这项工作中,我们应用随机矩阵理论的工具来研究这些限制如何影响相似性测量,重点是中心内核对齐(CKA)和规范相关性分析(CCA)。我们提出了一个表示相似性分析的分析框架,该框架将测量的相似性与底层表示的光谱特性联系起来。我们证明,在有限神经元采样下,神经相似性被系统地低估,这主要是由于特征向量去定位。此外,对于权力法人口光谱,我们表明,局部特征向量的数量作为记录神经元数量的平方根,为从业者提供了一个简单的经验法则。为了克服采样偏差,我们引入了一种去质化方法,以推断出人群水平的相似性,即使使用小神经元样本也能进行准确的分析。理论预测在合成和真实数据集上进行了验证,提供了在有限采样约束下解释神经数据的实用策略。

无序系统与神经网络机器学习神经元与认知

节能音频分类的内存纳米线网络:减少延迟的预处理无水库计算

高效的音频功能提取对于低延迟,资源受限的语音识别至关重要。传统的预处理技术,如Mel Spectrogram,Perceptual Linear Prediction(PLP)和Learable Spectrogram,实现了高分类精度,但需要大型特征集和显著计算。神经形态计算的低延迟和功率效率优势为音频分类提供了强大的潜力。在这里,我们引入了记忆纳米线网络作为神经形态硬件预处理层,用于口语数字分类,这是以前没有证明的能力。 Nanowire网络直接从原始音频中提取紧凑,信息丰富的功能,在精度,从原始音频大小(数据压缩)减少尺寸和训练时间效率之间实现有利的权衡。与最先进的软件技术相比,纳米线功能在次次训练延迟下达到66倍数据压缩(XGBoost)66倍,精度达到97.9%,压缩255倍(Random Forest)。在多个分类器中,纳米线特性始终以超过62.5倍的压缩精度达到90%以上,优于传统技术(如MFCC)在效率方面提取的功能,而不会损失性能。此外,纳米线功能实现了96.5%的精度分类多扬声器音频,优于所有最先进的功能精度,同时实现最高的数据压缩和最低的训练时间。 Nanowire网络预处理还增强了音频数据的线性分离性,提高了简单的分类器性能和跨扬声器的通用性。这些结果表明,记忆纳米线网络提供了一种新颖,低延迟和数据高效的特征提取方法,从而实现高性能的神经形态音频分类。

声音处理无序系统与神经网络音频与语音处理应用物理学

没有免费的午餐从随机功能合集:扩展法律和近最佳条件

鉴于总模型大小的固定预算,必须在训练单个大模型或组合多个较小模型的预测之间做出选择。我们研究超参数化和参数化不足的随机特征脊回归模型集合的这种权衡。使用确定性等效风险估计,我们证明,当固定数量的参数分布在 K 独立训练的模型之间时,山脊优化的测试风险会随着 K 的增加而增加。因此,单个大模型实现了最佳性能。然后我们询问合奏何时能达到近乎最优的性能。在超参数化方案中,我们显示,按照领先顺序,测试错误仅取决于集成大小和模型大小,仅通过总特征计数,因此超参数化集成持续实现接近最佳性能。为了理解参数不足的集成,当每个集成成员的集成大小和参数按照“增长指数” l 联合缩放时,我们将测试风险的缩放法作为总参数计数的函数。虽然通过增加具有固定集成大小的模型大小始终可以实现最佳错误缩放,但我们的分析确定了内核和任务特征结构上的条件,根据这些条件,可以通过集成大小和模型大小的联合缩放获得接近最佳缩放定律。

机器学习无序系统与神经网络机器学习 (统计)

非线性循环神经网络中的相关性统计

相关性的统计是描述循环神经网络集体动力学的核心数量。我们得出了大量神经元极限中非线性循环网络相关性统计的确切表达式,包括系统 1/N 修正。我们的方法使用网络随机动力学的路径整体表示,将描述减少到几个集体变量,并实现高效的计算。这概括了线性网络上的先前结果,包括广泛的非线性激活函数,这些函数在路径积分中作为交互项输入。这些相互作用可以解决线性理论的不稳定性,并产生严格的积极的参与维度。我们为电源法激活提供了明确的结果,揭示了由网络耦合控制的缩放行为。此外,我们还介绍了基于Pade近似值的激活函数类别,并为它们的相关性统计提供分析预测。数值模拟以出色的一致性证实了我们的理论结果。

神经元与认知无序系统与神经网络神经与演化计算生物物理学

通过稀疏采样进行张量因子化的图形模型

我们根据张量组件的稀疏测量来考虑张量因子化。测量设计的方式是,相互作用的底层图是一个随机图。在缺少大量数据的情况下,这种设置将非常有用,如在社交网络服务中大量使用的推荐系统。为了获得关于设置的理论见解,我们考虑高维极限中张量因子化的统计推断,我们称之为致密极限,其中图形大而致密但不完全连接。我们构建消息传递算法,并在贝叶斯最佳师生设置中进行测试。我们还开发了一个复制理论,在密集极限中变得精确,以检查统计推断的性能。

机器学习 (统计)无序系统与神经网络统计力学信息论

继续滚动加载更多