我们介绍了EuLearn,第一个表面数据集公平地代表了拓扑类型的多样性。 我们设计我们的嵌入式表面的均匀变化属依赖于随机结,从而使我们的表面与自己结结。 EuLearn在3D中贡献了网格,点云和标量字段的新拓扑数据集。 我们的目标是促进机器学习系统的训练,这些系统可以辨别拓扑特征。 我们尝试了特定的标志性3D神经网络架构,发现它们的香草实现在属分类上表现不佳。 为了提高性能,我们开发了一种新颖的,非欧几里得,统计采样方法,适用于图形和流形数据。 我们还介绍了依赖于我们非欧几里得采样策略的 PointNet 和 Transformer 架构的邻接适应。 我们的结果表明,将拓扑信息整合到深度学习工作流程中可以显著提高这些具有挑战EuLearn数据集的性能。
随着生成剂变得越来越有能力,它们的行为与复杂的人类价值保持一致仍然是一个基本挑战。 现有方法通常通过减少到标量奖励来简化人类的意图,从而忽视人类反馈的多方面性质。 在这项工作中,我们引入了基于偏好的多目标逆加强化学习(MO-IRL)的理论框架,其中人类的偏好被建模为潜在的矢量值奖励函数。 我们正式确定了从嘈杂的偏好查询中恢复帕累托最优奖励表示的问题,并为确定底层多目标结构创造条件。 我们得出严格的样本复杂性边界,用于恢复 ε-近似帕累托前部,并引入了一个遗憾公式,以量化这种多目标设置中的次优性。 此外,我们提出了一个可证明的收敛算法,用于使用偏好推断的奖励圆锥体进行策略优化。 我们的结果弥合了实践对齐技术和理论保证之间的差距,为在高维度和价值多元化环境中学习对齐行为提供了原则基础。
我们提出了一个近似算法,用于计算 ^d 中点集的直径。 新算法对计算给定输入的直径的“硬度”很敏感,对于大多数输入来说,它能够极快地计算确切的直径。 新算法简单、健壮,具有良好的经验性能,可以快速实现。 因此,它似乎是计算/近似直径在实践中选择的算法。
随着生成剂变得越来越有能力,它们的行为与复杂的人类价值保持一致仍然是一个基本挑战。 现有方法通常通过减少到标量奖励来简化人类的意图,从而忽视人类反馈的多方面性质。 在这项工作中,我们引入了基于偏好的多目标逆加强化学习(MO-IRL)的理论框架,其中人类的偏好被建模为潜在的矢量值奖励函数。 我们正式确定了从嘈杂的偏好查询中恢复帕累托最优奖励表示的问题,并为确定底层多目标结构创造条件。 我们得出严格的样本复杂性边界,用于恢复 ε-近似帕累托前部,并引入了一个遗憾公式,以量化这种多目标设置中的次优性。 此外,我们提出了一个可证明的收敛算法,用于使用偏好推断的奖励圆锥体进行策略优化。 我们的结果弥合了实践对齐技术和理论保证之间的差距,为在高维度和价值多元化环境中学习对齐行为提供了原则基础。
对于 P 索引的持久性模块 M,M 的(广义)等级被定义为 M 在 poset P 的向量空间图的极限到上限图的等级。 对于2参数持久化模块,最近提出了基于锯齿的持久化算法,该算法利用了2参数模块的广义排名等于在poset边界上定义的zigzag模块中的完整间隔数的事实。 d参数持久化模块或一般P-索引持久化模块的边界的模拟定义似乎不合理。 为了克服这个困难,我们首先将给定的P索引模块M展开到zigzag模块M_ZZ中,然后检查M_ZZ的分解中有多少个完整间隔模块可以折叠回来以保持M的分解。 这个数字决定了M的广义等级。 对于 d-complexes 的 degree-d 同源的特殊情况,我们获得了一种更有效的算法,包括用于图形中的 degree-1 同源的线性时间算法。
让 P 成为 R^d 中的有限全维点配置。 我们表明,如果一个点配置 Q 的属性具有所有有限脊椎类通过向 P 添加(通用)点来实现的属性,则通过向 Q 添加点来实现,那么 P 和 Q 等于直接的亲和变换。 我们还表明,对于任何点配置 P 和任何 ε>0,有一个具有以下属性的 P 的有限(通用)扩展 P 的扩展 P:如果可以扩展 P 的 chirotope 的另一个实现 Q,以便实现 P 的脊椎,那么存在一个直接的 affine 变换,映射到 P 的相应点 ε 距离 ε 内的每个 Q 点。
R^3中一组有限点(分别为连续质量分布)的八部分由三个平面组成,将空间分成8个八度,因此每个打开的八度最多包含1/8的点(分别为质量)。 1966年,Haswiger表明,R^3中的任何质量分布都承认八分区;此外,可以规定三架飞机之一的正常方向。 有限点集的类似结果遵循一个标准极限参数。 我们证明了这个结果的以下变体:R^3中的任何质量分布(或点集)承认一个八分区,其中两个飞机的交叉点是一条具有规定方向的线。 此外,我们提出了一个有效的算法,用于在时间 O^*(n^7/3 中计算一组n点的8个分区(其中一个平面的指定正常方向)。
由函数映射到 R^d 的图形组成的数据在许多数据应用程序中产生,包括Reeb图,几何图形和结嵌入等结构。 因此,在数据分析管道中需要比较和聚类这些对象的能力,因此需要它们之间的距离。 在这项工作中,我们研究这些对象离散化的交织距离,当d=1时称为映射图,其中可以通过在它们之间找到一对自然变换来比较数据的函子表示。 然而,在许多情况下,计算交织距离是NP-hard。 出于这个原因,我们从罗宾逊最近的工作中获得灵感,为地图家庭找到质量措施,这些地图不会上升到自然转变的水平,称为任务。 然后,我们将函子图像赋予一个度量空间的额外结构,并定义一个损失函数,该函数测量分配距离制作间歇通勤所需的图表有多远。 最后,我们表明损失函数的计算是多项式的,具有给定的赋值。 我们相信这个想法既强大又可翻译,有可能在广泛的环境中提供近似和边界的交织。
在基础模型和大型语言模型(LLM)时代,欧几里得空间是我们机器学习架构事实上的几何设置。 然而,最近的文献表明,这种选择带有根本性的限制。 为此,非欧几里得学正在迅速获得牵引力,特别是在与网络相关的应用中,其中复杂的关系和结构普遍存在。 非欧几里得空间,如双曲面,球形和混合曲率空间,已被证明可以为具有内在几何属性的数据提供更有效和有效的表示,包括社交网络拓扑,查询文档关系和用户-项目交互等与Web相关的数据。 将基础模型与非欧几里得几何形状集成具有巨大的潜力,可以增强其捕获和建模底层结构的能力,从而在搜索、推荐和内容理解方面获得更好的性能。 本次研讨会侧重于非欧几里得基础模型和几何学习(NEGEL)的交叉,探索其潜在的好处,包括推进网络相关技术,挑战和未来方向的潜在好处。 讲习班页面:[https://hyperboliclearning.github.io/events/www2025workshop](https://hyperboliclearning.github.io/events/www2025workshop)
给定一个有限尺寸,大调模块在两个变量的多项式环上,我们定义它的二参数计数,一个自然数,和它的末端曲线,一组平面曲线。 这些是在一个变量中,单级模块在多项式环上的条形数概念和端点的二维类似物,来自持久性理论。 我们表明,我们的计数是满足某些自然条件的唯一计数;因此,两个参数持久性中的几个包含-排除型公式产生相同的正数,它等于我们的计数,并反过来等于最终曲线的数量,赋予这个计数几何意义。 我们表明,最终曲线通过显示它们插在生成器,关系和syzygies之间来决定经典的Betti表。 使用某个字符串代数的带表示,我们显示端曲线的一组承认一个规范分区,其中每个部分在平面上形成一个闭合曲线;我们将其称为模块的边界。 作为一个不变的,边界既不弱也不强于等级不变,但是,与等级不变相反,它是在一组价差-可分解表示上的完全不变。 我们的结果连接了多参数持久性的几行工作,并且它们在两个变量中通过真实指数多项式环向模块的扩展与二维莫尔斯理论有关。
鉴于平面中的一组磁盘,本文研究的问题的目标是选择这些磁盘的一个子集,这样其成员中没有一个包含任何其他磁盘的中心。 不在该子集中的每个磁盘必须与其附近的磁盘之一合并,即增加后者的半径。 这个问题在标记旋转地图和可视化静态地图中实体分布方面有应用。 我们证明这个问题是NP-hard。 我们还介绍了这个问题的ILP公式,以及针对所有磁盘中心在线的特殊情况的多项式时间算法。
能够捕获组合结构的丰富表示,使机器学习能够应用于分析和生成平面图、地形、图像和动画等任务。 最近的工作主要集中在理解具有明确特征,社区或底层距离指标的结构,而那些缺乏这些特征的人基本上仍未研究。 这些组合结构的例子可以在多边形中找到,其中顶点位置的微小变化导致组合结构的显着重新排列,表示为可见性或三角图。 当前的表示学习方法无法捕获没有明确定义特征和距离指标的结构。 在本文中,我们研究了可见性重建的开放问题:给定可见性图G,构造一个可视性图为G的多边形P。 我们介绍了VisDiff,这是一种基于扩散的新方法,从输入可见性图G生成多边形P。 我们的方法的主要新颖之处在于,我们首先估计与多边形相关的符号距离函数(SDF)不是直接生成多边形的顶点集。 然后,SDF用于提取代表最终多边形的顶点位置。 我们表明,通过SDF使VisDiff能够比直接生成顶点更有效地学习可见性关系。 为了训练VisDiff,我们创建了一个精心策划的数据集。 我们使用此数据集来基准测试我们的方法,并实现26种标准方法以及最先进的方法。
地理空间代码生成正在成为人工智能和地球科学分析整合的关键方向。 然而,这一领域仍然缺乏自动评估的标准化工具。 为了解决这一差距,我们提出了AutoGEEval,这是第一个多模态单元级自动化评估框架,用于Google Earth Engine(GEE)平台上由大型语言模型(LLM)驱动的地理空间代码生成任务。 AutoGEEval基于GEE Python API,建立了一个基准套件(AutoGEEval-Bench),包括跨越26个GEE数据类型的1325个测试用例。 该框架集成了问题生成和答案验证组件,以实现端到端的自动化评估管道 - 从函数调用到执行验证。 AutoGEEval 支持在准确性、资源消耗、执行效率和错误类型方面对模型输出进行多维定量分析。 我们评估18种最先进的LLM - 包括通用,推理增强,以代码为中心和地球科学专业化的模型 - 在GEE代码生成中显示其性能特性和潜在的优化路径。 这项工作为开发和评估地理空间代码生成模型提供了统一的协议和基础资源,将自动化自然语言的前沿推进到特定领域的代码翻译。
本文提供了目前最广为人知的上限,即二维欧几里得空间中的包装密度,两种类型的球体的大小比是最大的一个,允许在每个八面体孔中插入一个小球体的六边形紧凑包装的大球体。 这种上限是通过从四面体密度以上的边界获得的,该密度可以出现在此类包装的球体中心的添加剂加权Delaunay分解中。 证明依赖于在区间算术中具有挑战性的计算机计算,并且可能由他们自己感兴趣。
我们介绍了EuLearn,第一个表面数据集公平地代表了拓扑类型的多样性。 我们设计我们的嵌入式表面的均匀变化属依赖于随机结,从而使我们的表面与自己结结。 EuLearn在3D中贡献了网格,点云和标量字段的新拓扑数据集。 我们的目标是促进机器学习系统的训练,这些系统可以辨别拓扑特征。 我们尝试了特定的标志性3D神经网络架构,发现它们的香草实现在属分类上表现不佳。 为了提高性能,我们开发了一种新颖的,非欧几里得,统计采样方法,适用于图形和流形数据。 我们还介绍了依赖于我们非欧几里得采样策略的 PointNet 和 Transformer 架构的邻接适应。 我们的结果表明,将拓扑信息整合到深度学习工作流程中可以显著提高这些具有挑战EuLearn数据集的性能。
我们提出了一个近似算法,用于计算 ^d 中点集的直径。 新算法对计算给定输入的直径的“硬度”很敏感,对于大多数输入来说,它能够极快地计算确切的直径。 新算法简单、健壮,具有良好的经验性能,可以快速实现。 因此,它似乎是计算/近似直径在实践中选择的算法。
低层云在地球大气层中无处不在,在向整个地球输送热量、水分和动力方面起着至关重要的作用。 它们与其他大气成分(如气溶胶)的进化和相互作用对于了解气候系统及其对人为影响的敏感性至关重要。 先进的高分辨率地球静止卫星现在更准确地解决云系统,将云跟踪作为研究其时空动力学的重要研究领域。 它使驱动云进化的对流和对流组件分离成为可能。 反过来,这为低层云系统的结构和生命周期及其管理的大气过程提供了更深入的见解。 在本文中,我们提出了一种新的框架,用于跟踪云系统,使用基于最佳传输的拓扑驱动技术。 我们首先根据云光学景深的合并树为云系统获得一组锚点。 然后,我们应用拓扑驱动的概率特征跟踪这些锚点来指导云系统的跟踪。 我们通过跟踪海洋和陆地上的云来测试两个物理上不同的环境中的系统差异,展示了我们的框架的效用。 我们通过案例研究和统计分析进一步评估我们的框架,将其与两种领先的云跟踪工具和两种基于拓扑的通用跟踪工具进行比较。 结果表明,纳入基于系统的跟踪可以提高捕获低层云演化的能力。 我们的框架为使用卫星数据记录的详细低层云表征研究铺平了道路。
图 G 的单调绘制是 G 的直线绘图,因此每对顶点都由相对于某个方向的单调的路径连接。 树木作为一个特殊的图形类别,一直是几篇论文的焦点,最近,他和He <cit.>展示了如何制作一个包含在12n×12n网格中的任意n顶点树的单调绘图。 文献中出现的所有单调的树绘制算法都考虑根条序树,它们绘制它们,以便(i)树的根在绘图的起源处绘制,(ii)绘图被限制在第一个象限中,并且(iii)树的排序/嵌入得到尊重。 在本文中,我们提供了一个简单的算法,具有完全相同的特性,并且给定一个n-vertex根植树T,它输出一个适合n×n网格的T的单调绘图。 对于未根的有序树,我们提出了一种算法,该算法产生单调的图纸,尊重排序并适合(n+1)×(n/2 +1)网格,而对于未根的无序树,我们产生良好的宽高比的单调图纸,这些图纸最多适合大小⌊3/4(n+2)⌋×⌉-3/4(n+2)⌋。
在自然科学和工程学中获得的许多多变量时间序列具有重复的行为,例如离散自动化中工业机器的状态空间轨迹。 从这样一个多变量时间序列中恢复复发的时间对于许多监测和控制任务至关重要。 对于周期性时间序列,这相当于确定其周期长度。 在这项工作中,我们提出了一个持久的同源框架,以估计多变量时间序列中的复发时间,具有不同的循环行为(周期性,重复性和重复性)的概括。 为此,我们在我们的框架中提供了三种可证明稳定的专门方法,并使用真实世界的数据验证它们,包括注塑机的新基准数据集。
Hausdorff 距离是常用的度量,用于计算几何集合的集合相似性。 对于包含 n 个点的集合,精确的距离可以在 O(n^2) 的时间内进行精确计算。 在本文中,我们展示了如何单独预处理点集,以便任何对的Hausdorff距离都可以线性时间近似。 我们假设该指标是加倍的。 每个集合的预处理时间为O(nlogΔ),其中Δ是输入的最大到最小的成倍距离的比例。 从理论上讲,使用更复杂的算法可以将这减少到O(nlog n)时间。 我们计算(1+ε)近似Hausdorff距离在(2 + 1 /ε)^O(d)n 公制空间中,在具有倍增尺寸d的度量空间中。 k部分Hausdorff距离忽略k异常值以增加稳定性。 此外,我们提供了一个线性时间算法,一次计算k的所有值的定向k-partial Hausdorff距离,并且不改变预处理。
我们证明了,对于任何两个多面体流形 𝒫, 𝒬,都存在一个多面体流形 ℐ,使得 𝒫 和 ℐ 共享一个公共的展开图,并且 ℐ 和 𝒬 共享一个公共的展开图。换句话说,我们可以展开 𝒫,然后将该展开图重折叠(粘合)成 ℐ,展开 ℐ,然后重折叠成 𝒬。此外,如果 𝒫 和 𝒬 没有边界并且可以嵌入到 3D 空间中(没有自相交),那么 ℐ 也可以。这些结果可以推广到 n 个给定的流形 𝒫_1, 𝒫_2, …, 𝒫_n;它们都共享一个具有相同中间流形 ℐ 的公共展开图。允许超过两步的展开/重折叠,我们为两种特殊情况获得了更强的结果:对于双重覆盖的凸平面多边形,我们实现了所有中间多面体都是平面的;对于树形多立方体,我们实现了所有中间多面体都是树形多立方体。
对于两个 d 维点集 A,大小为 n 的 B,从 A 到 B 的 Chamfer 距离定义为 CH(A,B) = ∑_a ∈A min_b ∈B a-b。 Chamfer 距离是量化点集之间的差异的广泛使用的度量,用于许多机器学习和计算机视觉应用。 Bakshi等人最近的一项工作,NeuriPS'23,给出了第一个近线性时间(1+eps)近似算法,运行时间为O(ndlog(n)/eps^2)。 在本文中,我们将运行时间进一步改进为 O(nd(loglog(n)+log(1/eps))/eps^2)。 当 eps 是常数时,这显著减小了从 O(log n) 到 O(log n) 到 O(log n) 的上界和琐碎的 Omega(dn) 下界之间的差距。
本文介绍了Claycode,一种新颖的2D可扫描代码,专为广泛的风格化和变形而设计。 与传统的基于矩阵的代码(例如QR码)不同,Claycodes在树结构中编码其消息。 在编码过程中,比特被映射到拓扑树中,然后将其描述为在目标多边形形状的边界内绘制的颜色区域的嵌套。 解码时,Claycodes从相机流中实时提取和解释。 我们详细介绍了端到端的管道,并表明Claycodes允许广泛的风格化,而不会影响其功能。 然后,我们的经验证明了Claycode对重变形的高耐受性,在通常失败的情况下优于传统的2D可扫描代码。