其他统计学研究快报

用 AI 跟踪日新月异的其他统计学领域进展

Basic model for ranking microfinance institutions

小额供资机构排名基本模式

本文讨论了在建立聚合器站点产品排名模型时遇到的挑战,使用基于点击后转换的小额信贷机构(MFI)排名的例子。我们建议应该考虑MFI的哪些特征,并使用基于马尔可夫链的算法,我们在真实数据上展示了这些特征的“有用性”。这项工作中开发的想法可以应用于小额保险中的聚合网站,特别是当个人数据不可用时。由于我们在公共领域没有找到类似的数据集,我们正在发布数据集,并详细说明其属性。

信息检索概率论其他统计学

最新研究

小额供资机构排名基本模式

信息检索概率论其他统计学

arXiv

慢性心力衰竭的预测模型

慢性心力衰竭(HF)的管理在现代医疗保健中提出了重大挑战,需要持续监测,早期发现恶化和个性化治疗策略。在本文中,我们介绍了基于机器学习(ML)技术的预测模型,以识别HF风险的患者。该模型是一种集成学习方法,一种经过修改的堆叠技术,它使用两个利用临床和超声心动图特征的专门模型,然后使用元模型来结合这两个模型的预测。我们最初在真实数据集上评估模型,获得的结果表明,它在HR风险患者的分层方面表现良好。具体来说,我们获得了高灵敏度(95%),确保几乎所有高风险患者都被识别出来。至于准确性,我们获得了84%,在某些ML上下文中可以被认为是中等的。然而,鉴于我们优先考虑识别有HF风险的患者是可以接受的,因为他们将被要求参加PrediHealth研究项目的远程监控计划,本文的一些作者正在为此工作。初步研究结果还表明,基于ML的风险分层模型不仅可以作为PrediHealth项目中有价值的决策支持工具,还可以作为医疗保健专业人员的宝贵决策支持工具,有助于早期干预和个性化患者管理。为了更好地了解我们的预测模型的价值和潜力,我们还将其结果与使用三个基线模型的结果进行了对比。初步结果表明,我们的预测模型优于这些基线,这些基线可以明确考虑特征,而不是将它们分类在临床和超声心动图特征中。

其他统计学人工智能

arXiv

先验的问题,还是后辈的问题?

先验的问题是众所周知的:它涉及确定规范的挑战,规范规范,以规范自己的先前。我认为,解决这个问题的关键是考虑我所说的后人的问题 - 确定直接支配后人信誉的规范的挑战,通过条件化的diachronic要求,向后诱导一些规范的先验。这种前瞻性的方法可以概括为:向前思考,向后工作。虽然这个想法可以追溯到弗里德曼(1963年)、卡纳普(1963年)和《神谭》(1970年),但我相信它没有得到足够的关注。在本文中,我发起了对前瞻性贝叶斯主义的系统性辩护,解决了来自更传统的观点(主观主义和客观主义)的潜在反对意见。我也开发了一种具有前瞻性的贝叶斯主义的具体方法 - 一种重视后验信仰与真理的融合的方法,并将其视为一种基本而不是衍生的规范。这种方法被称为收敛式贝叶斯主义,被认为是奥卡姆在统计和机器学习方面的剃须刀的贝叶斯基础的关键。

其他统计学人工智能概率论

arXiv

反对经验性人AI对齐的统计案例

经验性人与AI对齐旨在使AI系统符合观察到的人类行为。虽然其目标很高,但我们认为,经验的调整可以无意中引入需要谨慎的统计偏见。因此,本立场文件主张反对幼稚的经验对齐,提供规定性对齐和后验经验对齐作为替代方案。我们通过以人类为中心的语言模型解码等有形的例子来证实我们的原则性论点。

人工智能计算与语言机器学习其他统计学

arXiv

Conformal-DP:通过Conformal Transformation对黎曼式歧杆菌进行微分隐私

差分隐私(DP)已经通过在信息发布中添加扰动来作为私人数据共享的保障。以前对DP的研究已经超越了扁平的欧几里得空间的数据,并通过在大地测量距离上添加扰动来处理弯曲歧管的数据,例如扩散张量MRI,社交网络或器官形状分析。然而,现有的流形感知DP方法依赖于样本均匀分布在流形中的假设。在现实中,数据密度各不相同,导致多路地区存在有偏见的噪音不平衡,削弱了隐私-效用的权衡。为了解决这一差距,我们提出了一种新的机制:Conformal-DP,利用黎曼流形上的构象变换来平衡局部样本密度,并相应地重新定义大地测量距离,同时保留流形的内在几何形状。我们的理论分析产生了两个主要的结果。首先,我们证明从局部内核密度估计值计算的一致性因子是显式数据密度感知的;第二,在构象度量下,该机制满足任何完整的黎曼流形的ε-差分隐私,并承认在预期的大地测量误差上有一个闭合的上限,该误差仅取决于最大密度比,而不是流形的全球曲率。我们的实验结果证实该机制实现了高效用,同时为同质和特别是异构流形数据提供了ε-DP保证。

密码学与安全微分几何其他统计学

arXiv

作为统计推断基础的类比

可以说,标准统计理论是不适合构建令人满意的完全通用框架进行统计推断的基础。例如,速频理论从未接近提供这样一个一般性的推断框架,这不仅归因于围绕这一理论的健全性的问题,而且归因于它专注于试图解决仅在某些特殊情况下如何进行统计推理的问题。此外,推理理论是基于从一组普遍接受的公理中推断出基于样本的推断,例如许多旨在证明贝叶斯推理和不准确概率理论的理论,很难找到足够弱到广泛接受的公理,但足够强大,导致推理方法被认为是有效的。这些观察证明有必要寻找另一种方法,通过这种手段可以进行统计推断,特别是探索类比提供的方法。这里介绍的,走这条路。需要明确的是,这样做的方式不是简单地赞同类比作为理解统计方法如何工作的补充手段的通用方法,而是正式发展类比作为执行统计推断的一般框架的基础。在论文的后半部分,通过将其中包含的一些最重要的类比应用于一个相对简单但可以说是尚未解决的统计推断问题来说明这一框架的使用,这自然导致了解决与巴特利特和林德利悖论有关的问题的原创方式。

其他统计学统计方法论

arXiv

混合汇总统计:超越功率谱的神经弱透镜推理

在推理问题中,我们通常具有域知识,这使我们能够定义汇总统计数据,以捕获数据集中的大部分信息内容。在本文中,我们提出了一种混合方法,其中基于物理的摘要通过一组压缩神经摘要统计数据进行增强,这些摘要经过优化,以提取未由预定义摘要捕获的额外信息。由此产生的统计数据是对基于模拟或隐含的模型参数推断的非常强大的输入。我们将这种信息最大化神经网络(IMNN)的广义应用于断层扫描弱引力透镜收敛映射的参数约束,以找到明确优化的汇总统计数据,以补充角功率谱估计。我们研究低噪声和低噪声系统中的几种暗物质模拟分辨率。我们表明,i)信息更新形式主义提取的信息更新至少3×和高达8×与所有噪声系统中的角功率谱一样多的信息,ii)网络摘要与现有的2点摘要高度互补,iii)我们的形式主义允许具有较小的物理消息架构的网络与更大的回归网络相匹配,并且获得渐近最佳推理所需的模拟要少得多。

宇宙学与星系外天体物理学机器学习计算物理学机器学习 (统计)

arXiv

父母对出生体重的印记:低资源产前护理新生儿预测的数据驱动模型

准确的胎儿出生体重预测是产前护理的基石,但传统方法通常依赖于在资源有限的环境中仍然无法进入的成像技术。这项研究提出了一种新的基于机器学习的框架,它绕过了这些传统的依赖关系,使用不同的生理,环境和父母因素来完善出生体重估计。多阶段特征选择管道将数据集过滤成优化的子集,展示了以前未充分开发但临床相关的胎儿生长预测因子。通过集成高级回归架构和集成学习策略,该模型捕获了传统方法通常忽略的非线性关系,提供了一种既可解释又可扩展的预测解决方案。除了预测准确性之外,这项研究还解决了一个问题:在没有常规诊断工具的情况下,是否可以可靠地估计出生体重。这些发现通过引入一种替代途径来挑战根深蒂固的方法,在不损害临床效用的情况下提高可访问性。虽然存在局限性,但该研究为产前分析的新时代奠定了基础,其中数据驱动的推理与既定的医疗评估竞争,并可能重新定义。通过将计算智能与产科科学联系起来,这项研究为孕产妇-胎儿保健的公平,技术驱动的进步建立了一个框架。

其他统计学

arXiv

因果发现和推理的因果假设的概念综合

这项工作提出了因果发现和推理框架的概念综合,重点是基础假设 - 因果充分性,因果忠实度和因果马尔可夫条件 - 是如何在方法传统中正式化和操作的。通过结构化表和比较摘要,我绘制了多个因果框架的核心假设、任务和分析选择,突出了它们的联系和差异。该合成为设计因果研究的研究人员提供了实用的指导,特别是在观察或实验约束挑战标准方法的环境中。本指南涵盖因果分析的所有阶段,包括问题制定,背景知识的正规化,选择适当的框架,选择研究设计或算法以及解释。它旨在作为一种工具,以支持跨不同经验领域的严格因果推理。

统计方法论定量方法应用统计学其他统计学

arXiv

使用手机衍生的人口估计和高分辨率噪声测量对飞机噪声暴露进行空间时间评估

飞机噪音暴露传统上使用静态居住人口数据和长期平均噪声指标进行评估,通常忽略了人类流动性的动态性质和操作条件的时间变化。这项研究提出了一个数据驱动的框架,将机场监控终端的高分辨率噪声测量与手机得出的事实人口估计值相结合,以精细的时空分辨率评估噪声暴露。我们开发每小时噪声暴露配置文件,并使用绝对计数和不等式指标(如基尼系数)量化跨区域和时间窗口受影响的个体数量。这不仅能够细致入微地检查谁暴露出来,而且何时何地集中注意力。在我们的案例研究机场,运行跑道模式导致噪声暴露的经常性空间变化。通过整合事实上的人口数据,我们证明相同的噪声操作可以根据人口存在的时间和地点产生不平等的影响,突出表明在暴露评估中考虑人口动态的重要性。我们的方法为设计对人群敏感的降噪策略提供了可扩展的基础,有助于更公平、更透明的航空噪音管理。

应用统计学其他统计学

arXiv

公平的硬币往往在同一侧降落:来自350,757次翻转的证据

许多人已经翻转了硬币,但很少有人停下来思考这个过程的统计和物理复杂性。我们收集了350,757枚硬币翻转,以测试由Diamonis,Holmes和Montgomery(DHM;2007)开发的人类硬币抛掷物理模型的反直觉预测。该模型断言,当人们翻转普通硬币时,它倾向于降落在它开始的同一侧 - DHM估计同侧结果的概率约为51%。我们的数据有力地支持了这种精确的预测:硬币更经常地落在同一边,Pr(同一边)=0.508,95%的可信区间(CI)[0.506,0.509],BF_same-side偏倚=2359。此外,数据显示,这种同性偏见的程度在人与人之间发生了相当大的差异。我们的数据还证实了通用预测,即当人们翻转普通硬币时 - 随机确定的初始侧向 - 它同样有可能降落头或尾:Pr(heads)=0.500,95%CI[0.498,0.502],BF_heads-tails偏倚=0.182。此外,这种缺乏尾部偏见似乎并没有因硬币而异。额外的分析显示,随着更多的硬币被翻转,人与人之间的同边偏差下降,这种效果与实践使人们以不那么摇摆的方式翻转硬币的可能性一致。因此,我们的数据提供了有力的证据,表明当一些人(但不是全部)人翻转一枚公平硬币时,它往往会降落在它开始的同一面。

历史与综述数据分析、统计与概率其他统计学

arXiv

A Refreshment Stirred, Not Shaken (III): 交换可以区分私密吗?

寻求对本文标题中的问题进行精确和上下文接地的答案,导致了这个搅拌不动摇的三联画,这句话反映了我们深化理论基础,扩大实际适用性,减少对差异隐私(DP)x2014all的误解而不动摇其核心基础的愿望。事实上,鉴于存在超过200种DP(和计数)的配方,在试图回答标题问题之前,人们必须首先准确地说明DP的实际含义。在这个观察的激励下,对DP的基本本质进行了理论调查,导致了这个三人组的第一部分,它引入了一个五构建块系统,详细说明了DP的谁,在哪里,如何以及多少方面。第二部分在美国十年人口普查的背景下实例化了该系统,然后通过比较2010年使用的交换策略与2020年人口普查中采用的TopDown Algorithmx2014a DP方法,证明了DP的更广泛的适用性和相关性。本文提供了前两部分的非技术摘要以及新的讨论x2014,例如,关于提高对五个构建模块的认识如何阻止隐私戏剧;我们的结果如何弥合传统的SDC和DP允许数据托管人从这两个领域获得好处;不变性如何影响披露风险;以及如何消除对缓解不确定性的隐性依赖可能导致DP的新概括。

密码学与安全其他统计学

arXiv

理解和评价工程创造力:工程创造力评估工具(ECAT)的发展和验证

创造力在工程教育中至关重要,使学生能够开发创新和实用的解决方案。然而,由于缺乏可靠的特定领域工具,评估创造力仍然具有挑战性。传统的评估,如创意思维的托伦斯测试(TTCT)可能无法完全捕捉工程创造力的复杂性。本研究介绍并验证了工程创造力评估工具(ECAT),该工具专为工程环境而设计。 ECAT与199名完成动手设计任务的本科生进行了测试。五名经过培训的评分员使用ECAT术语对产品进行了评估。探索性和证实性因素分析支持四因素结构:流畅性,独创性,认知灵活性和创造性优势。使用TTCT分数检查可靠性高,收敛性和歧视性有效性,揭示了支持ECATs域特异性的适度相关性。 ECAT为评估工程教育的创造力提供了一个可靠,有效的框架,并为教育工作者提供可操作的反馈。未来的工作应审查其跨学科和教学环境的更广泛适用性。

其他统计学

arXiv

No more items to load.

其他统计学研究快报

用 AI 跟踪日新月异的其他统计学领域进展

小额供资机构排名基本模式

相关话题

最新研究

小额供资机构排名基本模式

慢性心力衰竭的预测模型

先验的问题,还是后辈的问题?

反对经验性人AI对齐的统计案例

Conformal-DP:通过Conformal Transformation对黎曼式歧杆菌进行微分隐私

作为统计推断基础的类比

混合汇总统计:超越功率谱的神经弱透镜推理

父母对出生体重的印记:低资源产前护理新生儿预测的数据驱动模型

因果发现和推理的因果假设的概念综合

使用手机衍生的人口估计和高分辨率噪声测量对飞机噪声暴露进行空间时间评估

公平的硬币往往在同一侧降落:来自350,757次翻转的证据

A Refreshment Stirred, Not Shaken (III): 交换可以区分私密吗?

理解和评价工程创造力:工程创造力评估工具(ECAT)的发展和验证