42digest首页
森林:Python中随机森林的共性预测

coverforest: Conformal Predictions with Random Forest in Python

Panisara Meehinkong, Donlapark Ponnoprat

arXiv
2025年1月24日

正态预测为不确定性量化提供了一个框架,特别是以预测间隔的形式,并设置无分布保证覆盖。 虽然最近的跨构技术,如CV +和Jackknife +-after-bootstrap,实现了比传统的分体构图方法更好的数据效率,但由于训练和测试样本的出袋分数之间需要进行配对比较,它们会产生大量的计算成本。 观察到这些方法自然地从集合模型,特别是随机森林中延伸,我们利用现有的优化随机森林实现来实现高效的跨构性预测。 覆盖森林(英语:Cumforest)是一个Python包,实现了专门针对随机森林优化的高效构象预测方法。覆盖林通过各种构象预测方法支持回归和分类任务,包括分裂构象、CV+、Jackknife+-after-bootstrap和自适应预测集。 我们的软件包利用并行计算和 Cython 优化来加速袋外计算。 我们的实验表明,覆盖森林的预测达到了预期的覆盖水平。 此外,它的训练和预测时间可以比现有的实现快2-9倍。 coverforest的源代码托管在GitHub上,网址是https://github.com/donlap/coverforest。

Conformal prediction provides a framework for uncertainty quantification, specifically in the forms of prediction intervals and sets with distribution-free guaranteed coverage. While recent cross-conformal techniques such as CV+ and Jackknife+-after-bootstrap achieve better data efficiency than traditional split conformal methods, they incur substantial computational costs due to required pairwise comparisons between training and test samples' out-of-bag scores. Observing that these methods natu...