CheetahGIS: Architecting a Scalable and Efficient Streaming Spatial Query Processing System
Jiaping Cao, Ting Sun, Man Lung Yiu, Xiao Yan, Bo Tang
空间数据分析系统在学术界和工业界都进行了广泛的研究。 然而,在处理大量移动物体和实时空间查询时,现有系统是有限的。 在这项工作中,我们构建了一个可扩展且高效的系统CheetahGIS,用于处理大型移动对象的流式空间查询。 特别是,CheetahGIS建立在Apache Flink Stateful Functions(StateFun)之上,这是一种用于构建具有类似 Actor 模型的分布式流应用程序的 API。 CheetahGIS由于其模块化架构而享有出色的可扩展性,该架构明确分解了不同的组件并允许扩展单个组件。 为了提高 CheetahGIS 的效率和可扩展性,我们设计了一套优化,例如轻量级的基于全局网格的索引、元数据同步 tion 策略和负载平衡机制。 我们还在 CheetahGIS 中为空间查询处理制定了通用范式,并通过处理三个具有代表性的流查询(即对象查询、范围计数查询和 k 近邻查询)来验证其普遍性。 我们在真实和合成数据集上进行广泛的实验,以评估CheetahGIS。
Spatial data analytics systems are widely studied in both the academia and industry. However, existing systems are limited when handling a large number of moving objects and real time spatial queries. In this work, we architect a scalable and efficient system CheetahGIS to process streaming spatial queries over massive moving objects. In particular, CheetahGIS is built upon Apache Flink Stateful Functions (StateFun), an API for building distributed streaming applications with an actor-like model...