Compass: General Filtered Search across Vector and Structured Data
Chunxiao Ye, Xiao Yan, Eric Lo
混合向量和关系数据的日益普及需要高效、普遍的支持,这些查询将高维矢量搜索与复杂的关系过滤相结合。 然而,现有的过滤搜索解决方案从根本上受到专业索引的限制,这些索引限制了任意过滤,阻碍了与通用DBMS的集成。 这项工作引入了指南针,这是一个统一的框架,可以实现跨矢量和结构化数据的一般过滤搜索,而无需依赖新的索引设计。 Compass利用已建立的索引结构 - 例如用于向量属性的HNSW和IVF,以及用于关系属性的B +树 - 实施原则性合作查询执行策略,协调跨模式的候选生成和谓词评估。 独特的是,Compass通过允许任意连接,分离和范围谓词来保持通用性,同时确保即使使用高度选择性或多属性滤波器的稳健性。 全面的实证评估表明,指南针在多种混合查询工作负载中始终优于 NaviX,这是唯一现有的高性能通用框架。 它还匹配其最喜欢的设置中专用单属性索引的查询吞吐量,仅涉及单个属性,同时保持完全通用性和DBMS兼容性。 总体而言,Compass提供了一个实用且强大的解决方案,用于在矢量数据库系统中实现真正通用的过滤搜索。
The increasing prevalence of hybrid vector and relational data necessitates efficient, general support for queries that combine high-dimensional vector search with complex relational filtering. However, existing filtered search solutions are fundamentally limited by specialized indices, which restrict arbitrary filtering and hinder integration with general-purpose DBMSs. This work introduces Compass, a unified framework that enables general filtered search across vector and structured data witho...