ROI-based Deep Image Compression with Implicit Bit Allocation
Kai Hu, Han Wang, Renhe Liu, Zhilin Li, Shenghui Song, Yu Liu
基于兴趣区域(ROI)的图像压缩已经迅速发展,因为它能够在重要区域保持高保真度,同时减少数据冗余。 然而,现有的压缩方法主要应用口罩在量化之前抑制背景信息。 这种使用硬门的显式位分配策略会显著影响熵模型的统计分布,从而限制了压缩模型的编码性能。 作为回应,这项工作提出了一个有效的基于ROI的深度图像压缩模型,具有隐式位分配。 为了更好地利用ROI面罩进行隐式位分配,本文提出了一个新的掩码引导功能增强(MGFE)模块,包括区域自适应注意力(RAA)块和频率空间协作注意力(FSCA)块。 该模块允许在不同区域灵活分配位,同时通过频率空间域协作增强全局和本地功能。 此外,我们使用双解码器来单独重建前景和背景图像,使编码网络能够以数据驱动的方式最佳平衡前台增强和背景质量保存。 据我们所知,这是第一个利用隐式位分配进行高质量区域适应编码的工作。 COCO2017数据集的实验表明,我们基于隐式的图像压缩方法在速率扭曲性能方面明显优于显式位分配方法,在重建的背景区域保持令人满意的视觉质量的同时,实现最佳结果。
Region of Interest (ROI)-based image compression has rapidly developed due to its ability to maintain high fidelity in important regions while reducing data redundancy. However, existing compression methods primarily apply masks to suppress background information before quantization. This explicit bit allocation strategy, which uses hard gating, significantly impacts the statistical distribution of the entropy model, thereby limiting the coding performance of the compression model. In response, ...