Analyzing Patterns and Influence of Advertising in Print Newspapers
N Harsha Vardhan, Ponnurangam Kumaraguru, Kiran Garimella
本文使用新颖的数据驱动方法调查了印度各地印刷报纸的广告实践。 我们开发一种采用图像处理和OCR技术的管道,以高精度地从印刷报纸的数字版本中提取文章和广告。 将这种方法应用于跨越多个地区和三种语言(英语,印地语和泰卢固语)的五家流行报纸,我们收集了超过12,000个版本的数据集,其中包含数十万个广告。 这些报纸共有1亿多读者。 利用这个广泛的数据集,我们进行全面分析,以回答有关平面广告的关键问题:谁做广告,他们宣传什么,什么时候做广告,他们在哪里投放广告,以及他们如何做广告。 我们的发现揭示了重要的模式,包括过去六年印刷广告的一贯水平,尽管印刷发行量下降,公司广告在突出页面上的过度代表性,以及政府广告贡献的不成比例的收入。 此外,我们检查报纸上的广告是否影响广告主收到的报道。 通过对覆盖量和情绪的回归分析,我们发现强有力的证据支持企业广告商的这个假设。 结果表明,一个明显的趋势,广告的增加与更有利和广泛的媒体报道有关,这种关系随着时间的推移和不同程度的广告客户受欢迎程度仍然强劲。
This paper investigates advertising practices in print newspapers across India using a novel data-driven approach. We develop a pipeline employing image processing and OCR techniques to extract articles and advertisements from digital versions of print newspapers with high accuracy. Applying this methodology to five popular newspapers that span multiple regions and three languages, English, Hindi, and Telugu, we assembled a dataset of more than 12,000 editions containing several hundred thousand...