Seeing Through Green: Text-Based Classification and the Firm's Returns from Green Patents
Lapo Santarlasci, Armando Rungi, Antonio Zinilli
本文介绍了自然语言处理,用于从官方证明文件中识别“真正的”绿色专利。 我们开始对大约1240万项专利进行培训,这些专利从以前的文献中被归类为绿色。 因此,我们训练一个简单的神经网络,通过与环境技术相关的表达式的向量表示来放大基线字典。 经过测试,我们发现“真正的”绿色专利约占以前文献中被归类为绿色的专利总数的20%。 我们通过技术类别展示异质性,然后检查“真正的”绿色专利在后续发明中引用的比例要低1%左右。 在论文的第二部分中,我们测试了欧盟专利与公司级金融账户仪表板之间的关系。 在控制反向因果关系后,我们表明至少持有一项“真正的”绿色专利可以提高销售,市场份额和生产力。 如果我们将分析限制在高新颖的“真”绿色专利上,我们发现它们也产生了更高的利润。 我们的研究结果强调了使用文本分析来衡量对不同领域决策有用的细粒度专利分类的重要性。
This paper introduces Natural Language Processing for identifying "true" green patents from official supporting documents. We start our training on about 12.4 million patents that had been classified as green from previous literature. Thus, we train a simple neural network to enlarge a baseline dictionary through vector representations of expressions related to environmental technologies. After testing, we find that "true" green patents represent about 20% of the total of patents classified as g...