中文版 | English

研究与观点

研究与观点

RESEARCH & IDEAS

亮出专利“软”名片 ——专利文本信息自动化分析

当前位置:首页 > 研究与观点

亮出专利“软”名片 ——专利文本信息自动化分析

更新:2014年05月21日点击:12839

北京集慧智佳知识产权管理咨询有限公司  咨询师   曹之晨


摘要:在商业上专利情报可用于指导企业的技术创新、知识产权的布局与战略,对已有专利信息进行分析就显得尤为重要。本研究的目标是将专利信息的统计分析与可视化由计算机自动完成,减少人工操作,提高效率。本研究借助Excel工具进行函数编程以实现自动化提取专利信息,特别针对法律状态相关的数据,设计出自动计算专利失效日期进而自动统计专利法律状态的方法,最后利用数据透视图进行呈现。

关键词:专利法律状态,自动化统计分析,专利信息可视化。


1 引言

      专利信息是企业的重要信息之一,直接影响企业知识产权战略的布局和决策。如何地高效利用专利信息资源,提高企业的竞争优势地位,促进企业的创新发展,成为现代企业不容忽视的课题。
面对复杂的专利数据,人们大多采用人工干预的方法来获得结果。对于多件专利很少通过不同维度进行分析统计;对于法律状态等需要加工处理的数据,大多只是简单地通过正负号等来反映专利的法律状态。当我们要获取一个专利池专利或者一家大型公司专利的情报信息时,单纯的人工干预就显得费时费力。本研究利用Excel对专利文本信息,特别是专利法律信息的自动化分析工具做了一些研究。


2 专利文本信息的处理

2.1 专利数据的导出

      本研究采用的原始数据从Derwent数据库导出。从数据库导出的原始数据表,下文简称为CITE表;再导出一张国家代码表,下文简称为NATION表。


图1 CITE表-部分(数据来自Derwent数据库)


图2 NATION表-部分(数据来自集慧智佳 的李可老师)



2.2 专利数据的查找和引用

      通过查找引用函数VLOOKUP,我们可以得到某个专利公开号对应的信息,包括专利申请号、申请时间、授权时间、同族信息、引证信息、技术分类、权利要求项等。如图3所示,基于公开号,实现自动查找专利对应的引证信息、同族信息和技术分类等。通过排序和不同颜色标引,我们还可以判断每个国家/企业都有哪些专利,哪些专利属于同族专利,是否属于同一个技术领域或技术分支。


图3 专利同族信息和引证关系等

     VLOOKUP函数是一个纵向查找函数,返回该列所需查询列序列所对应的值,查找的对象必须是数据表中第一列的数据(数值、引用或文本字符串),找不到对应的数据则传回错误值#N/A。LEFT函数返回的是字符串表达式从最左边起指定数目的字符。


2.3专利数据的统计

      专利信息分析在企业的发展中发挥至关重要的作用。有效利用专利文献取得专利情报,不但可以缩短研发时间和研发经费,还能提升竞争力和规避风险等。通过分析,可以获得某个技术专利的寿命或专利的生命周期等信息。如图4所示,通过统计函数,可以自动统计该技术专利在欧美日等国的到期时间,还可以用数据透视图反映出各国到期专利随年份的变化情况。


图4a专利的到期时间统计


图4b 用数据透视图统计专利到期时间


3 专利法律状态的自动化分析

      本研究以美国专利为例,讨论专利法律状态的自动化分析。虽然,其他国家地区的法律规定各有不同,需要分别对待,但总体思路是一致的。


3.1专利的有效期和剩余时间计算

      目前世界上大多数国家的专利有效期限都是从申请日期加上20年作为专利权的有效期限,但由于一些特殊原因,可能还会有延长期;而有些国家的专利法经历几次改法,不同时间段的专利计算规则也不同,例如美国的专利期限就不是单纯的一种计算方式。不同国家的专利可申请类型不同,美国就有发明专利、外观专利和植物专利,没有实用新型专利。本研究仅讨论美国发明专利的情况。
      美国专利法规定:如果该发明专利申请于1995年6月8日之前提交,专利期限为自该专利授权之日起17年,或自该申请的最早美国有效申请日起20年,二者取其时间较长者;如果该申请于1995年6月8日或以后提交,专利期限为自美国申请日起20年;如果该申请结合了对一个或多个在先申请内容的引用,专利期限为自最早申请日起20年;如果遇上法定节假日则顺延届满日至下一工作日。因此,美国专利有效期限的计算显得十分复杂,如果数条信息全部采用人工计算得出结论,则要耗费大量的时间精力,而且还可能算错。利用函数来计算,则可以节省大量的人力和时间。


图5 美国发明专利届满日计算

      IF函数可以对数值和公式进行条件检测,根据逻辑计算的真假值,返回不同结果。ISBLANK函数用来判断指定的单元格是否为空,如果为空,ISBLANK函数将返回TRUE,否则将返回FALSE。IF函数和ISBLANK函数组合,就可以用来提取“输入时间”的信息。DATE函数返回代表特定日期的序列号。DATEDIF函数返回两个日期之间的间隔天数。


3.2 专利的年费情况
      专利权人自授权日起,一直到专利届满日,每年都需要缴纳一定的费用。按时缴纳年费是维持专利权有效的前提。因此,了解专利缴纳年费的规则和具体专利年费的缴纳情况,不但可以帮人们发掘和利用因未缴年费提前失效的专利,而且可以提醒企业该缴纳专利年费的时间以避免不必要的费用和损失。本研究仅讨论美国专利缴费情况。
美国专利年费从授权日开始计算(非自然年),专利授权领证的时候需要缴纳1-4年的年费;随后,缴费窗口有三次开放时间:在第3-4年间缴纳第5-8年的年费,其中第3-3.5年属于缴纳年费的正常时间,第3.5-4年属于宽限期,要额外补交附加费;在第7-8年间缴纳第9-12年的年费,其中第7-7.5年属于缴纳年费的正常时间,第7.5-8年属于宽限期,要额外补交附加费;在第11-12年间缴纳所余维持专利权需要的年费,其中第11-11.5年属于缴纳年费的正常时间,第11.5-12年属于宽限期,要额外补交附加费;以上日期如遇法定节假日顺延至下一工作日;超过以上缴费时间未缴年费,专利就失效了,如果有正当理由,需提出恢复专利权请求并补交所欠年费和恢复费,才可恢复因未缴年费丧失的专利权。


6 专利的年费缴纳信息



      如图6所示,用DATE函数和IF函数,可以实现基于公开号自动获取相应专利的年费缴纳信息。


3.3 专利的失效时间和法律状态判断

      专利的失效原因通常有以下几种:(1)专利届满到期而失效;(2)提前终止专利权而失效,如没有在规定时间内缴纳专利年费、专利权人放弃专利权而失效;(3)经行政或司法程序被裁定专利无效。本研究讨论的专利失效,当然会受到能够获得的数据的限制,例如,如果(2)和(3)相关的数据未能获得,就不会体现到处理结果当中,但这并不影响数据处理方法的正确性和价值。


图7 专利的法律状态判断

     MID函数从一个字符串中截取出指定数量的字符。MID函数和FIND函数结合,实现了对单元格内指定字符的自动提取(如有多个重复,提取最先出现的)。如图7所示,基于公开号可以自动判断相应专利的法律状态。



3.4专利的法律状态统计

     了解专利的法律状态,可以在产品进入市场或出口贸易中避免侵权纠纷;技术引进时,掌握谈判的主动权。专利许可在当今国际贸易中占据重要的地位,如果不利用专利文献指导贸易活动的话,可能会造成重大经济损失。在侵权纠纷中,首先要确认专利权的法律状态,只有确定了专利的有效性,才对专利权保护的技术方案进一步进行侵权判断。可见,专利文献的利用对企业的发展具有很大的指导意义,专利法律情报的分析在企业的技术创新中发挥很高的重要性。


3.4.1 数据统计表

     如果我们想要统计某个技术领域的专利在不同国家地区的法律状态(无效、失效、有效等),如图8所示,专利状态统计数据列表的形成。


图8 不同国家地区的专利状态统计

      SUMPRODUCT函数返回相应的区域或数组乘积的和,非数值型的数组元素作为0处理。ISNUMBER函数可以判断引用的参数或指定单元格中的值是否为数字。FIND函数用来定位数据中的某个字符串,如果找到数据,则返回字符位置序号,如果找不到则返回错误值#VALUE!;适合于在搜索范围内仅出现一次的数据,如果是多个相同数据只返回最先被找到的数据的位置序号。INDIRECT函数用来引用单元格并计算。
ISNUMBER函数和FIND函数组合,可以用来代替人工判断专利的法律状态。ISNUMBER函数判断FIND函数返回的值:FIND函数找到了结果返回数字,ISNUMBER函数则返回1;FIND函数没有找到结果返回错误并非数字,ISNUMBER函数则返回0。FIND函数和SUMPRODUCT函数的结合就实现了统计计数的功能;和COUNTIF函数有些相似,但比COUNTIF应用更广,适合判断是否符合多重条件并统计。


3.4.2 数据透视图

      除了用数据统计表自动获得统计结果,如图9所示,我们还可以通过数据透视图订制或筛选出可视化的信息。


9 用数据透视图统计专利法律状态




4 总结

     本研究利用Excel的功能对专利文本信息的自动化和可视化进程做了如下开发:基于公开号对专利数据进行自动查找引用和分类,并实现了自动化统计专利数据,还利用数据透视图自动将统计结果变成图表。本研究有效将专利文献转化为专利情报,为企业缩短研发时间和研发经费,提升竞争力和规避风险等做出很大的贡献。特别是取代了人工判断专利的法律状态,实现了自动计算专利权的有效期限和年费情况;自动判断并统计专利的法律状态,随后形成图表,对企业知识产权的布局和战略具有很大的指导意义。