同一领域产品的专利技术具有高技术关联度等特征,企业在生产经营活动中面临着专利侵权的潜在风险,立足于企业专利侵权预警的实际需求,高效、准确地检测产品存在的专利侵权风险具有重要意义。由此,本文提出了专利侵权风险预警模型,该模型重新定义了领域专利知识图谱、产品技术方案图谱的模式层,涵盖了组件实体、结构实体和功效实体三类实体类型,以及组成关系、相对位置关系、连接关系和功效达成关系四类实体关系;基于BERT(bidirectional encoder representations from transformers)和BiLSTM(bi-directional long short-term memory)模型构建专利知识图谱和产品技术方案知识图谱;基于ComplEx模型实现知识图谱的嵌入,实现产品和专利技术之间相似度的量化计算,并根据专利侵权风险指数做出侵权预警。以空气加湿器和耳机两类产品进行实证研究,专利侵权预警准确率为86.67%,具有一定的应用价值。
在科学研究过程中,科研人员需要考虑针对不同的研究问题选择合适的研究方法,有时还会对研究方法进行优化,从而更好地解决研究问题。因此,研究方法往往是解决研究问题的关键,是学术文献的重要知识。帮助科研人员快速发现学术文献全文内容中蕴含的方法实体,为其推荐适用于自身研究问题的关键解决方法提供实践参考,可以提高科研人员解决问题的效率。当前相关研究缺乏对方法实体之间共现关系的分析,未充分挖掘学术文献中蕴含的丰富知识。为此,本研究以自然语言处理领域为例,将方法实体细分为算法、数据集、指标以及工具4种类型,并标注了50篇论文作为训练语料。本研究构建了CRF(conditional random field)、BiLSTM(bi-directional long short-term memory)+CRF等4种实体抽取模型。研究结果表明,SciBERT(scientific bidirectional encoder representations from transformers)+CRF模型的性能最优。以ACL年会(Annual Meeting of the Association for Computational Linguistics)在2001—2020年共20年收录的论文全文数据为基础,进一步分析抽取出的方法实体的使用情况。本研究结合经典关联规则挖掘算法Apriori和卡方值构建方法实体共现数据集,并分析方法实体的演化。研究结果揭示了方法实体间的共现关系及其整体演化情况,可辅助特定领域的科研人员寻找合适的研究方法。
暂无评论