发布时间:2025-12-03 作者:admin
相较于传统的布尔检索,语义检索额外增加了一个步骤,即依据与给定目标的语义相关程度,对检索结果重新进行排序。
如上图所示,当圈定小人后,我们依据从大到小的顺序对小人进行排序,如此一来,在靠前的位置就能得到我们所需要的大小人。专利检索与之类似,在圈定专利集之后(比如借助领域关键词或者 IPC 分类号来圈定),我们设定一个语义排序标准,该标准可以是一个专利(号码)、一段话亦或是一个关键词,接着依据与这个标准语义相关度的高低,对圈定的专利集重新进行排序,最相似的专利便会排在最靠前的位置,这样我们就能高效地获取到想要的专利文献。
Patentics中语义检索命令为R/,其中R即是Rerank的缩写,也就是重排序的意思。R/命令后可以输入文字内容或者专利号码,输入专利号码时,系统会自动提取该篇专利的全文文本进行语义检索。
为了满足审查员日常新颖性检索需要,Patentics还提供RDI/命令,后可跟专利号码,含义是检索该专利申请日前公开的最接近专利文献。
当单独运用R/命令或者RDI/命令时,系统会针对全库开展语义重排序,不过仅会呈现最具相关性的400篇专利文献。这是由于系统在给出检索结果之际,已把相关性更高的置于最前端,排名400之后的文献,其相关程度会逐渐降低,所以存在默认的截断情况。要是大家希望查看更多内容,能够运用CTOP/命令来限定所要查看的专利数量,比如输入CTOP/1000,就能查看最相关的1000篇。
上图能够简要阐释R/命令的执行流程,大致可分为三个步骤。第一步,系统针对整个专利数据库里的每篇专利全文进行关键词抽取,把每篇专利都转化为一个由多个词组成的文档向量,随后利用这些数量众多的文档向量来训练语义模型。实际上,这就是前文提及的将原本处于不同空间、用不同标尺衡量的向量,都转换到相同的语义向量空间内,从而可以在同一个坐标系中对它们进行测量,让它们具备可比性。
第二步就是我们输入一个专利申请号或文本内容进行检索,系统同样会对其抽取关键词,转换为一个文档向量。然后使用训练好的语义模型对其进行向量合成,将我们输入的内容也放到语义向量空间模型中。
第三步就是将我们输入内容的文本向量和数据库中的专利的文本向量进行向量运算,计算它与每篇专利的相关度,最后按照相关度从高到低,对数据库中的专利文献进行重新排序,我们就可以在靠前位置获得相关的专利文献了。
经过训练语义模型的专利数据库会有什么奇妙的变化呢?如上图所示,它实际上是学习了全球申请人的自然表达,建立了词与词之间、词与文档之间、文档与文档之间的大数据关联。
当我们在R/命令后输入“机器学习”一词,接着点击搜索框右下方的概念扩充小按钮,系统便会检索出与之相关的概念词。随后,系统会依据词与词之间的相关性,将这些概念词聚类成4个主题。比如,主题一下包含“文本分类”“基于语义”“挖掘方法”等属于机器学习应用场景范畴的词汇;主题二下涵盖“无监督”“朴素贝叶斯”“SVM”“半监督”等机器学习算法相关的词汇;主题三则有当下热门的“人工神经网络”“深度神经网络”等机器学习新算法的词汇;主题四下有“高维空间几何学”这类涉及机器学习原理方面的词汇。
大家可以发现,这些词汇并非全是“机器学习”的同义词,而是相关性较高的词。无论是加工的同义词词表还是本领域技术人员能扩展出的词汇,都无法与这样海量大数据运算和机器学习后得来的全库词汇之间相关关系相比。
同样地,在R/命令之后输入一个专利号码,接着点击搜索框右下方的概念扩充小按钮,此时系统也能够找出与该篇专利最为相关的词汇。通过查看这些词汇以及聚类的主题,便能够大致了解这篇专利适用于印刷电路相关的专利范畴。这就如同系统代替我们对这篇专利进行了自动解读。
如果想更炫一点,可以点击左侧“相关概念”框中的小书按钮,展示相关词词云。
那么语义检索的实际效果如何呢?我们通过一个案例给大家演示一下。
这件案例是握奇诉被告专利侵权,法院判赔5000万的专利,被告第一时间对握奇这件专利提起了无效请求,此专利被复审委判决部分无效,复审委认定公开其关键技术特征的关键证据是一篇中国专利CN1482550A。
传统布尔检索在检索这篇专利时需要进行关键词、分类号扩展等利用各种检索经验和技巧。而在Patentics中,仅需输入RDI/CN200510105502.1,也就是输入要无效专利的专利号码,检索其申请日前公开的相关专利文献。
于中国申请库内开展检索,输入“RDI/CN200510105502.1”,能瞧见最右侧呈现相关度百分比。其中,第一位相关度达100%的,正是CN200510105502.1专利本身;而第二位相关度为94%的,便是复审委所认定的关键证据。语义检索无需任何检索策略,仅查看一篇专利文献,就能获取关键无效证据。
在传统的布尔检索过程中,检索员处于一种两难境地。一方面,为防止出现漏检情况,会对关键词、分类号等检索要素加以扩展;另一方面,为降低浏览量,又会将文献限定在一个适宜范围来浏览。检索范围越窄,浏览所需时间固然会减少,然而漏检的风险却会大幅上升。这便是传统布尔检索所面临的检全与检准之间的矛盾。
语义排序巧妙地化解了传统检索方式中检全与检准之间的矛盾。当我们设定浏览范围时,能够将范围设置得更为宽泛,无需担忧文献浏览方面的问题。这是由于语义排序会把相关性更高的文献排列在靠前的位置,方便我们浏览。换言之,既不会出现漏检的情况,又能够在靠前的位置找到所需文献,成功解决了查全与查准这一矛盾。 以上就是KK下载为大家分享介绍的Patentics专利检索方法!
《英勇之地》火、冰、雷以及物理属性毕业魂卡推荐
攻略 · 2025-12-03 15:58:05
如何调整javplayertrial的数值?JavPlayerTrial的使用方式是什么?
攻略 · 2025-12-03 15:55:06
《抖音火山版》火苗赠送方式
攻略 · 2025-12-03 15:52:06
夜莺传说卡牌系统该怎么玩?夜莺传说卡牌系统玩法攻略在此
攻略 · 2025-12-03 15:49:12
《抖音火山版》如何提现到微信
攻略 · 2025-12-03 15:46:05
艾尔登法环DLC包含哪些内容?艾尔登法环DLC内容解析
攻略 · 2025-12-03 15:44:04
发布于 2025-12-03 16:15:06
发布于 2025-12-03 16:12:17
发布于 2025-12-03 16:09:04
发布于 2025-12-03 16:07:04
发布于 2025-12-03 16:04:05
发布于 2025-12-03 16:01:05