专利检索入门:从零掌握现有技术检索的完整方法论
CNIPA.AI Team
技术博客
专利检索是一项外表平静、内含深度的技术性工作。许多初学者以为"在搜索框输入关键词"就是检索,实际上这只是检索工作的起点——真正决定检索质量的,是关键词的选取逻辑、分类号的运用能力、数据库特性的理解深度,以及结果筛选与分析的经验积累。
本文将从方法论到实操,系统介绍专利检索的完整知识体系。无论您是准备进行新颖性检索的发明人、开展竞争对手分析的企业 IP 团队,还是撰写检索报告的代理师,都能从中找到实用指引。
专利检索的目的分类
在动手检索之前,必须明确检索的目的,因为不同目的对应不同的策略和深度要求。
| 检索类型 | 目的 | 检索深度 | 典型场景 |
|---|---|---|---|
| 新颖性检索 | 判断发明是否存在现有技术 | 高,需尽量全面 | 申请前评估 |
| 创造性检索 | 寻找最接近现有技术 | 高 | 专利撰写支撑 |
| 侵权分析(FTO) | 确认实施自由度 | 极高,需覆盖有效专利 | 产品上市前 |
| 竞争对手监控 | 追踪竞争对手技术布局 | 中,持续更新 | 战略规划 |
| 技术趋势分析 | 了解领域技术发展路径 | 中,注重统计规律 | 研发立项 |
| 无效证据检索 | 寻找使目标专利无效的现有技术 | 极高 | 专利纠纷 |
关键原则:新颖性检索追求的是"尽量全面",而侵权分析(FTO)追求的是"不遗漏有效专利"——两者的侧重点不同,策略也应有所差异。
关键词策略:从单一词到检索式
关键词检索是最直观的起点,但也是最容易犯错的环节。
四维关键词扩展法
一个完整的关键词策略需要从四个维度展开:
1. 同义词与近义词 同一技术特征可能有多种表述。例如"显示屏"在专利文本中可能出现为"液晶显示器""LCD""显示面板""显示装置""屏幕""荧幕"等。遗漏任何一种表述都可能导致漏检。
2. 上位概念与下位概念 "固态电池"是下位概念,"储能装置"是上位概念;"深度学习"是下位概念,"机器学习"是上位概念。检索时需要覆盖合理的上下位层次。
3. 技术功能描述 当技术特征无法用名词准确描述时,功能性描述是重要补充。例如"用于防止液体渗漏的密封结构"这类功能语言在早期专利中较为常见。
4. 跨语言扩展 专利数据天然是多语言的。CNIPA 数据库以中文为主,USPTO 和 EPO 以英文为主,JPO 以日文为主。对目标技术领域的中英双语关键词都要考虑到。
布尔运算符的正确使用
| 运算符 | 含义 | 使用场景 | 示例 |
|---|---|---|---|
| AND | 同时包含 | 缩小检索范围 | 固态电池 AND 固体电解质 |
| OR | 包含其一 | 扩展同义词 | 固态电池 OR 全固态电池 |
| NOT | 排除 | 过滤无关结果 | 电池 AND 锂 NOT 锂一次电池 |
| 引号" " | 精确短语 | 固定搭配词组 | "深度神经网络" |
| 截断符* | 词根扩展 | 覆盖词形变化(英文为主) | encrypt* → encrypt/encrypted/encryption |
| 邻近算符 | 词汇位置关系 | 限定词汇出现的距离 | W/3(前后3个词内) |
从关键词到检索式
一个完整的检索式需要将关键词和运算符组合成逻辑表达式。以"人脸识别门禁系统"为例:
(人脸识别 OR 面部识别 OR 人脸检测) AND (门禁 OR 门控 OR 入口控制) AND (系统 OR 装置 OR 设备)
英文版:
("face recognition" OR "facial recognition" OR "face detection") AND ("access control" OR "door control" OR "entry system")
IPC 和 CPC 分类号:检索的精准武器
纯关键词检索有一个根本性缺陷:技术方案相同的专利可能用完全不同的语言描述。分类号检索能够突破语言限制,直接定位技术主题。
IPC 分类体系结构
国际专利分类(IPC)采用树状分层结构:
H(电学大类)
└─ H01(基本电气元件)
└─ H01M(用于直接转变化学能为电能的方法或装置)
└─ H01M 10/00(蓄电池;其制造)
└─ H01M 10/05(含固体电解质的蓄电池)
常用技术领域的核心 IPC 分类号:
| 技术领域 | 核心 IPC 分类号 |
|---|---|
| 人工智能/机器学习 | G06N 3/00, G06N 20/00 |
| 计算机视觉 | G06V 10/00, G06V 40/00 |
| 自然语言处理 | G06F 40/00 |
| 半导体集成电路 | H01L 21/00, H01L 27/00 |
| 锂离子电池 | H01M 10/05, H01M 4/00 |
| 光伏发电 | H02S 10/00, H01L 31/00 |
| 无线通信 | H04W 72/00, H04L 27/00 |
| 医疗诊断 | A61B 5/00, A61B 6/00 |
如何查找正确的分类号
方法一:在 CNIPA 专利检索系统或 Espacenet 中搜索一篇已知的相关专利,查看其 IPC 分类号,然后以该分类号进行扩展检索。
方法二:使用 WIPO IPC 分类表(ipcpub.wipo.int),通过关键词在分类表中搜索对应的分类号。
方法三:使用 EPO 的 CPC 分类号浏览工具(worldwide.espacenet.com/classification),CPC 比 IPC 更细致,适合精确定位技术子领域。
CPC 与 IPC 的关系
CPC(合作专利分类)是由 EPO 和 USPTO 联合开发的,在 IPC 基础上进行了更细化的分类,大约有26万个分类组(IPC 约7万个)。CPC 只在 EPO(Espacenet)和 USPTO 的数据中使用,而 CNIPA 数据库使用自己的分类体系(与 IPC 兼容但有本土扩展)。
主流专利数据库详解与使用技巧
全球主要专利数据库各有侧重,掌握各自的优势和局限,才能根据检索目的选择合适的平台。
WIPO Patentscope
数据规模:超过8300万件专利文件,来自多个专利局,是检索 PCT 申请的首选平台。
核心功能:
- 支持9种语言界面
- CLIR(跨语言信息检索):输入一种语言,在多语言专利数据库中检索
- 命令行检索支持完整的布尔逻辑和字段限定
- PCT 申请全文免费查看
适用场景:PCT 国际申请检索、多语言跨语言检索、发展中国家专利数据。
检索技巧:Patentscope 的高级检索支持 TI:(标题)、AB:(摘要)、CL:(权利要求)等字段限定,结合使用可大幅提高精准度。例如:TI:solid electrolyte AND CL:lithium。
EPO Espacenet
数据规模:超过1.1亿件专利文件,来自97个国家,是覆盖面最广的免费专利数据库之一。
核心功能:
- 全文搜索(含全文机器翻译)
- CPC 分类号浏览和检索
- 专利家族查询(找到同一发明的各国同族专利)
- 法律状态查询(INPADOC)
- Espacenet OPS API 供开发者使用
适用场景:欧洲专利检索、全球专利家族分析、法律状态追踪。
检索技巧:使用"Smart search"可以直接输入自然语言查询,Espacenet 会自动解析并在标题/摘要中搜索。对于专业检索,推荐切换至"Advanced search",可精确限定字段和日期范围。
CNIPA 专利检索及分析系统
数据规模:收录中国专利全量数据,截至2025年累计超过5900万条,包括发明公开、发明授权、实用新型和外观设计。
访问地址:pss-system.cnipa.gov.cn(需注册登录)
核心功能:
- 常规检索、高级检索、命令行检索三种模式
- 全文检索(含说明书全文)
- 法律状态实时更新
- 专利分析工具(申请趋势、申请人分析等)
- 附图下载
适用场景:中国专利现有技术检索、国内申请人竞争分析、CNIPA 法律状态确认。
检索技巧:CNIPA 系统支持命令行检索语法,效率高于 GUI 检索。基本语法:TI=关键词 AND AB=关键词 AND IPC=H01M。针对中文分词问题,建议使用"$"符号进行精确短语检索。
商业专利数据库对比
| 平台 | 数据规模 | AI功能 | 价格 | 适用对象 |
|---|---|---|---|---|
| PatSnap | 1.7亿+ | 语义检索、技术景观图 | 企业定制 | 大型企业/律所 |
| Incopat | 1.5亿+ | 中文语义、专利地图 | ~3万元/年 | 国内企业 |
| Derwent Innovation | 1亿+ | 标准化题目、摘要增强 | 高 | 跨国企业/律所 |
| Orbit Intelligence | 1.5亿+ | 家族分析、价值评估 | 高 | 大型企业 |
| Lens.org | 3亿+ | 基础AI辅助 | 免费 | 学术研究 |
| Google Patents | 1.2亿+ | 相似性检索 | 免费 | 入门用户 |
专利家族与法律状态检索
为什么需要查找专利家族
一项发明通常会在多个国家申请专利,这些申请共同构成一个"专利家族"。了解专利家族有以下意义:
- FTO 分析:一件中国专利无效了,但其美国同族专利依然有效,可能仍构成侵权风险
- 追踪发明人:同族专利往往会出现更详细的技术描述(后续国家申请通常补充了更多实施例)
- 评估保护范围:不同法域的权利要求范围可能不同,了解家族有助于全面评估保护边界
查找方法:在 Espacenet 中,检索到目标专利后,点击"Patent family"标签即可查看所有同族专利及其法律状态。
法律状态的关键状态
| 法律状态 | 含义 | FTO 影响 |
|---|---|---|
| 审中(Pending) | 申请尚在审查,未授权 | 低风险,但需监控 |
| 有效(Active/Granted) | 已授权,处于保护期内 | 高风险,需关注权利要求范围 |
| 终止(Lapsed/Abandoned) | 未缴年费或放弃,失效 | 无风险 |
| 届满(Expired) | 超过最长保护期(发明20年) | 无风险,技术进入公有领域 |
| 无效(Invalidated) | 经无效程序宣告无效 | 无风险 |
检索报告的撰写规范
完成检索工作后,通常需要将检索过程和结果整理为正式的检索报告。以下是标准检索报告的结构框架:
标准检索报告结构
一、检索目的 明确说明本次检索的具体目标(新颖性检索/FTO 分析/竞争对手监控等)和技术范围。
二、检索数据库 列出检索所用的全部数据库及检索日期,说明数据库的覆盖范围。
三、检索策略 详细记录关键词、分类号和布尔逻辑的组合方式。这部分对于报告的可重复性至关重要。
示例检索式:
数据库:CNIPA + Espacenet
检索式1:TI=(人脸识别 OR 面部识别) AND IPC=G06V40/16 AND 申请年份:2020-2024
检索结果:234件
检索式2:AB=(face recognition OR facial recognition) AND CPC=G06V40/16
检索结果:1,567件
四、检索结果统计 列出各检索式的命中数量和经筛选后的相关文件数量。
五、最接近现有技术分析 对筛选出的最相关文件进行详细分析,说明其与目标发明的异同。
六、结论 基于检索结果,给出明确的结论意见(如"未发现破坏新颖性的现有技术文件"或"存在X件高度相关的现有技术文件")。
AI 辅助检索的新趋势
2024-2025年,AI 辅助专利检索工具快速成熟,主要体现在以下三个方面:
语义检索:突破关键词检索的语言局限,基于语义相似度找到描述相同技术方案但使用不同词汇的专利。PatSnap、Incopat 等平台均已集成语义检索能力。
跨语言检索:输入中文,自动匹配英文、日文、德文专利;输入英文,自动匹配中文专利。对于需要进行全球性现有技术检索的场景,效率提升显著。
智能摘要与分类:AI 自动对检索结果进行相关性评分和摘要提取,将人工筛选1000件专利的工作量压缩到关键文件的精读。
值得注意的是,AI 检索工具的召回率和精确率因平台和技术领域不同而存在较大差异。建议在重要检索任务中,将 AI 语义检索与传统关键词+分类号检索结合使用,以两种方法互相验证、补充。
实操清单:新颖性检索七步法
- 1. 明确检索目的和技术主题,限定保护权利要求的核心技术特征
- 2. 制定四维关键词清单(同义词、上下位概念、功能描述、跨语言)
- 3. 查找2-3个对应的 IPC/CPC 分类号
- 4. 在 CNIPA 系统完成国内专利检索(重点覆盖近10年)
- 5. 在 Espacenet 或 Patentscope 完成国际专利检索
- 6. 对命中结果按相关度筛选,精读前20-50件最相关文件
- 7. 整理检索报告,记录策略、结果和结论