2024年4月,《 生物医药趋势 》发布了一篇关于人工智能(AI)药物发现技术发展历程的全面综述,以2012年现代深度学习技术的诞生为起点。该综述特别重点介绍了该领域9家领先企业,这些企业"能够从头设计并推进候选药物(主要是小分子药物),且拥有内部研发管线"。
鉴于专利权在制药和生物技术领域的关键地位以及迫在眉睫的专利悬崖,我们分析了能否从这9家代表性企业的专利组合中归纳趋势或推导策略[1]。本文作为两部分系列的第一篇,通过提出若干问题来剖析这些企业的专利战略,并对其专利组合提出高层次的结论。 第二部分将深入探讨这些组合如何运用分析工具与策略实现高效组合开发,并为该领域专利战略的制定与执行提供实用框架。
专利组合分析
以下是一些关键问题,有助于理解九家人工智能药物研发公司的专利组合,包括它们与大型制药公司专利组合的对比情况:
- 这些公司是否在保护其人工智能/机器学习(ML)技术的同时,也保护了传统制药技术(例如药物配方、体内测试、湿实验室筛选等)?
- 在人工智能/机器学习与传统技术之间,是否存在随时间推移的趋势?
- 这些专利组合与这些公司公开宣称的重点目标之间的契合度如何?
- 这些专利组合与针对相同目标的美国有效专利/待审申请总量相比如何?
以下是对数据[2]的初步评估,可帮助解答这些问题:
1. 创作与人工智能/机器学习保护及发展趋势
表1列出了可明确归类(基于关键词[3])的专利资产总量,区分了用于药物组合物或其他传统技术的保护与人工智能/机器学习或其他计算优先技术的保护。
表1. 专利申请概况(涵盖所有企业的全部美国专利资产)
| 公司名称 | 药品成分/传统技术申报(占总数百分比) | 人工智能/机器学习申报(占总数百分比) | 总计 |
| 总计 | 263 (67) | 127 (33) | 390 |
如表1所示,整体专利申请量相对于人工智能/机器学习(及计算)领域的申请量,更倾向于传统制药领域。但这可能反映出某些企业在拓展人工智能/机器学习业务之前,历史上在传统领域拥有更多专利申请。
2. 时间趋势
图1展示了自2012年以来各类别专利申请数量。这些企业的专利申请量在人工智能/机器学习与传统技术领域均呈现增长趋势,其中传统技术领域的占比更高。此类趋势既反映了企业专利布局的扩张,也体现了这些企业相对较新的成立背景。
图1. 按类别划分的申报趋势

3. 投资组合 -> 目标映射
这些公司的假设是,它们会构建专利保护体系以契合其已公开的重要目标:最典型的专利策略是将专利申请与关键商业优先事项保持一致。下表2列出了已公布的各项目标,并根据专利组合中目标关键词检索结果,统计了对应目标的专利申请数量。[4][5]
表2. 目标映射
| 目标 | 常规申报 | 人工智能/机器学习申报文件 |
| 3CLpro | 2 | |
| A2aR | 1 | |
| APJR | 1 | |
| Bcr-Abl | ||
| CDC7 | ||
| CDC7 | ||
| CDK2 | 1 | |
| CDK7 | 1 | |
| 细胞周期蛋白依赖性激酶 | 2 | 1 |
| CHK1 | ||
| cMYC | ||
| DGKA | 1 | |
| EFGR(C797S) | 10 | |
| ENPP1 | ||
| ENPP1 | ||
| 雌激素受体α亚型 | 8 | |
| FGFR2 | 10 | |
| FGFR2/3 | 1 | |
| 组蛋白去乙酰化酶 | 1 | |
| 缺氧诱导因子-2α | ||
| HPK1 | ||
| HPK1 | ||
| HSP90 | 7 | |
| JAK2 | 1 | |
| KAT6 | ||
| LPA1R | ||
| LRRK2 | ||
| LSD1 | ||
| MALT1 | ||
| MALT1 | ||
| MAT2A | 1 | |
| MEK1,MEK2 | ||
| Mpro | ||
| MYT1 | ||
| NLRP3 | ||
| NLRP3 | ||
| NLRP3 | ||
| PARP1 | ||
| PARP7 | ||
| PDE10 | ||
| PHD1/2 | 1 | |
| PI3Kα | 10 | |
| PIKfyve | ||
| PKC,GSK3β | 1 | |
| PKC-θ | 1 | |
| PRMT5-MTA | ||
| QPCTL | ||
| RARαβ | ||
| RBM39 | 1 | |
| ROCK 1/2 抑制剂 | ||
| S1P1激动剂 | ||
| SHP2 | 10 | |
| SOS1 | ||
| TEAD | 1 | |
| TNIK | 2 | |
| TrkA、TrkB、TrkC | ||
| TYK2 | 2 | |
| USP1 | 1 | |
| USP28 | 5 | |
| USP7 | 6 | |
| WEE1 | ||
| α4β7 | 1 | |
| Αvβ8 |
除两份外,其余人工智能/机器学习专利申请均未披露其核心目标。这引发了若干后续问题/假设,涉及这些专利组合的开发方式:
- 人工智能/机器学习技术的专利保护是否需要聚焦于特定目标?这可能取决于目标与人工智能/机器学习技术发展的关联程度,而非技术本身在不同目标间具有普遍适用性。
- 还有哪些因素会影响人工智能药物研发管线中关键靶点的选择?企业可能拥有与人工智能/机器学习技术深度融合的数据护城河,或是将公司整体使命目标与特定靶点紧密关联——即便人工智能/机器学习技术本身并不局限于这些靶点。
- 专利/知识产权资源是否被用于特定目标保护之外的其他目的?一方面,特别是对初创企业而言,明确知识产权保护的优先级至关重要,随后应依据这些优先级部署资源以保护创新成果。另一方面,资源优先级划分恰恰更应促使企业将知识产权资源聚焦于保护与商业优先级直接关联的核心技术。
- 目标是否是评估专利战略的有效替代变量?虽然目标便于对专利申请与公司公开信息进行初步筛选/直接比较,但其他需考虑的因素还包括适应症、药物类别,或专利申请中阐述的技术改进及人工智能技术应用场景的相关信息。
- 专利公开滞后如何影响预测?如前所述,从专利申请到公开通常存在18个月的滞后期,这使得最前沿的技术难以被及时捕捉。回顾《生物制药趋势》文章, 表1中列出的许多目标药物直至2022年或更晚才突破发现阶段,因此其对应的专利申请可能尚未公开。
4. 人工智能企业专利组合与整体格局的对比分析
为帮助理解企业的专利组合背景,可将其与整体专利格局进行对比,以目标专利作为替代指标,从而对企业在整体格局中所占份额进行数量级评估。
表3列出了针对这些目标以及最大申报者的美国申报总数近似值。鉴于表2所示申报数量稀少,本列表仅限于比较人工智能药物发现公司至少有一项申报的目标。
表3. 按目标划分的专利申请量与整体格局对比
| 目标 | 成分 | 人工智能/机器学习 | 美国总申报量(主要申报方总申报量) |
| 3CLpro | 2 | 3800 (100) | |
| A2aR | 1 | 6500 (120) | |
| APJR | 1 | 1600 (19) | |
| CDK2 | 1 | 总不定数 (40) | |
| CDK7 | 1 | 4000 (100) | |
| 细胞周期蛋白依赖性激酶 | 2 | 1 | 总不定数 (170) |
| DGKA | 1 | 360 (25) | |
| EFGR(C797S) | 10 | 总不确定数 (380) | |
| 雌激素受体α亚型 | 8 | 10000+ (80) | |
| FGFR2 | 10 | 总不定数 (40) | |
| FGFR2/3 | 1 | 总不定数 (40) | |
| HSP90 | 7 | 10000+ (60) | |
| JAK2 | 1 | 10000+ (200) | |
| MAT2A | 1 | 2800 (15) | |
| PHD1/2 | 1 | 总不确定数 (50) | |
| PI3Kα | 10 | 2000 (40) | |
| PKC,GSK3β | 1 | 不确定 (180) | |
| PKC-θ | 1 | 4000 (40) | |
| RBM39 | 1 | 300 (20) | |
| S1P1激动剂 | 总不定数 (80) | ||
| SHP2 | 10 | 7000 (100) | |
| TEAD | 1 | 总不定数 (10) | |
| TNIK | 2 | 400 (50) | |
| TYK2 | 2 | 7400 (70) | |
| USP1 | 1 | 3000 (60) | |
| USP28 | 5 | 总不定数 (15) | |
| USP7 | 6 | 总不确定数 (90) | |
| α4β7 | 1 | 3700 (150) |
如表3所示,与关键靶点相关的总申请量通常达数百甚至数千件,而领先申请者拥有数十至数百件申请。 申请量差异部分源于人工智能药物研发公司成立时间较短。但这并不能改变一个事实:相较于新兴人工智能药物研发公司,市场上存在数量庞大的专利(以及可能持有专利的竞争对手)可被用于对抗这些公司。因此,这些公司仍有机会开发具有价值的专利,包括(但不限于)用于防御性及/或交叉许可目的。
结论
以下是本次分析的关键要点:
人工智能药物研发公司的专利组合通常在人工智能/机器学习/计算技术与药物成分及其他更传统的制药/生物技术发明之间保持平衡。这种组合结构可能源于多种不同情境:部分公司随时间推移从传统发明转向人工智能/机器学习领域;部分公司从创立之初就保持两类技术均衡布局;此外,专利公开滞后现象也掩盖了近期更侧重人工智能/机器学习的申请。
这些公司可能严重低估了其明确保护关键靶点相关技术的能力,尤其考虑到本十年后期即将到来的专利悬崖。至少在人工智能/机器学习领域,这可能是因为相关发明本身覆盖范围足够广泛,可适用于任何靶点,或可能指向靶点识别和/或药物发现之外的其他应用领域。
鉴于该领域快速发展以及未来5-10年生物技术/制药专利格局的整体变化,人工智能药物研发公司拥有巨大机遇,可通过专利保护建立战略优势。 尤其值得注意的是,这些企业可针对多种药物类别和靶点类别开发研发保护方案,以此补充传统成分导向型专利。此类保护不仅能为直接对抗竞争对手提供有力支撑,更能助力生物技术/制药领域内的战略合作与许可授权。
医疗保健中的人工智能系列
若想进一步了解人工智能将如何改变医疗保健领域,请点击此处阅读本系列的其他文章。
[1]专利申请提交与首次公开之间通常存在18个月的滞后期。这使得对初创企业及/或处于快速发展技术领域的企业进行专利组合评估时,难以得出确凿结论。
[2]为使分析保持可控性,本研究仅限于美国专利/专利申请。
[3]首先根据申请标题是否明确对应药物成分或传统技术与人工智能/机器学习技术进行分类,必要时再依据关键词进行二次分类。各类案例在两个分类间存在重叠现象;部分案例即使所涉技术更侧重数据分析而非初始药物设计,仍被归类为与人工智能/机器学习相关。
[4]参见BioPharmaTrend文章中的表1;此处的表2未按阶段区分靶点。
[5]在专利申请中简单列出目标并不意味着由此产生的专利将实际保护该目标,但这种过度包容的做法为对比人工智能公司与成熟企业的专利组合提供了第一步。