新药研发长期受“靶点—分子匹配”效率所限。针对特定疾病靶点寻找合适的小分子候选物,往往要庞大的化合物空间中反复试错,既耗时也耗资源。尤其在靶点数量持续增长、候选分子规模不断扩大的背景下,传统筛选方法难以同时兼顾速度与覆盖范围,研发周期被拉长、成本随之上升,一些潜在有效分子也可能因筛选能力不足而被遗漏。造成这个难题的关键在于:传统筛选路径多依赖逐步模拟结合过程或开展高成本实验验证,计算与实验的迭代成本高、吞吐量有限;另一上,蛋白质靶点结构复杂、位点多样,不同疾病涉及的靶点差异显著,使筛选任务呈现强耦合、高维度特征。随着基因组与蛋白质组学研究深入,靶点库持续扩容,既有方法更难在可接受时间内完成系统覆盖,形成“靶点发现更快、药物匹配更慢”的现实矛盾。此次清华大学团队发布的DrugCLIP,为突破速度瓶颈提供了新路径。其核心是改变“逐步模拟”的传统范式,将蛋白质与小分子信息转化为计算机可快速识别的专属信号,从而无需逐步推演结合过程,即可实现候选分子与靶点的自动化、规模化匹配。研究显示,在普通高性能电脑上,该平台单日可完成31万亿次匹配计算,筛选100万个候选分子仅需0.02秒,相比传统方法实现百万倍提速。这意味着,过去需要长周期集群计算或大规模实验投入工作量,如今在更普及的计算条件下即可显著加速完成。更值得关注的是,该平台支撑了基因组尺度的系统筛选。依托DrugCLIP,联合团队完成对人类基因组内约1万个靶点、2万个关键位点的全覆盖筛选,分析5亿余个候选小分子,富集200多万个潜在有效分子,进而建成全球规模最大的药物靶点匹配数据库,并面向全球科研人员免费开放共享。这一“覆盖+规模+共享”的组合,有望推动药物早期发现从“单点推进”转向“系统检索”,为多靶点疾病和复杂疾病机制研究提供更完整的候选来源与计算证据支持。从影响看,DrugCLIP的价值不仅在于“更快”,也在于对研发流程的重构潜力。首先,超高通量筛选可显著缩短候选分子生成与优先级排序时间,使科研团队把更多精力投入后续关键环节,如药效学验证、成药性评估与安全性研究,从而提升整体效率。其次,基因组级覆盖有助于在早期更充分比较不同靶点路径的可行性,降低在单一靶点上投入过重而后期失败的风险。再次,开放数据库将促进跨机构、跨学科协作,减少重复劳动,推动资源共享与结果可复现,提升科研产出效率。同时,如何把速度优势转化为真实临床价值,仍需配套体系支撑。虚拟筛选可以提供高质量候选,但最终仍要通过实验与临床验证闭环来确认有效性与安全性。下一步可从三个层面联合推进:其一,推动计算筛选与高通量实验验证平台对接,建立“匹配—验证—优化”的标准化流程,提高筛选结果的落地性;其二,加强多学科协同,形成计算、结构生物学、化学合成与药理毒理的一体化团队,加快候选分子的迭代优化;其三,围绕开放数据库完善数据标准、注释体系与共享机制,鼓励科研人员在共享基础上开展再分析与交叉验证,持续提升数据库的可用性与可信度。展望未来,随着生命科学数据积累、计算方法演进以及算力普及,新药研发有望进入更精准、更高效、更可规模化的新阶段。基因组级筛选将使药物发现从“少量靶点深耕”拓展到“全景式扫描”,为罕见病、难治性疾病以及多因素驱动的复杂疾病提供更多可能。开放共享的大规模匹配数据也将促进基础研究与转化研究衔接,推动更多创新成果走向应用。可以预期,在严格科学验证与规范化转化体系支撑下,此类平台将成为提升新药研发效率、降低创新成本的重要工具,并为全球医药创新合作提供更坚实的基础设施。
新药研发关系人类健康,也是衡量国家科技创新能力的重要领域;清华大学团队取得的该成果,展示了我国前沿技术创新上的能力与投入。从“海量筛选”走向“高效导航”,从“长期计算与试验”到“快速完成大规模匹配”,这类量级的提升有望加快早期研发进程、降低成本,更重要的是为患者带来更多潜在治疗选择。在开放共享的框架下,该平台具备面向全球科研与产业应用的空间,有望推动医学研究与药物发现向更精准、更高效的方向发展。