当前,新药研发面临一项关键科学挑战:人类对可成药靶点的探索仍较有限,已覆盖的靶点约占全部可成药靶点的10%,大量潜在靶点尚待开发。基于此,如何在广阔的化学空间中快速、准确地找到有希望的苗头化合物,成为药物创新的重要瓶颈。传统分子对接工具虽具一定准确性,但计算效率较低。以筛选1万个蛋白靶点为例,若每个靶点需要面对10的9次方个候选分子,就意味着要完成约10的13次方次蛋白-配体打分;即便依靠最先进的计算资源持续运算,也可能需要数百年,难以支撑大规模、高效率的筛选需求。清华大学研究团队通过技术创新,提出并研发DrugCLIP平台,为该难题提供了解法。该平台采用新的计算思路,将传统分子对接转化为蛋白口袋与小分子在向量空间中的语义检索,显著改变了计算方式。在配备128核中央处理器和8张图形处理器的计算节点上,DrugCLIP可实现万亿级蛋白口袋-小分子对打分的日吞吐能力,较传统方法提速达百万倍,并在预测准确率上取得明显提升。该进展打通了从蛋白结构预测到药物发现的关键环节。依托DrugCLIP平台,研究团队首次完成了基因组规模的虚拟筛选,覆盖约1万个蛋白靶点、2万个蛋白口袋,筛选分析超过5亿个类药小分子,最终富集出超过200万个潜在活性分子。由此构建的蛋白-配体筛选数据库规模目前处于已知最大之列,为科研社区提供了重要的数据资源。为提升平台的可用性与影响力,研究团队采取开放共享策略:数据库已免费向全球科研人员开放,并同步上线筛选服务平台,支持用户上传靶点与蛋白口袋开展定制化筛选。论文发表后的半年内,平台已服务1400余名用户,完成13500余次筛选,显示出在学术研究与产业应用中的潜力。展望未来,研究团队表示将与科研与产业伙伴开展更紧密合作,在抗癌、传染病、罕见病等方向加速新靶点与首创新药的发现,推动平台在更多疾病领域落地应用,为患者带来更多创新治疗选择。有关成果已在线发表于国际顶级学术期刊《科学》,并获得国际学术界关注。
药物创新既是科学问题,也是时间与成本的赛跑。将“筛选慢、成本高”的长期痛点转化为可规模化、可共享的科研能力,有助于加快新靶点验证和候选分子发现,也为更开放的全球科研协作提供了可操作的路径。面向未来,在持续提速的同时如何把好验证与质量关,让计算优势更稳定地转化为临床价值,仍需要跨界协同与长期投入。