大数据时代给科学学学带来了巨大的改变

大数据时代给科学学带来了巨大的改变。以前人们只是在做哲学讨论,现在它可以用代码写出来的科学运行规律说明书。科学家们每提交一篇论文、一份专利或者一份申请书,就给宇宙抛出一块数据碎片。这些碎片被算法编织成网后,科研事业的全景图就能在屏幕上展现出来。传统的科学研究让很多研究者感到困扰,但大数据技术给科研痛点提供了数字答案。政策制定者可以用科学学的结果来算账:给谁拨款、拨多少以及预期回报率是多少。 通过大数据找到变量之间的相关性,并不是因果关系。Nature Human Behavior文章中的例子表明,资助多的团队引用量高,但并不一定意味着多给钱就能带来好成果。机构声望、设备条件和团队惯性也会对研究产生影响。同样地,跨学科团队引用量低也不能简单地认为单一学科才是王道。这些变量同样会左右结果。所以在使用相关性作为政策依据时要慎重。 因果推断可以把科学研究变成真正有说服力的证据。医学中的随机对照试验就是一个很好的例子。虽然社会科学不能进行伦理清白的随机试验,但可以通过样本切割和时序错位来降低干扰因素。一旦证明处理A导致结果B,政策就可以放心大胆地上线了。 引用数字和社会影响之间存在明显的鸿沟。新冠疫情期间出现了一种奇怪现象:论文发表量飙升但疫苗接种率却没有改变;引用量增加但死亡率曲线却没有下降。这表明成功与有效并不一定是一样的事情。公众需要的是能够救命的科学成果而不是高引用率。所以科学学需要把数据引向公众关切的河道。 未来画像显示从“数据驱动”到“因果赋能”的转变正在发生。当算法能够给出相关性热力图和因果链式反应时,科学学就拥有了开启未来大门的钥匙。政策制定者可以通过实验证据来决策资源配置可以关注社会净效益而不再依赖影响因子公众沟通可以用生活语言代替晦涩指标。数据是燃料而因果是引擎只有把燃料装进引擎才能让科学学这辆快车驶出数据沼泽驶向理性未来。