听好了，这次咱们来学点真本事！搞懂纵向数据怎么建多变量轨迹模型

听好了，这次咱们来学点真本事！搞懂纵向数据怎么建多变量轨迹模型，这可是个大难题。因为现实中的疾病发展往往是很多复杂变量互相作用的结果，病人还经常带着多种毛病，指标也会随时间变化。比如说，咱们得想办法搞清楚血糖、血压、胆固醇这三样东西，在一个糖尿病群体里5年是怎么变化的？这三个指标到底是怎么相互影响的？以前的那些方法，像GBTM或者LCGM，通常只能盯着一个指标的时间变化看，没法把多个指标的数据利用起来。后来呢，就有人想出了GBMTM，又叫多变量轨迹模型。它通过多个指标来给病人分组，找出那些走得差不多的人群，这在处理多指标数据方面特别有一手。为什么要说这个呢？因为GBTM比起其他研究多变量变化的聚类方法，更适合咱们普通学者去用。它有好几个优点：第一是不同变量的时间可以不一样（比如年、小时、分钟都行）；第二是能把不同类型的数据放在一起分析（连续的、离散的、分类的都行）；第三是允许数据有点缺漏；第四是能通过概率算出组内成员的不确定性；第五是最后分出来的组很好解释。这个模型对数据也有要求：一是得有随访数据，每个病人至少要有3次测量以上；二是每次测量都要测同样的几个指标；三是同一个变量不同时间点用的工具或单位得一样；四是能接受部分时间点缺数，但不能整个对象都没数据。至于怎么建模型啊？SAS、Stata还有R都可以实现：SAS用Proc Traj，Stata用traj程序包，R用gbmt程序包。咱们“轨迹模型在纵向数据分析中的深度应用”这门课里就详细讲了这部分内容和R语言的实操代码截图。想了解更多就赶紧去看看课吧。