在最近发表在《柳叶刀数字健康》上的一项研究中,一组研究人员开发并评估了一种可扩展的、保护隐私的联合学习解决方案,该解决方案使用低成本微计算在英国医院进行2019冠状病毒病(COVID-19)筛查。
这种方法,特别是客户机-服务器联合学习,涉及共享模型权重,而不是患者数据,用于全局模型开发。现实世界的医院实施很少,通常需要技术专长和与临床系统的数据分离。
需要进一步的研究来完善和验证不同医疗保健环境中的联合学习方法,并解决在实际临床环境中更广泛采用的实施挑战。
本研究涉及开发和测试英国医院COVID-19筛查联合学习解决方案的详细过程。研究人员选择了四个国家卫生服务(NHS)医院集团——牛津大学医院(OUH)、伯明翰大学医院(UHB)、贝德福德郡医院(BH)和朴茨茅斯医院大学(PUH),并使用树莓派4模型B设备进行全栈联合学习。这种设置允许每家医院使用去识别的患者数据在本地训练、校准和评估人工智能模型,从而确保隐私。
向NHS信托机构提供了从电子健康记录中提取数据的纳入和排除标准。数据去识别是由临床团队或NHS信息学家严格执行的。该研究使用了大流行前的对照队列和covid -19阳性队列进行培训,数据包括生命体征、人口统计学和血液检测结果。数据提取被加载到客户机设备上,用于联合训练、校准和评估。
联合训练采用逻辑回归和深度神经网络分类器。特征预处理成通用格式,缺失数据使用局部中值进行输入。FedAvg算法促进了跨医院组的培训,客户端将模型参数传输到中央服务器进行聚合。校正局部模型以设定灵敏度阈值为目标,评估结果由服务器汇总。
联合评估包括使用来自不同医院的前瞻性队列。校准和归算策略取决于站点是否参与培训和评价或仅评价。特定于站点的模型调优测试了全局模型的适应性,集中式服务器端评估验证了联邦评估的保真度。该研究还考察了个体特征对模型预测的影响。
统计分析侧重于比较不同配置和训练方法下的模型性能,使用AUROC、灵敏度和特异性等指标。
在本研究中,比较发现logistic回归模型的AUROC显著增加。例如,OUH的AUROC从0.685增加到0.829,PUH的AUROC从0.731增加到0.865。同样,深度神经网络模型表现出更显著的改善,AUROC值在OUH时从0.574上升到0.872,在PUH时从0.622上升到0.876。
三个NHS信托- OUH, UHB和PUH-参与了这次联合培训,提供了来自大量患者的数据。联合评估包括来自大流行第二波期间入院的患者的数据,这些患者的COVID-19患病率和参与地点的年龄中位数各不相同。
当最终的全局模型进行外部评估时,逻辑回归和深度神经网络模型都显示出较高的分类性能。联邦校准获得了令人印象深刻的灵敏度,逻辑回归模型的灵敏度为83.4%,深度神经网络模型的灵敏度为89.7%。
这些模型的性能在不同的评估站点上保持稳定。与逻辑回归模型相比,深度神经网络模型通过联邦表现出更明显的改善,在大约75-100轮后达到性能平稳期。
在PUH,对全局模型进行特定地点的调整导致深度神经网络模型略有改善。然而,逻辑回归模型没有明显的改善。这表明全球模式具有高度的通用性,并且在站点之间预测器分布的变化最小。
逻辑回归全局模型的分析强调了几个关键的预测因子,如粒细胞计数和白蛋白浓度,与先前的研究一致,强调了它们在炎症反应中的作用。使用沙普利加性解释的深度神经网络模型分析显示,嗜酸性粒细胞计数是一个极具影响力的预测因子。