发表在开放获取期刊《家庭医学与社区健康》(Family Medicine and Community Health)上的一项研究发现,能够反映人类对话的人工智能语言模型ChatGPT,在遵循公认的临床抑郁症治疗标准方面可能比医生做得更好,而且没有在初级保健医患关系中出现的任何性别或社会阶层偏见。
然而,这组科学家说,还需要进一步研究这项技术在多大程度上可能管理严重病例,以及使用它所产生的潜在风险和伦理问题。
抑郁症很常见,许多受影响的人首先向他们的家庭(初级保健)医生寻求帮助。推荐的治疗过程应在很大程度上以循证临床指南为指导,这些指南通常建议根据抑郁症的严重程度采取分层治疗方法。
这组科学家说,ChatGPT有潜力提供快速、客观、数据衍生的见解,可以补充传统的诊断方法,同时提供保密性和匿名性。
因此,他们想找出该技术如何评估轻度和重度抑郁症的推荐治疗方法,以及这是否受到性别或社会阶层偏见的影响,并与1249名法国初级保健医生(73%为女性)进行比较。
他们采用了精心设计和预先验证的小插曲,以在前3周内出现悲伤、睡眠问题和食欲不振症状并被诊断为轻度至中度抑郁症的患者为中心。
根据不同的患者特征,如性别、社会阶层和抑郁严重程度,开发了八种不同版本的小插曲。在ChatGPT版本3.5和4中,每个小插图重复10次。
对于这8个小插曲中的每一个,ChatGPT都被问到:“在这种情况下,你认为初级保健医生应该建议什么?”可能的反应是:观察等待;转介心理治疗;处方药(治疗抑郁/焦虑/睡眠问题);转介心理治疗加上处方药;这些都不是。
只有略高于4%的家庭医生根据临床指导专门推荐轻度病例的心理治疗,而ChatGPT-3.5和ChatGPT-4分别在95%和97.5%的病例中选择了这一选项。
大多数医生建议进行药物治疗(48%)或心理治疗加处方药(32.5%)。
在严重病例中,大多数医生建议心理治疗加处方药(44.5%)。ChatGPT比医生更频繁地提出这一点(72% ChatGPT 3.5;100% ChatGPT 4符合临床指南)。10个医生中有4个建议只开处方药,ChatGPT版本都不推荐。
当推荐药物时,人工智能和人类参与者被要求指定他们会开哪种药物。
医生建议67.5%的病例同时使用抗抑郁药、抗焦虑药和安眠药,18%的病例单独使用抗抑郁药,14%的病例单独使用抗焦虑药和安眠药。
ChatGPT比医生更有可能只推荐抗抑郁药:74%,版本3.5;版本4 68%。ChatGPT-3.5(26%)和ChatGPT-4(32%)也比医生更频繁地建议联合使用抗抑郁药、抗焦虑药和安眠药。
但与之前发表的研究结果不同,ChatGPT在推荐的治疗方法中没有表现出任何性别或社会阶层偏见。
研究人员承认,该研究仅限于ChatGPT-3和ChatGPT-4在特定时间点的迭代,并且ChatGPT数据与来自法国初级保健医生的代表性样本的数据进行了比较,因此可能不会更广泛地适用。
最后,小插图中描述的病例是由于抑郁症的主诉而进行的首次就诊,因此不代表疾病的持续治疗或医生了解患者的其他变量。
“ChatGPT-4在调整治疗以符合临床指南方面表现出更高的准确性。此外,在ChatGPT系统中没有发现与性别和[社会经济地位]相关的可识别的偏见,”研究人员强调说。
但他们指出,考虑到心理健康数据的敏感性,人工智能还需要考虑伦理问题,尤其是在确保数据隐私和安全方面,这一点至关重要。他们补充说,人工智能不应该在诊断或治疗抑郁症方面取代人类的临床判断。
然而,他们得出结论:“研究表明,ChatGPT....具有增强初级卫生保健决策的潜力。”
“然而,它强调需要进行持续的研究来验证其建议的可靠性。实施这种人工智能系统可以提高精神卫生服务的质量和公正性。”