本发明涉及深度学习领域,尤其涉及智慧医疗领域,具体是指一种基于深度学习和入院病历实现精神分裂症长期住院患者早期预警的方法。
背景技术:
1、精神分裂症(scz)是一种慢性且严重的精神障碍,深刻影响患者的思维、情感和行为。由于scz常常伴随自杀和其他健康风险,scz患者的死亡率偏高,其预期寿命比健康人缩短约15-20年。有效管理和治疗scz患者的关键在于住院治疗。然而,scz不断攀升的患病率给医疗机构带来了巨大的诊疗压力。在这一背景下,在入院时根据患者的个性化病情进行长期住院的早期预警可以有效地帮助医疗机构进行前瞻性的医疗资源配置,提高诊疗效率及有效性。因此,scz患者长期住院早期预警工具的开发显得尤为迫切。
2、在入院时早期识别精神分裂症长期住院患者具有重要意义。从医疗机构的视角出发,通过在患者入院时精确识别其长期住院的风险,能够实现资源的优化分配。这种方法不仅可以提高治疗效果,还可以增强资源配置的效率和针对性,从而提升医院整体运营效率。从患者的角度出发,精确的医疗资源调配可以缩短住院时间,减轻患者的经济负担。此外,利用多模态客观指标进行长住院患者的早期识别不仅可以提高识别的精度,还可以使得这一识别流程具有更好的可重复性及稳定性,大幅增加了此类方法的临床可用性。通过发掘影响住院时间的关键因素,可以帮助探究scz的发病机制,并促进未来治疗方案的制定和改良。
3、在此基础之上,过往的大部分研究着重于探究长住院和短住院scz患者在入院时的单变量差异。例如newman等人通过分析7653名英国精神疾病患者的住院数据发现男性、特定族裔(如亚裔、加勒比族裔)、以及居住状态(无家可归或需要支持)与更长的住院时间有关。bruce等人探讨了在英国伦敦的多种族精神疾病住院病人的住院时间长短与入院特征的关系,并发现加勒比族裔患者的住院时间比其他种族更长,高龄、单身、暴力及受害经历与较长住院时间相关。
4、近年来也有一些方法尝试利用机器学习来进行长住院风险的预测。kirchebner等人在143人的队列上结合人工提取了患者特征、犯罪历史和病史,构建了一个基于机器学习的法医精神病住院时间预测模型,发现住院时间主要受法律因素影响,特别是犯罪严重程度和受害者伤害程度。cheng等人开发了一种使用人口学和生化变量预测住院时间的回归模型,发现婚姻状况和促甲状腺激素水平与延长住院时间有关。
5、由于目前的scz长住院患者预警方法视角单一,没有方法同时结合人口统计学信息、血液检测指标、行为学变量这三个模态,降低了这些方法的预测精确度以及因果分析的全面性。其次,目前的同类方法无法高效地提取入院时的非结构化信息导致现有的方法要么只能在小规模数据集的基础上开发,要么只能放弃这些非结构化信息。二者都将显著降低方法的精度及在临床上的实用性。最后,当前的方法使用的机器学习模型较为简陋,使得模型的精确度较低。同时这也进一步降低了其筛选得到的风险标志物的有效性。
6、基于此,实施精神分裂症长期住院患者的早期识别在提升医疗治疗效果、优化医院资源管理以及深入探索疾病机制和治疗策略方面,均具备重要的应用价值和深远的影响。同时,大型语言模型等新技术的出现,也为此类方法的开发提供了坚实的技术基础。
技术实现思路
1、本发明的目的是克服了上述现有技术的缺点,提供了一种基于深度学习和入院病历实现精神分裂症长期住院患者早期预警的方法。
2、为了实现上述目的,本发明的基于深度学习和入院病历实现精神分裂症长期住院患者早期预警的方法如下:
3、该基于深度学习和入院病历实现精神分裂症长期住院患者早期预警的方法,其主要特点是,所述的方法包括以下步骤:
4、(1)采集目标时间段内特定数据源中精神分裂症住院病人的电子病历数据;
5、(2)对获取到的目标数据进行数据清洗及预处理,仅保留符合要求的短住院记录数据以及长住院记录数据;
6、(3)针对完成数据清洗后的目标数据进行数据集验证、评估以及语言模型处理,以此实现非结构化信息提取;
7、(4)将完成信息提取后的数据转换为嵌入向量后送入注意力模块和多层感知机模块中进行线性分类处理,并以此输出最终的预测,得到相应患者的长住院风险;
8、(5)基于分类模型的风险标志物对最终的预测结果进行预警分析。
9、较佳地,所述的电子病历数据包括患者入院时的血液检测数据、人口统计学信息以及行为学数据的现病史数据记录。
10、较佳地,按照中国精神分裂症患者平均的住院时长,将所述的短住院记录数据设置为:短于30天的患者入院记录数据;将所述的长住院记录数据设置为:超过120天的患者入院记录数据,以此完成数据分类处理。
11、较佳地,所述的步骤(3)包括以下步骤:
12、(3.1)对所述的血液检测数据、人口统计学信息以及行为学数据三个非结构化行为变量分别标注100个示例,确保正负样本的比例为1:1;
13、(3.2)将步骤(3.1)中的数据集作为用于调整提示的验证集超参数,并输入到本地大型语言模型中进行训练;
14、(3.3)对相应数据集设置初始提示、评估和提示优化处理,得到正确、错误和不确定条目的数据集计数;
15、(3.4)将系统当前获取到的提示以及数据集表现嵌入到一个初始查询模板中,并请求远程大语言模型进行提示的优化处理,并将优化后的提示替换为当前提示,实现提示迭代优化;
16、(3.5)当所述的验证集不再出现错误时,完成系统最终提示的输出,并以此完成非结构化信息提取。
17、较佳地,数据预处理之后还包括对相应数据采用数据分箱策略进行编码处理,具体为:
18、将住院持续时间划分为三类:少于30天、30-600天和超过600天,分别编码为0、0.5和1;将行为变量特征编码为0或1;将人口统计学特征编码为0、0.5和1。
19、较佳地,所述的步骤(4)包括以下步骤:
20、(4.1)采用时间切片方式进行数据分割,将最新时间获取到的数据集作为独立测试集,将剩余数据集作为训练集;
21、(4.2)使用留一交叉验证进行超参数选择,并通过穷举列举当前该验证数据点,并将最终获得的正确预测比例作为针对验证集上的评估性能;
22、(4.3)将完成数据特征提取与预处理后的数据转换为嵌入向量,并分别送入所述的注意力模块与多层感知机模块中计算注意力得分以及深层特征提取;
23、(4.4)最终合并所述的注意力模块和多层感知机模块的输出结果,并输入到线性模块进行分类输出最终的预测结果,以此得到患者的长住院风险。
24、较佳地,所述的步骤(5)具体为:
25、采用shapley加性解释对上述模型进行可解释性分析,并采用gradientexplainer方法,利用模型输出相对于输入的梯度,以此高效地近似shap值,最终将入院年龄、疾病持续时间和婚姻状况确定为导致住院时间延长的三个关键风险因素。
26、采用了本发明的该基于深度学习和入院病历实现精神分裂症长期住院患者早期预警的方法,通过构建独立测试集,在实际应用当中,其中,数据集中包含了时间上最新的50名长期和短期住院患者,并最终在测试中取得了0.81的预测精度(acc)以及0.90的受试者曲线下面积(auc)。值得一提的是,这是首次基于三种模态入院数据进行精神分裂症长期住院患者的早期预警。同时也是首次在同类方法中使用基于本地大型语言模型的方法进行高效精确的非结构化特征提取,具有较为显著的应用效果。
1.一种基于深度学习和入院病历实现精神分裂症长期住院患者早期预警的方法,其特征在于,所述的方法包括以下步骤:
2.根据权利要求1所述的基于深度学习和入院病历实现精神分裂症长期住院患者早期预警的方法,其特征在于,所述的电子病历数据包括患者入院时的血液检测数据、人口统计学信息以及行为学数据的现病史数据记录。
3.根据权利要求1所述的基于深度学习和入院病历实现精神分裂症长期住院患者早期预警的方法,其特征在于,按照中国精神分裂症患者平均的住院时长,将所述的短住院记录数据设置为:短于30天的患者入院记录数据;将所述的长住院记录数据设置为:超过120天的患者入院记录数据,以此完成数据分类处理。
4.根据权利要求2所述的基于深度学习和入院病历实现精神分裂症长期住院患者早期预警的方法,其特征在于,所述的步骤(3)包括以下步骤:
5.根据权利要求4所述的基于深度学习和入院病历实现精神分裂症长期住院患者早期预警的方法,其特征在于,数据预处理之后还包括对相应数据采用数据分箱策略进行编码处理,具体为:
6.根据权利要求5所述的基于深度学习和入院病历实现精神分裂症长期住院患者早期预警的方法,其特征在于,所述的步骤(4)包括以下步骤:
7.根据权利要求6所述的基于深度学习和入院病历实现精神分裂症长期住院患者早期预警的方法,其特征在于,所述的步骤(5)具体为: