及时,准确地预测脓毒症的发生并积极干预治疗可能有效地提高败血症患者的存活率和治愈率。
使用机器学习和自然语言处理,我们想开发模型1)确定所有脓毒症儿童被送往医院的儿童,2)对他们进行分层以区分那些处于高死亡风险的人b)您将如何从事工作?在上海医院ANF MIMIC III中,我们将针对所有医疗状况(包括电子健康记录中的败血症)开发大量的患者入院数据集。这些数据将包括结构化数据,例如年龄,性别,药物,实验室价值,合并症以及非结构化数据,例如出院摘要和医师注释。使用数据集,我们将通过自然语言处理和机器学习培训模型,以便能够识别出患有败血症的人并确定那些将处于高死亡风险的患者。我们将测试这些模型确定我们的预测精度的能力。然后,我们将在其他机构测试这些模型。
病情或疾病 |
---|
败血症 |
简介:及时,准确地预测败血症的发生并积极干预治疗可能有效地提高败血症患者的存活率和治愈率。关于两种方法产生的败血症的预测,已经有大量的研究结果:基于临床评分机制的败血症检测和评估方法以及基于机器学习模型的败血症检测方法。
目的:合理有效的数据预处理可以显着提高败血症预警模型的及时性和准确性。鉴于高度分散,不均匀分布以及常见败血症预测建模指标的巨大差异,该研究提出了一种基于时间窗口相关的败血症指标的混合插值方法。
方法:研究设计了基于线性,MGP,平均,最近的邻居和混合插值法(CTWH)的传统数据插值方法,该方法基于研究中提出的相关时间窗口(CTW),以进行实验比较。在没有实验数据的样品集中分别进行了实验,并删除了90%缺少值的样品集。通过与相同基线模型上现有败血症指标插值方法的性能进行比较,该方法的有效性是从预测结果的准确性和及时性中证明的。最后,分析了实验方法的结果,并从临床角度进行了解释。
意义:
鉴于败血症预测模型中常用指标的特征之间的高分散,不均匀分布的特征,不均匀的分布和巨大差异,本研究提出了有效的数据插值策略。在消除了90%和0%的缺失数据后,本研究中提出的插值方法的执行效果要好于静态基线和时间序列模型等现有方法,例如平均插值和线性插值,KNN,MGP。同时,该方法还提供了一个想法,可以探索插值窗口的长度,并支持对缺失价值插值和数据预处理的前瞻性研究。
研究类型 : | 观察 |
估计入学人数 : | 4500名参与者 |
观察模型: | 其他 |
时间观点: | 回顾 |
官方标题: | 败血症儿童风险的机器学习模型 |
实际学习开始日期 : | 2019年4月1日 |
估计初级完成日期 : | 2021年3月1日 |
估计 学习完成日期 : | 2021年4月1日 |
符合研究资格的年龄: | 1年至18岁(儿童,成人) |
有资格学习的男女: | 全部 |
基于性别的资格: | 是的 |
接受健康的志愿者: | 是的 |
采样方法: | 非概率样本 |
联系人:医学博士QIN GAO | 13761402225 | 1376140225@163.com |
中国,扬普 | |
中国上海上海大学医学院新华社医院,中国上海 | 招募 |
上海,扬普,中国,200092年 | |
联系人:Xin Sun,博士18902268716 doctorsunxin@hotmail.com |
首席研究员: | Xin Sun,医学博士 | 中国上海上海大学医学院新华社医院,中国上海 |
追踪信息 | |||||
---|---|---|---|---|---|
首先提交日期 | 2021年2月24日 | ||||
第一个发布日期 | 2021年2月25日 | ||||
最后更新发布日期 | 2021年2月25日 | ||||
实际学习开始日期 | 2019年4月1日 | ||||
估计初级完成日期 | 2021年3月1日(主要结果度量的最终数据收集日期) | ||||
当前的主要结果指标 | 败血症的识别[时间范围:基线] | ||||
原始主要结果指标 | 与电流相同 | ||||
改变历史 | 没有发布更改 | ||||
当前的次要结果指标 | 不提供 | ||||
原始的次要结果指标 | 不提供 | ||||
当前其他预先指定的结果指标 | 不提供 | ||||
其他其他预先指定的结果指标 | 不提供 | ||||
描述性信息 | |||||
简短标题 | 败血症的机器学习预测模型 | ||||
官方头衔 | 败血症儿童风险的机器学习模型 | ||||
简要摘要 | 及时,准确地预测脓毒症的发生并积极干预治疗可能有效地提高败血症患者的存活率和治愈率。 使用机器学习和自然语言处理,我们想开发模型1)确定所有脓毒症儿童被送往医院的儿童,2)对他们进行分层以区分那些处于高死亡风险的人b)您将如何从事工作?在上海医院ANF MIMIC III中,我们将针对所有医疗状况(包括电子健康记录中的败血症)开发大量的患者入院数据集。这些数据将包括结构化数据,例如年龄,性别,药物,实验室价值,合并症以及非结构化数据,例如出院摘要和医师注释。使用数据集,我们将通过自然语言处理和机器学习培训模型,以便能够识别出患有败血症的人并确定那些将处于高死亡风险的患者。我们将测试这些模型确定我们的预测精度的能力。然后,我们将在其他机构测试这些模型。 | ||||
详细说明 | 简介:及时,准确地预测败血症的发生并积极干预治疗可能有效地提高败血症患者的存活率和治愈率。关于两种方法产生的败血症的预测,已经有大量的研究结果:基于临床评分机制的败血症检测和评估方法以及基于机器学习模型的败血症检测方法。 目的:合理有效的数据预处理可以显着提高败血症预警模型的及时性和准确性。鉴于高度分散,不均匀分布以及常见败血症预测建模指标的巨大差异,该研究提出了一种基于时间窗口相关的败血症指标的混合插值方法。 方法:研究设计了基于线性,MGP,平均,最近的邻居和混合插值法(CTWH)的传统数据插值方法,该方法基于研究中提出的相关时间窗口(CTW),以进行实验比较。在没有实验数据的样品集中分别进行了实验,并删除了90%缺少值的样品集。通过与相同基线模型上现有败血症指标插值方法的性能进行比较,该方法的有效性是从预测结果的准确性和及时性中证明的。最后,分析了实验方法的结果,并从临床角度进行了解释。 意义: 鉴于败血症预测模型中常用指标的特征之间的高分散,不均匀分布的特征,不均匀的分布和巨大差异,本研究提出了有效的数据插值策略。在消除了90%和0%的缺失数据后,本研究中提出的插值方法的执行效果要好于静态基线和时间序列模型等现有方法,例如平均插值和线性插值,KNN,MGP。同时,该方法还提供了一个想法,可以探索插值窗口的长度,并支持对缺失价值插值和数据预处理的前瞻性研究。 | ||||
研究类型 | 观察 | ||||
学习规划 | 观察模型:其他 时间视角:回顾 | ||||
目标随访时间 | 不提供 | ||||
生物测量 | 不提供 | ||||
采样方法 | 非概率样本 | ||||
研究人群 | 对于2021年冬季的数据分析,我们可以访问截至2016年2月至2018年7月的败血症数据。 | ||||
健康)状况 | 败血症 | ||||
干涉 | 不提供 | ||||
研究组/队列 | 不提供 | ||||
出版物 * | 不提供 | ||||
*包括数据提供商提供的出版物以及MEDLINE中临床标识符(NCT编号)确定的出版物。 | |||||
招聘信息 | |||||
招聘状况 | 招募 | ||||
估计入学人数 | 4500 | ||||
原始估计注册 | 与电流相同 | ||||
估计学习完成日期 | 2021年4月1日 | ||||
估计初级完成日期 | 2021年3月1日(主要结果度量的最终数据收集日期) | ||||
资格标准 | 纳入标准: 排除标准: | ||||
性别/性别 |
| ||||
年龄 | 1年至18岁(儿童,成人) | ||||
接受健康的志愿者 | 是的 | ||||
联系人 |
| ||||
列出的位置国家 | 中国 | ||||
删除了位置国家 | |||||
管理信息 | |||||
NCT编号 | NCT04771429 | ||||
其他研究ID编号 | XHEC-C-2021-104-1 | ||||
有数据监测委员会 | 是的 | ||||
美国FDA调节的产品 |
| ||||
IPD共享声明 |
| ||||
责任方 | 上海若o汤大学医学院新华社医院 | ||||
研究赞助商 | 上海若o汤大学医学院新华社医院 | ||||
合作者 | 不提供 | ||||
调查人员 |
| ||||
PRS帐户 | 上海若o汤大学医学院新华社医院 | ||||
验证日期 | 2021年2月 |
及时,准确地预测脓毒症的发生并积极干预治疗可能有效地提高败血症患者的存活率和治愈率。
使用机器学习和自然语言处理,我们想开发模型1)确定所有脓毒症儿童被送往医院的儿童,2)对他们进行分层以区分那些处于高死亡风险的人b)您将如何从事工作?在上海医院ANF MIMIC III中,我们将针对所有医疗状况(包括电子健康记录中的败血症)开发大量的患者入院数据集。这些数据将包括结构化数据,例如年龄,性别,药物,实验室价值,合并症以及非结构化数据,例如出院摘要和医师注释。使用数据集,我们将通过自然语言处理和机器学习培训模型,以便能够识别出患有败血症的人并确定那些将处于高死亡风险的患者。我们将测试这些模型确定我们的预测精度的能力。然后,我们将在其他机构测试这些模型。
病情或疾病 |
---|
败血症 |
简介:及时,准确地预测败血症的发生并积极干预治疗可能有效地提高败血症患者的存活率和治愈率。关于两种方法产生的败血症的预测,已经有大量的研究结果:基于临床评分机制的败血症检测和评估方法以及基于机器学习模型的败血症检测方法。
目的:合理有效的数据预处理可以显着提高败血症预警模型的及时性和准确性。鉴于高度分散,不均匀分布以及常见败血症预测建模指标的巨大差异,该研究提出了一种基于时间窗口相关的败血症指标的混合插值方法。
方法:研究设计了基于线性,MGP,平均,最近的邻居和混合插值法(CTWH)的传统数据插值方法,该方法基于研究中提出的相关时间窗口(CTW),以进行实验比较。在没有实验数据的样品集中分别进行了实验,并删除了90%缺少值的样品集。通过与相同基线模型上现有败血症指标插值方法的性能进行比较,该方法的有效性是从预测结果的准确性和及时性中证明的。最后,分析了实验方法的结果,并从临床角度进行了解释。
意义:
鉴于败血症预测模型中常用指标的特征之间的高分散,不均匀分布的特征,不均匀的分布和巨大差异,本研究提出了有效的数据插值策略。在消除了90%和0%的缺失数据后,本研究中提出的插值方法的执行效果要好于静态基线和时间序列模型等现有方法,例如平均插值和线性插值,KNN,MGP。同时,该方法还提供了一个想法,可以探索插值窗口的长度,并支持对缺失价值插值和数据预处理的前瞻性研究。
研究类型 : | 观察 |
估计入学人数 : | 4500名参与者 |
观察模型: | 其他 |
时间观点: | 回顾 |
官方标题: | 败血症儿童风险的机器学习模型 |
实际学习开始日期 : | 2019年4月1日 |
估计初级完成日期 : | 2021年3月1日 |
估计 学习完成日期 : | 2021年4月1日 |
符合研究资格的年龄: | 1年至18岁(儿童,成人) |
有资格学习的男女: | 全部 |
基于性别的资格: | 是的 |
接受健康的志愿者: | 是的 |
采样方法: | 非概率样本 |
追踪信息 | |||||
---|---|---|---|---|---|
首先提交日期 | 2021年2月24日 | ||||
第一个发布日期 | 2021年2月25日 | ||||
最后更新发布日期 | 2021年2月25日 | ||||
实际学习开始日期 | 2019年4月1日 | ||||
估计初级完成日期 | 2021年3月1日(主要结果度量的最终数据收集日期) | ||||
当前的主要结果指标 | 败血症的识别[时间范围:基线] | ||||
原始主要结果指标 | 与电流相同 | ||||
改变历史 | 没有发布更改 | ||||
当前的次要结果指标 | 不提供 | ||||
原始的次要结果指标 | 不提供 | ||||
当前其他预先指定的结果指标 | 不提供 | ||||
其他其他预先指定的结果指标 | 不提供 | ||||
描述性信息 | |||||
简短标题 | 败血症的机器学习预测模型 | ||||
官方头衔 | 败血症儿童风险的机器学习模型 | ||||
简要摘要 | 及时,准确地预测脓毒症的发生并积极干预治疗可能有效地提高败血症患者的存活率和治愈率。 使用机器学习和自然语言处理,我们想开发模型1)确定所有脓毒症儿童被送往医院的儿童,2)对他们进行分层以区分那些处于高死亡风险的人b)您将如何从事工作?在上海医院ANF MIMIC III中,我们将针对所有医疗状况(包括电子健康记录中的败血症)开发大量的患者入院数据集。这些数据将包括结构化数据,例如年龄,性别,药物,实验室价值,合并症以及非结构化数据,例如出院摘要和医师注释。使用数据集,我们将通过自然语言处理和机器学习培训模型,以便能够识别出患有败血症的人并确定那些将处于高死亡风险的患者。我们将测试这些模型确定我们的预测精度的能力。然后,我们将在其他机构测试这些模型。 | ||||
详细说明 | 简介:及时,准确地预测败血症的发生并积极干预治疗可能有效地提高败血症患者的存活率和治愈率。关于两种方法产生的败血症的预测,已经有大量的研究结果:基于临床评分机制的败血症检测和评估方法以及基于机器学习模型的败血症检测方法。 目的:合理有效的数据预处理可以显着提高败血症预警模型的及时性和准确性。鉴于高度分散,不均匀分布以及常见败血症预测建模指标的巨大差异,该研究提出了一种基于时间窗口相关的败血症指标的混合插值方法。 方法:研究设计了基于线性,MGP,平均,最近的邻居和混合插值法(CTWH)的传统数据插值方法,该方法基于研究中提出的相关时间窗口(CTW),以进行实验比较。在没有实验数据的样品集中分别进行了实验,并删除了90%缺少值的样品集。通过与相同基线模型上现有败血症指标插值方法的性能进行比较,该方法的有效性是从预测结果的准确性和及时性中证明的。最后,分析了实验方法的结果,并从临床角度进行了解释。 意义: 鉴于败血症预测模型中常用指标的特征之间的高分散,不均匀分布的特征,不均匀的分布和巨大差异,本研究提出了有效的数据插值策略。在消除了90%和0%的缺失数据后,本研究中提出的插值方法的执行效果要好于静态基线和时间序列模型等现有方法,例如平均插值和线性插值,KNN,MGP。同时,该方法还提供了一个想法,可以探索插值窗口的长度,并支持对缺失价值插值和数据预处理的前瞻性研究。 | ||||
研究类型 | 观察 | ||||
学习规划 | 观察模型:其他 时间视角:回顾 | ||||
目标随访时间 | 不提供 | ||||
生物测量 | 不提供 | ||||
采样方法 | 非概率样本 | ||||
研究人群 | 对于2021年冬季的数据分析,我们可以访问截至2016年2月至2018年7月的败血症数据。 | ||||
健康)状况 | 败血症 | ||||
干涉 | 不提供 | ||||
研究组/队列 | 不提供 | ||||
出版物 * | 不提供 | ||||
*包括数据提供商提供的出版物以及MEDLINE中临床标识符(NCT编号)确定的出版物。 | |||||
招聘信息 | |||||
招聘状况 | 招募 | ||||
估计入学人数 | 4500 | ||||
原始估计注册 | 与电流相同 | ||||
估计学习完成日期 | 2021年4月1日 | ||||
估计初级完成日期 | 2021年3月1日(主要结果度量的最终数据收集日期) | ||||
资格标准 | 纳入标准: 排除标准: | ||||
性别/性别 |
| ||||
年龄 | 1年至18岁(儿童,成人) | ||||
接受健康的志愿者 | 是的 | ||||
联系人 |
| ||||
列出的位置国家 | 中国 | ||||
删除了位置国家 | |||||
管理信息 | |||||
NCT编号 | NCT04771429 | ||||
其他研究ID编号 | XHEC-C-2021-104-1 | ||||
有数据监测委员会 | 是的 | ||||
美国FDA调节的产品 |
| ||||
IPD共享声明 |
| ||||
责任方 | 上海若o汤大学医学院新华社医院 | ||||
研究赞助商 | 上海若o汤大学医学院新华社医院 | ||||
合作者 | 不提供 | ||||
调查人员 |
| ||||
PRS帐户 | 上海若o汤大学医学院新华社医院 | ||||
验证日期 | 2021年2月 |