机器学习和人口健康的特征选择

2019年9月3日

文章总结


患有先天中枢性换气Christiana保健卫生系统(使用了机器学习模型通知人口细分。“黑盒”使用的初始模型算法来预测风险,护理管理者没有输入或理解。CCHS领导人和专家们想要一个有效的模型,他们理解和信任来预测90天的住院病人住院。CCHS使用特征选择过程建立最简单的模型可能AI洞察力为选择最佳的模型工具,设置触发行动,和解释模型。

下载

改善人口健康
出现的结果
  • 特征选择降低了模型的复杂性从236年数据特性仅16数据特性(7%的原始数据集)。
  • 两种模型,与236年的数据特性和一个16数据特性,有0.78和0.15的AUPR AUROC,暗示没有退化的预测性能较低数量的功能选择。
  • CCHS护理管理者有信心预测模型,并成功地利用机器学习工具的输出与平均每周857个不同的成员,这些成员完成任务超过2520。

患有先天中枢性换气Christiana保健卫生系统(使用了机器学习模型通知人口细分。“黑盒”使用的初始模型算法来预测风险,护理管理者没有输入或理解。CCHS领导人和专家们想要一个有效的模型,他们理解和信任来预测90天的住院病人住院。CCHS使用特征选择过程建立最简单的模型可能AI洞察力为选择最佳的模型工具,设置触发行动,和解释模型。

管理与慢性疾病人群

百分之九十的3.3万亿美元花在美国每年为患有慢性医疗和心理健康状况。1这使得患者人群慢性病护理的最常见的和昂贵的用户。

解决这些数量,价值取向的护理模式扩张的意图降低医疗成本,鼓励更好的管理防止住院患者的现有条件,避免并发症,改善的结果。

患有先天中枢性换气Delaware-based的使命是成为邻国专家,关心他们的健康的合作伙伴。卫生系统持续创造创新,有效的,负担得起的医疗系统。它试图改善人口健康的社区和降低医疗成本,把价值取向的护理模式。

不可信的算法影响使用

CCHS开发了以病人为中心,clinician-led增强护理协调,支持服务提供者和护理管理者在帮助患者以更低的成本获得较好的临床结果。医疗机构使用了机器学习模型的人口细分和护理管理,将结果和admission-discharge-transfer数据生成数字风险评分,滚到风险乐队向护理管理者在本国工作流程。

“黑盒”使用的模型算法,护理管理者没有输入和不理解。因此,他们不可信或被很多人使用,这是一个常见的问题与机器学习算法。

患有先天中枢性换气,成熟的流程,组织试图提高其风险优先级,使其更好地识别可能住院的病人在接下来的90天。这有助于护理管理者与病人接触,以确保他们获得正确的护理,在正确的时间,正确的地方。

访问临床数据集往往是困难和昂贵的,尤其是当这些集是来自不同的卫生系统。患有先天中枢性换气这一挑战增加,当超出其护理管理服务以外的特拉华州,在那里有一个定制的集成与国家卫生信息交换(赶快)。CCHS想要确定这是使用最好的数据来提高人口健康护理团队已经泛滥的信息,和护理管理人员怀疑现有的机器学习模型。

CCHS领导人试图回答一些关键问题:

  • 更多的数据帮助或会压倒性的吗?
  • 需要什么样的数据来提高人口细分的风险评分方法吗?
  • 当数据被添加,风险和结果的预测更加准确吗?

在接受挑战的过程将另外,患有先天中枢性换气昂贵的数据集的风险预测模型,需要更好地理解临床数据添加到其宣称的好处的信息。

数据驱动的方法来改善人口健康

患有先天中枢性换气回答这些关键问题周围的额外数据,利用卫生与健康催化剂催化剂世界杯葡萄牙vs加纳即时走地®数据操作系统(DOS™)及其数据科学团队开发一种新的机器学习模型预测住院在接下来的90天。CCHS认为这是一个以务实的方式使用机器学习的方法。

创建一个机器学习模型预测住院

患有先天中枢性换气在发展中机器学习模型,分析了超过100000人的数据,包括那些参加医疗保险负责保健组织(ACO) CCHS病人,direct-to-employer合同和付款人/保健管理伙伴关系。

前面的方法细分人群使用风险分数需要分析236列数据”功能。“这个复杂的方法难以开发和维护,患有先天中枢性换气促使离开临床数据,而不是利用索赔和招生数据初始模型。

数据对象包括各种支付合同和其他人群。每组在100000 -会员单位,截然不同的数据特点,医疗利用率差异,成员年龄、人口、疾病、和社会经济地位。在数据分析过程中,团队努力理解为什么有些数据丢失,因为这些原因决定如何处理“missingness”在构建和选择特性的模型。

数据采集从麻疹也是一个挑战。30天lookback期间,实验室和其他数据资料,每个成员可以有许多临床事件。这转化为数百万行数百列的数据,需要加载和聚合最初,然后附加到,更新和聚合。此外,麻疹的临床事件往往不映射到常见的命名/术语(例如,实验室结果映射到LOINC),使得它难以补充缺失数据或合并来自不同来源的数据。

建立一个模型,使未来的易用性

患有先天中枢性换气简化将来的数据收集,确定这些元素的最大贡献者危险分层预测性能。确定添加临床数据的增量效益,团队使用机器学习的过程称为“特征选择”测试的增量预测贡献每个236数据功能的迭代评估是否每个特性,单独或结合在一起,有一个材料对整个模型的预测性能的影响。

功能被包括在模型中如果包含了0.005 AUROC增量增加曲线或AUPR曲线,建立绩效指标用于评估和比较的准确性,分析模型的精度和灵敏度。以确保没有预测性能的退化导致从特征选择模型性能相比,在特征选择模型性能特征选择。

一旦90天——招生预测模型创建,CCHS护理管理人员训练模型,帮助他们理解和信任风险评分在照顾他们的病人提供和应用它。

结果

通过了解所有人口健康数据的含义喂养它的机器学习模型,CCHS护理管理者之间能够建立信任和交付结果,包括:

  • 特征选择降低了模型的复杂性从236年数据特性仅16数据特性(7%的原始数据集)。
  • 两种模型,与236年的数据特性和一个16数据特性,有0.78和0.15的AUPR AUROC,暗示没有退化的预测性能较低数量的功能选择。
  • 特征选择和其他分析平台工具广泛适用于任何数据集,使用哪一个患有先天中枢性换气将使他们世界杯厄瓜多尔vs塞内加尔波胆预测在未来开发更多模型。

模型运行日报和更新预测大约158000名活跃的患者随着新信息。患有先天中枢性换气给出的分数然后在护理管理软件应用程序的一个简化形式:高危患者提供了可以过滤列表的前5%,10%或15%的成员参与。

临床专家觉得所选特征同意他们的经验和期望。患有先天中枢性换气结果,护理管理者有信心预测模型,并成功地利用机器学习工具的输出与平均每周857个不同的成员,这些成员完成任务超过2520。

“当医疗第一次开始谈论人口健康,焦点集中在护理管理。现在,在人口健康关注数据和分析,这些都是核心成功照顾的人群。”

-特里Steinberg博士、MBA首席健康信息和人口卫生信息学,副总裁克里斯蒂安娜保健卫生系统

接下来是什么

CCHS将继续奉行机会利用分析和数据科学改善人口健康状况。卫生系统也将继续确保每个人正确的护理,在正确的时间,正确的地方。

引用

  1. 疾病控制与预防中心、国家慢性病预防和健康促进中心。(2019)。慢性病的健康和经济成本
对报销Analytics-Driven临床文档改进工作产生积极的影响

这个网站上存储数据,如饼干,使网站基本功能,以及市场营销、个性化、和分析。剩下的在这个网站上你表明你的同意。有关更多信息,请访问我们的隐私政策