机器学习工具解锁非结构化健康数据中最关键的见解

2019年12月6日

文章总结

病人的评论，如“我感到头晕”或“我的胃疼”，可以告诉临床医生个人的健康状况，以及附加的背景信息，包括邮政编码、就业状况、交通工具等。然而，这些关键信息被捕获为免费文本或非结构化数据，使得传统分析无法利用这些信息。

机器学习工具(如NLP和文本挖掘)通过解锁非结构化数据中的宝贵见解，帮助卫生系统更好地了解患者及其情况:

1.自然语言处理为人类用户分析大量的自然语言数据。
2.文本挖掘通过对大量文本(如词频、单词长度等)的分析来获得价值。

跳转到:

未触及的非结构化数据是全面护理的关键

文本挖掘提供患者护理周围的环境——医疗保健机器学习成功的关键资源

机器学习在现实世界中提供真正的价值

自动报告提高了准确性，减轻了供应商的负担

预测模型解释健康的社会决定因素

机器学习工具将医疗保健交付推向了下一步

下一个:

医疗保健质量改进:基本业务战略

世界杯葡萄牙vs加纳即时走地健康催化剂编辑

本报告基于医学博士、医学硕士、FAAFP、FACMI、Regenstrief生物医学信息学中心主任Shaun Grannis在2018年医疗保健分析峰会上的演讲;Assoc。教授，印第安纳大学医学院家庭医学系，题为“利用NLP、大数据和数据科学改善人口健康和个人护理结果的真实世界例子”。

许多卫生保健领导者的运作基于这样一个前提，即卫生系统护理人员和利益相关者在有思想的帮助下能更有效、更好地做他们所做的事情它．这一概念推动了医疗保健领域的数据分析和技术集成。

但是深思熟虑的IT意味着什么呢?尽管许多卫生系统利用某种形式的IT，但这并不意味着它是最适合的。当卫生系统使用正确的技术来获得准确的数据，从而提供更好的患者护理和改善结果时，就会出现经过深思熟虑的信息技术。

经过深思熟虑的IT利用机器学习彻底改变了卫生系统使用数据来确定患者护理的最佳过程的方式。以下是两个例子:

自然语言处理(NLP):为人类用户分析大量自然语言数据的数字化能力。
文本挖掘:通过分析大量的文本(如词频、单词长度等)来获得价值。

借助NLP和文本挖掘，医疗保健组织开始利用技术来访问大量非结构化患者数据(例如，护理记录或病人报告的文本，如“我的胃疼”)。自然语言处理和文本挖掘可以处理传统分析无法处理的数据，开拓出更丰富、更复杂的数据源。

未触及的非结构化数据是全面护理的关键

传统分析通常使用结构化数据，主要由索赔数据组成，仅占所有可用数据的20%左右。结构化数据以特定的、一致的格式存在，包括基本信息，如患者人口统计信息、实验室、ICD-9代码和药物。虽然这些数据很容易访问，但由于实验室处理时间和信息的有限性，这些数据往往会被延迟，因为这些信息本质上是基本的，只揭示患者的表面细节，而不是有价值的细节，如社会经济信息。

要访问和理解其余80%的非结构化数据(包括免费文本数据、医嘱数据、护理记录和听写记录)，卫生系统必须依赖于NLP。NLP允许组织访问复杂的、更丰富的数据集，这些数据集很难获取，因为它们需要复杂的技术，才能从EHR中大量的日常语言中获得价值。

存在于ehr和其他地方的非结构化数据包含更深入、更复杂的信息，例如患者描述症状的自己的话或其他提供者的记录。它可以提供上下文信息(例如，生活条件、患者如何看待自己的疾病、患者的家庭信息等)，也被称为健康的社会决定因素(SDoH)。

文本挖掘提供患者护理周围的环境——医疗保健机器学习成功的关键资源

临床医生尽最大努力在他们的记录中捕捉病人的轶事和评论，但这些记录很少超越EHR。自由文本输入(例如，“我感觉不舒服”，“我的右侧感觉麻木，”等)在医疗保健中是常见的，可以为临床医生提供关键的环境，试图提供最好的治疗。

然而，对于已经有经验的医疗团队来说，手工收集和分类免费文本笔记既具有挑战性，又耗时倦怠相关数据的收集和输入。机器学习可以减轻以文本挖掘的形式手工组织自由文本笔记的负担。文本挖掘是一种复杂的算法，它可以根据组织搜索词的选择，快速准确地将自由文本评论分类到正确的类别(例如，高优先级，低优先级，等等)。临床医生可以在整个护理过程中参考这些有价值的见解，而不必坐下来手动筛选大量的自由文本数据。

机器学习在现实世界中提供真正的价值

尽管算法不能提供100%的准确性，但它们仍然比人类更准确。机器学习算法可以在工作人员缺乏带宽的领域帮助医疗系统。例如，2005年印第安纳大学健康(IU Health)实施了一种机器学习早期预警系统以确定急诊(ED)的异常趋势。在印第安纳州实施该系统后不久，它就向印第安纳州卫生官员(他们可以访问该州所有的卫生系统数据)发出了警报，因为它标记出了来急诊室抱怨相同症状的异常高水平患者，包括头晕、意识混乱、恶心。一名卫生官员对这一警报做出了回应，通知了医院。

根据卫生系统使用的现有数据，除了预警系统之外，没有任何事情引起关注。但是，在对这些投诉进行进一步的调查后，IU Health发现所有抱怨这些症状的人都有一些共同点——他们都住在同一个公寓大楼里。后来，公寓内的加热器出现故障，并向公寓内释放一氧化碳，导致住户生病。

借助机器学习快速分析、组织和分析大量数据的能力，卫生系统可以专注于响应数据中的警报和异常值(图1)，在预防阶段进行干预，并立即采取行动解决护理方面的差距，而不是在患者病情恶化后提供护理。

医疗保健机器学习——急诊就诊数据中的异常值示例 — *图1。急诊就诊中的异常值。*

自动报告提高了准确性，减轻了供应商的负担

机器学习还可以帮助组织减轻报告负担，提高准确性。由于有无数的报告措施和报告数字的不断变化，卫生系统和临床医生难以报告一致的准确信息，原因有很多:

他们的其他工作负担过重。
他们不知道他们应该报告什么，因为报告经常变化。
他们认为是别人干的。

机器学习可以使通信系统自动化，减少人工报告的负担，在某些情况下，甚至完全消除人工报告的负担。有一次，IU Health在肯塔基州治疗了许多癌症患者。肯塔基州要求向州卫生部门报告癌症诊断，而在研究进行时，癌症发病率似乎太低了。

为了解决肯塔基州卫生部和IU Health之间的癌症诊断报告不足的沟通问题，IU Health使用机器学习——而不是传统的ICD-9代码——从免费文本报告中识别癌症发病率。机器学习算法标记了IU Health选择的单词(如“肿瘤”、“恶性”等)。该算法被证明比人工标记系统更准确。

预测模型解释健康的社会决定因素

预测模型，如NLP和文本挖掘，也帮助提供者采取一个整体的方法来照顾。例如，一名高血压患者可能在当地诊所接受治疗，但可能有其他未满足的需求(如食物、住房和就业)。通常这些SDoH对病人健康的影响和医疗护理一样大，甚至更大。因为病人在诊所里的平均时间不到他们生命的1%，临床医生必须了解病人在诊所门外的生活。

为了有效地捕获SDoH, IU Health使用环境数据、犯罪统计数据、住房统计数据和邮政编码的社会经济地位，结合临床数据，建立了一个定制的预测模型。该预测模型为初级保健诊所的社区护理护士提供了关于患者在医疗保健环境之外面临的挑战的信息;然后，护士可以确定营养和经济咨询的转诊，以及更多。通过针对医疗保健机构独特人群的机器学习算法，提供商可以更全面地治疗患者。

机器学习工具将医疗保健交付推向了下一步

由于卫生数据只会增长，卫生系统需要工具来利用这一不断扩大的资源，提取更好的数据。尽管机器学习并非完美无缺，存在不可避免的误差，而且该行业的问题仍然多于答案，但机器学习正在开始在复杂的医疗领域提供真正的价值。

随着卫生系统继续在缩减预算和报销的情况下提供高质量的医疗服务，数据和分析对成功至关重要。然而，该行业需要更多高质量的数据来开发更好的算法，以回答正确的问题。这些见解将使临床医生关注患者，同时依靠数据做出最明智的决定。机器学习永远不会取代医疗保健中的人为因素，但它可以减轻护理团队的耗时任务，让他们专注于最重要的事情，以患者需要的方式、时间和地点为他们提供护理。

幻灯片

你想使用或分享这些概念吗?下载突出重点的演示文稿。

按此下载幻灯片

机器学习工具解锁非结构化健康数据中最关键的见解从世界杯葡萄牙vs加纳即时走地

德国vs家具

本网站使用cookie

我们很自豪能为您提供相关的、有用的内容。我们可以用cookie记录你读了什么吗?我们非常重视您的隐私。请参阅我们的隐私政策详情和任何问题。

机器学习工具解锁非结构化健康数据中最关键的见解

世界杯葡萄牙vs加纳即时走地健康催化剂编辑

文章总结

跳转到:

下一个:

医疗保健质量改进:基本业务战略

世界杯葡萄牙vs加纳即时走地健康催化剂编辑

未触及的非结构化数据是全面护理的关键

文本挖掘提供患者护理周围的环境——医疗保健机器学习成功的关键资源

机器学习在现实世界中提供真正的价值

自动报告提高了准确性，减轻了供应商的负担

预测模型解释健康的社会决定因素

机器学习工具将医疗保健交付推向了下一步

更多的阅读

幻灯片

本网站使用cookie