医疗数据隐私领域的AI位于两个一旦出错就会产生巨大后果的事物的交汇处:医疗信息和大规模处理这些信息的自动化系统。医疗领域的AI确实能够改善患者治疗效果、减少诊断错误,并减轻临床人员的行政负担——这些时间本应用于患者护理。但是,使这些改进成为可能的同一些系统也带来了新的问题:谁有权访问敏感的健康信息?这些信息如何被用于直接临床目的之外的用途?当系统失效或受到威胁时会发生什么?
了解这些风险如何运作、存在哪些保护措施,以及医疗环境中负责任的AI部署是什么样子,对于医疗服务提供者、管理人员或患者来说不是可选知识——他们正在一个变化速度比大多数人意识到的更快的系统中前行。

为什么医疗数据应当享有不同的标准
并非所有个人数据都具有相同的敏感性。财务信息很严重。位置数据具有重大影响。但健康数据由于其揭示的内容和所能引发的后果而占据一个独特的类别。一个人的病史、诊断记录、用药信息、基因数据和心理健康史,如果落入坏人之手或以个人从未同意的方式使用,可能会影响他们的保险资格、就业前景、个人关系和人身安全。
这就是为什么医疗行业历来在比大多数其他行业更严格的数据保护规则下运作。在澳大利亚,Privacy Act和Australian Privacy Principles适用于健康信息,并附有特定的额外要求。My Health Records Act管理国家数字健康记录系统。基于州的健康记录立法在多个司法管辖区增加了进一步的义务。在国际上,美国的HIPAA和欧洲的GDPR等框架制定了影响任何跨境运营或使用国际开发模型的AI系统的标准。
AI在这一格局中所做的就是在数据移动、处理或影响决策的每个点引入新的复杂性。传统的电子健康记录系统存储数据并使授权用户可以访问。一个在健康数据上训练、部署用于辅助临床决策或处理行政记录的AI系统则做了一些结构上不同的事情。它从数据中学习。它进行推断。它产生的输出可能以并不总是透明或可预测的方式携带其训练数据的痕迹。
了解在医疗环境中部署的任何系统的AI架构是理解它实际产生哪些数据隐私风险的起点,因为架构决定了数据去向、保留什么以及在技术上可能实现哪些保护。
AI在医疗数据中真正的隐私担忧
AI给医疗行业带来的隐私风险不是假设性的。随着AI在临床和行政环境中的部署加速,它们是具体的、有记录的且不断增长。
训练数据暴露是最重要且最不可见的风险之一。许多用于医疗的AI系统是在包含真实患者信息的大型数据集上训练的。如果该训练没有按照适当的去标识化标准进行,则该模型可能已经有效地将患者数据编码到其参数中,有时可以通过有针对性的查询来提取。其记录用于训练诊断AI系统的患者不一定同意这种使用,并且可能无法知道这种情况已经发生。
推断和重新识别风险发生在AI系统被用于从健康数据中得出超出患者所分享或同意范围的结论时。一个分析电子健康记录模式的AI可能会从用药记录中推断出心理健康状况,从处方模式中推断出怀孕,或从诊断历史中推断出遗传倾向。每一项推断都会产生一条原始记录中不存在的新敏感信息,而患者可能并未透露或同意分享。
第三方供应商暴露是大多数医疗AI部署中的结构性风险。临床环境中使用的AI工具几乎从来不是由使用它们的医疗机构构建的。它们是技术公司的产品,这些公司的数据处理实践、安全标准和合同承诺差异很大。每个供应商关系都引入了一项需要根据隐私义务进行评估的数据共享安排,而这些评估通常不如对相同工具的临床评估严格。
跨系统的数据聚合带来了在单一记录中保存信息时不存在的隐私风险。从多个数据源中提取的AI系统,将临床记录与行政数据、计费信息以及可能的外部数据集结合起来,创建出比任何单一来源都要更具揭示性的档案。聚合健康数据的敏感性随着组合源数量的增加呈非线性增长。

哪些AI系统被认为对医疗数据隐私更安全
医疗AI和数据隐私背景下的安全不是二元的。它是系统设计方式、处理数据类型、控制措施以及部署中如何治理的函数。话虽如此,某些特征始终能够区分负责任处理医疗数据的AI系统和制造不必要风险的AI系统。
本地处理数据而不是传输到外部服务器的系统显著减少了暴露面。本地或私有云部署使医疗机构保留对数据所在位置以及谁可以访问数据的控制权,在结构上比基于云的系统(数据被传输到供应商基础设施并由其处理)风险更低。这并不意味着基于云的医疗AI本质上不安全,但确实意味着供应商评估过程需要更加严格。
在临床任务允许的情况下基于去标识化或合成数据运行的系统,可以在不必降低临床效用的情况下降低患者隐私风险。可以在适当去标识化数据集上训练和验证的诊断AI提供相同的分析能力,同时大大降低了真实患者数据暴露的风险。
获得与医疗环境相关的独立安全认证的系统,例如SOC 2 Type II、ISO 27001以及越来越多的针对AI特定治理的ISO 42001,提供了一定保证:安全控制已经过独立验证,而不是自我报告。
具有关于数据保留、二次使用限制和违规通知的明确合同承诺的系统,提供了使供应商问责成为可能的法律框架,而不仅仅是愿望。无法或不愿就其系统处理的健康数据做出具体合同承诺的供应商,无论其技术能力如何,都不适合临床部署。
医疗AI供应商的AI安全态势应该以与任何临床工具相同的严谨性进行评估。某物是软件而非医疗设备这一事实,在涉及健康数据的情况下,并不会减轻其失效或受到威胁的后果。
AI如何真正能够帮助医疗数据隐私
AI与医疗数据隐私之间的关系并非纯粹对立。经过适当设计和部署的AI工具可以在医疗环境中以人工流程无法在规模上匹敌的方式积极改善隐私保护。
自动去标识化是最明显的例子之一。在临床记录被用于研究、质量改进或培训之前删除或模糊化身份识别信息是一项耗时且容易出错的任务,如果手动完成的话。受过训练以识别和编辑身份识别信息的AI系统可以以比人工审查团队更高的一致性处理大量记录,降低姓名、地址或独特识别细节进入应匿名数据集的风险。
访问异常检测使用AI来监视谁在访问患者记录、何时访问以及出于何种明显目的。异常的访问模式——员工在正常工作时间之外下载大量记录、用户访问其临床任务范围之外的患者记录,或表明数据收集而非临床使用的查询模式——是AI监控系统可以标记以供审查的可检测信号。这种类型的监视在大型医疗系统中手动进行将不切实际。
同意管理自动化帮助医疗机构跟踪哪些患者已同意对其数据的哪些使用,并确保AI系统仅在这些同意边界内处理数据。随着AI使数据使用变得更加复杂,以编程方式管理同意变得越来越必要,而不是可选项。
数据最小化执行使用AI确保系统仅收集和保留其所述目的所需的数据。这是隐私法的核心原则,在没有自动化协助的情况下,难以在大型复杂的医疗系统中始终如一地执行。
| AI隐私应用 | 它的功能 | 隐私收益 |
|---|---|---|
| 自动去标识化 | 大规模从记录中删除身份识别信息 | 在保护患者身份的同时实现数据用于研究 |
| 访问异常检测 | 监控并标记异常的记录访问模式 | 早期发现未经授权的访问或内部滥用 |
| 同意管理 | 跟踪并执行同意边界内的数据使用 | 确保AI系统以编程方式遵循患者同意 |
| 数据最小化执行 | 将数据收集和保留限制在所述目的范围内 | 减少因超出必要期限而保留数据所带来的暴露 |
| 违规检测和响应 | 实时识别潜在的数据泄露 | 更快的响应减少隐私事件的范围 |
AI在医疗领域隐私之外的风险
医疗数据隐私的AI位于一个更广泛的风险格局之中,医疗服务提供者和管理人员需要全面了解,因为隐私失效很少独立于其他类型的系统故障发生。
临床错误放大是指AI系统提出错误建议时会以一致和大规模的方式进行——人类临床医生犯个别错误不会出现这种情况。诊断AI若对特定诊断存在系统性偏向或反对,可能在该模式被发现之前影响数百或数千名患者,特别是在临床医生未经独立验证就信任AI输出的情况下。
算法偏见已在多个临床领域的医疗AI中得到记录。在历史健康数据上训练的AI系统继承了这些数据中存在的偏见,包括临床数据集中某些人口统计群体的系统性代表性不足以及不同人群在诊断和治疗方面的历史不平等。在主导其训练数据的人群中表现良好的AI系统在代表性不足群体的患者中可能表现明显较差,造成差异化护理质量,加剧现有的健康不平等。
监管和责任暴露是一种日益增长的风险,因为澳大利亚和国际上的监管机构正在为医疗领域的AI制定更具体的期望。Therapeutic Goods Administration已经发布了关于作为医疗设备的软件的指南,该指南适用于许多临床AI应用。在没有充分监管评估的情况下部署AI的医疗机构既面临法律风险,也面临必须删除或修改已嵌入临床工作流程的系统的运营中断。

受监管行业中负责任AI部署的结构化指南可以帮助医疗机构以优先解决最高风险因素的顺序,应对临床、隐私和监管要求的交叉点。
部署AI的医疗机构的实用标准
大多数医疗机构当前的AI部署实践与真正稳健的隐私和安全治理之间的差距确实存在,但可以弥合。几项实用标准提供了在医疗环境中负责任地部署AI所需的结构。
数据保护影响评估应在任何涉及患者数据的新AI部署之前进行。这些评估评估系统处理的数据、该处理产生的风险、已采取的缓解措施以及考虑到临床收益是否可接受残余风险。它们在几个隐私框架下都是必需的,无论是否有法律义务,都是良好实践。
供应商尽职调查协议应为任何系统将处理患者数据的AI供应商建立最低要求。这些要求应包括安全认证、数据处理协议、违规通知承诺、子处理者披露以及数据保留和删除政策。无法满足这些要求的供应商不应在临床环境中部署,无论其工具提供的临床能力如何。
临床治理整合意味着将医疗领域的AI系统视为临床工具,受与其他临床工具相同的治理流程的约束,包括临床证据评估、持续性能监控、不良事件报告以及定期审查该工具在部署的临床环境中是否继续按预期表现。
关于AI和隐私的员工培训确保使用AI工具的临床医生和管理人员了解他们在AI辅助环境中的隐私义务,包括哪些数据可以输入AI系统、如何在不过度依赖的情况下解释AI输出,以及如何对似乎与临床预期或隐私要求不一致的AI行为提出担忧。
| 治理标准 | 所需内容 | 负责方 |
|---|---|---|
| 数据保护影响评估 | 部署前正式的隐私风险评估 | 隐私官和临床信息学负责人 |
| 供应商尽职调查协议 | 所有AI供应商的安全和数据处理要求 | 法务、IT安全和采购 |
| 临床治理整合 | AI被视为受临床治理约束的临床工具 | 临床治理委员会 |
| 同意框架审查 | 根据AI数据使用评估现有患者同意 | 法务和隐私官 |
| 员工培训计划 | 临床医生和管理员的AI和隐私培训 | 人力资源、临床教育和信息学 |
| 持续性能监控 | 定期审查AI系统行为和结果 | 临床信息学和质量团队 |
关于医疗数据隐私AI需要了解的事项
- 健康信息在澳大利亚隐私法下被归类为敏感信息,这意味着它要求比一般个人信息更高的保护要求,并且未经明确法律依据或同意不得收集或使用。
- 即使数据已去标识化,未经明确同意使用患者数据进行模型改进的AI系统仍可能违反隐私义务,因为去标识化方法并非普遍稳健,重新识别风险取决于数据集的丰富程度。
- 澳大利亚的My Health Records系统具有特定的立法保护,影响AI系统对通过该系统访问的记录可以做什么,医疗机构需要在部署与My Health Records数据交互的AI之前了解这些限制。
- AI辅助护理的患者同意是一个不断发展的领域。一些司法管辖区正在朝着要求在AI系统参与其临床护理时告知患者的方向发展,无论AI是在做出还是支持临床决定。
- 医疗数据隐私的AI不仅仅是一个技术问题。医疗AI部署中最重要的隐私失败通常涉及治理缺口、供应商管理失败或员工行为,而不是技术系统泄露。
- 用于澳大利亚医疗环境的国际AI模型,无论模型在哪里开发或供应商在哪里,只要处理的数据与澳大利亚患者相关,都受澳大利亚隐私法管辖。
- 医疗领域AI相关隐私违规的事件响应规划需要考虑Privacy Act下的可报告数据违规义务,该义务要求在发生严重数据违规时同时通知OAIC和受影响个人。
负责任地驾驭医疗数据隐私的AI
医疗行业不会放缓其AI采用速度,并且有真正的理由它不应该这样做。AI支持更早的诊断、减少临床错误、减轻行政负担、将专科专长扩展到服务不足地区的潜力是真实而显著的。挑战不是抵制医疗领域的AI,而是以患者可以信任和提供者可以辩护的方式部署它。
此背景下的信任不是一个软概念。它是可证明的隐私保护、透明的数据处理、严格的安全和临床治理的实际结果,将AI系统置于与其他临床工具相同的证据和问责标准之下。了解他们的健康数据被用于训练AI系统、这些系统做出影响他们护理的建议,并且对如何处理这些数据有强有力保障的患者,才能对AI辅助护理给予有意义的同意。
使医疗AI在临床背景下具有吸引力的AI功能需要与使其在治理背景下可接受的隐私和安全功能相匹配。从一开始就将这两件事一起构建的机构将发现自己在该领域的监管期望继续发展并变得更加具体时处于明显更有利的位置。
关于医疗数据隐私AI的常见问题
AI在医疗数据中有哪些隐私担忧?
主要隐私担忧包括训练数据暴露,即患者信息在未获得充分同意的情况下嵌入到AI模型中;重新识别风险,即AI从可用数据中推断敏感状况;第三方供应商数据共享,没有足够的保障;以及跨系统的记录聚合,创建出比任何单一来源都更敏感的档案。 这些风险中的每一个都需要特定的治理响应,而不是单一的全面保护措施。
哪种AI对数据隐私是安全的?
本地处理数据而不是传输到外部服务器、在明确的合同数据使用限制下运行、持有SOC 2 Type II和ISO 27001等独立安全认证,并通过正式的数据保护影响评估进行了评估的AI系统,通常被认为对医疗数据隐私更安全。 安全是治理和架构的函数,而不是任何特定工具或供应商的特性。
AI如何帮助数据隐私?
AI通过临床记录的自动去标识化、未经授权数据访问的异常检测、同意管理执行以及限制收集和保留至临床必要范围的数据最小化控制,积极支持数据隐私。 这些能力使隐私保护可以在大型医疗系统中以一致的方式大规模应用,这是手动流程无法可靠实现的。
医疗领域的AI有多安全?
医疗AI的安全性因供应商、部署模型和医疗机构应用的治理框架而异。 经过严格供应商尽职调查、具有独立安全认证、尽可能进行本地数据处理并对异常行为进行主动监控部署的系统,比未采用这些控制措施的系统要安全得多,无论它们提供的临床能力如何。
医疗领域的AI有哪些风险?
这些风险涵盖临床、隐私和运营维度,包括大规模诊断错误放大、对代表性不足患者群体的算法偏见、不合规部署的监管风险、不充分供应商管理引起的隐私违规,以及在没有充分临床验证的情况下过度依赖AI输出。 管理这些风险需要将AI视为受与其他临床技术相同的证据和问责标准约束的临床工具的治理。
