资源简介
摘要:本文件规定了医疗大模型的构建流程、数据要求、模型训练方法、性能评估指标及应用场景规范。本文件适用于基于人工智能技术开发和应用医疗大模型的相关机构和个人。
Title:Standard for Construction and Application of Medical Large Models TBHSEA 013-2024
中国标准分类号:L75
国际标准分类号:35.240
封面预览
拓展解读
THBSEA 013-2024《医疗大模型构建与应用标准》是近年来医疗信息化领域的重要文件之一。其中,关于“数据安全与隐私保护”这一章节的修订内容具有重要意义。与旧版相比,新版标准不仅增加了对敏感医疗数据加密传输的具体要求,还明确了模型训练过程中数据匿名化的技术规范。
以“数据匿名化”为例,新版标准指出,在构建医疗大模型时,所有涉及患者个人身份信息的数据都必须经过严格的匿名化处理。这意味着不仅要删除直接标识符(如姓名、身份证号),还需要通过算法移除间接标识符(如就诊时间、疾病种类等可能组合后推断出个人信息的内容)。具体操作上,推荐采用K-匿名性原则,确保每组匿名数据至少包含k个个体,从而降低单个个体被识别的风险。
此外,对于医疗大模型的开发者而言,还应建立完善的数据管理流程,包括但不限于数据采集前的知情同意书签署、数据存储期间的访问权限控制以及数据销毁后的审计记录保存。这些措施能够有效保障患者隐私的同时,也为医疗机构和科研机构提供了合法合规的技术支持框架。