资源简介
摘要:本文件规定了骨龄辅助诊断领域中人工智能医疗器械的数据集质量要求与评价方法,包括数据采集、标注、清洗、验证等环节的技术要求。本文件适用于基于人工智能技术的骨龄辅助诊断系统及相关产品的开发、测试和评估。
Title:Quality Requirements and Evaluation of Artificial Intelligence Medical Devices for Bone Age Auxiliary Diagnosis - Part 1: Dataset
中国标准分类号:L80
国际标准分类号:11.040.80
封面预览
拓展解读
本文聚焦于TCSBME 064-2022《骨龄辅助诊断人工智能医疗器械质量要求与评价 第1部分:数据集》中关于数据集标注一致性要求的新旧版本差异,并深入解析其应用方法。
在旧版标准中,对数据集标注的一致性仅提出了原则性要求,未给出具体量化指标。而在新版标准中,明确了数据集标注一致性需达到≥95%的标准,且提供了具体的计算公式:一致性比例 = (一致标注样本数 / 总标注样本数) × 100%。这意味着开发单位在构建训练数据集时,不仅需要确保标注人员的专业资质,还需建立完善的质控流程。
为满足这一要求,企业可采取以下措施:首先,组建由多名高年资影像科医生构成的标注团队,并定期开展培训与考核;其次,在数据标注过程中引入多轮交叉验证机制,即每位标注者完成初步标注后,由其他标注者复核并提出修改意见;最后,利用统计学工具对标注结果进行分析,一旦发现一致性低于目标值,则需追溯原因并优化标注流程。
此外,还应注意,虽然新版标准提高了对标注一致性的要求,但这并不意味着可以忽视数据量的积累。实际上,高质量的数据集应当是大样本量与高一致性兼备。因此,在实际操作中,企业应平衡好数据采集规模与标注精度之间的关系,既要保证足够的样本数量以覆盖各类临床场景,又要通过严格的质控手段提升标注质量。