人工智能目前存在的问题及临床试验设计思路(2)
1.7 医学伦理问题
人工智能是否可以真的替代医生,谁将对其诊疗结果承担法规责任,如果是算法出现问题人工智能研发公司是否要承担全部责任;如果医生依靠人工智能出现诊疗错误,医生应该承担什么的责任;这将是需要讨论的问题。目前的人工智能只是辅助医生进行诊疗,最终的诊疗结果还是应由医生做出。但人工智能的“误导”可能成为医院与企业未来的纠纷点。
2.人工智能产品的临床验证
目前图像分析类人工智能产品逐渐火热,鉴于目前图像分析类人工智能产品开始越来越多的进行临床试验,本文就对这类人工智能产品进行分析论述,希望可以引发大家对这类产品临床试验设计的思考。
2.1 图像分析类人工智能产品的本质
图像分析主要目的是为医生提供辅助诊断结果。虽然目前人工智能图像分析类产品各种各样,但如果将其各种预期用途简化,其本质就是“诊断产品”。那么临床试验设计思路就需要按诊断试验的方法进行,而诊断试验的主要目的是验证待评价方法与“金标准”或参考方法对某种测量参数判断结果的一致性以及其程度。
2.2 定量还是定性诊断
在进行诊断试验设计前,企业首先要明确的问题是:产品属于定量诊断还是定性诊断,或者说侧重于定量诊断还是定性诊断。需要说明的是:在某些条件下,定量指标是可以转换为定性指标。如,以1cm为分界点(Cutoff值),当CT图像中发现大于1cm的结节时可认为存在“阳性”结节,当CT图像中发现小于1cm的结节时可认为存在“阴性”结节。此时根据分界点就可以将定量指标转换为定性指标。
2.3 适应证或适用范围
企业在撰写适应证或适用范围应仔细斟酌用词,应结合产品的特点,客观的描述产品的适应证或适用范围,切忌不要为了突出产品特点而有意夸大适应证或适用范围。
根据目前图像分析类产品的研发规律、所存在的问题以及医学伦理等,建议企业在撰写适应证或适用范围时应选择“辅助诊断”的描述,而谨慎使用“诊断”的描述。
在撰写产品所涉及的疾病或症状时,要区分针对的是某种特定的疾病还是某种特定的症状。如“用于视网膜眼底病变的筛查”还是“用于糖尿病视网膜眼底病变的筛查”。
因此,企业在描述产品的适应证或适用范围时,应结合产品的研发数据,判断产品的研发数据是针对于“疾病”还是“症状或体征”,如果研发数据是针对“症状或体征”的判断,那么在适应证或适用范围就不要夸大为针对某种“疾病”。
2.4 金标准的选择
诊断试验的主要目的是验证待评价方法与“金标准”或参考方法对某种测量参数判断结果的一致性以及其程度。因此,“金标准”或参考方法选择就至关重要。但由于目前图像分析类人工智能产品的算法各不相同,且已上市的同类产品很少,所以目前图像分析类人工智能产品还是选择“金标准”作对照。
图像分析类人工智能产品主要是对医学图像进行分析,因此这类产品的“金标准”一般都是医生判读结果。但在选择医生判读结果作为“金标准”应注意以下问题:①最好是采用公认的“金标准”。如果是采用量表作为“金标准”,需要保证量表的信度和效度是经过检验的;②为保证读片数据的客观性,图像数据可以采用中心化阅片的方式进行;③可采用设置图像结果讨论小组的方法对读片不一致的情况以予解决。
2.5 目标人群的考虑
图像分析类人工智能产品除了要有发现目标疾病的能力,还要有排除非目标疾病的能力。因此,在受试者选择时既要包括“阳性”患者,也要包括“阴性”患者;既要包括有病情较轻的患者,也要包括病情较重的患者;既要包括有典型的患者,也要包括非典型的患者或易混疾病患者。如果受试者选择,特别是对照组患者选择不当,其临床结果将是不可靠的,结果也难以在一般人群中进行推断。
2.6 评价指标选择
根据图像分析类人工智能产品的最终分析结果,其评价指标主要为定性指标和定量指标。定性指标主要有:灵敏度、特异度、符合率和Kappa值。定量指标主要有:离群点检查、回归拟合方程、Pearson相关系数、Bland-Altman图、医学决定水平处偏倚。
2.7 样本量的计算
由于定量诊断可在一定条件下转换为定性诊断,定性诊断为较为固定的样本量估算公式。因此,人工智能样本量一般采用定性诊断样本量计算公式。下文以定性诊断样本量计算公式为例,来讲解样本量计算过程。
文章来源:《世界临床药物》 网址: http://www.sjlcywzz.cn/qikandaodu/2021/0712/1439.html
上一篇:医疗大数据是推动精准医疗和临床科研的新引擎
下一篇:常见猪病临床和病理剖检诊断要点