温馨提示:这篇文章已超过446天没有更新,请注意相关的内容是否还可用!
天池医疗AI大赛第一季Rank5的解决方案聚焦于医疗影像分析和疾病诊断。该方案利用深度学习技术,对医学影像进行智能识别和分析,提高疾病诊断的准确性和效率。通过参与竞赛的AI模型,结合先进的算法和大量的医疗数据训练,该方案旨在寻找最优的影像特征表达和诊断模型。这一解决方案不仅有助于提升医疗行业的智能化水平,也为患者带来更加精准和高效的医疗服务。
赛题说明
本次大赛数据集包含数千份高危患者的低剂量肺部CT影像(mhd格式)数据,每个影像包含一系列胸腔的多个轴向切片,影像包含的切片数量会因扫描机器、扫描层厚和患者的不同而有所差异,原始图像为三维图像,由不同数量的二维图像组成,其二维图像数量会受到诸如扫描机器、患者等因素的变化影响,Mhd文件含有关于患者ID的必要信息头部,以及诸如切片厚度的扫描参数。
训练集和验证集的所有数据全部都有结节,除了进行病理分析的结节外,其它结节都由三位医生进行标记确认,CSV文件标注了结节的位置和大小,参赛者需提交一个CSV文件,标注每一列的名称,分别为图像ID号,坐标和概率,从第二行起的每一行都标记一个检测到的结节,坐标为检测到的结节的中心坐标x, y, z的数值。
赛题解读
这是一个目标检测(object detection)的问题,需要在3D的CT图像中找到结节的位置,目前目标检测做得最好的是Kaiming He团队提出的RCNN系列结构(2D),我们尝试过使用Faster RCNN,但由于其开销特别大,导致我们只能实现2D版本,但2D版本丢失了3D的context信息,使得模型效果不理想,我们参考了以直接预测著称的SSD、YOLO系列,最终决定采用3D版本的YOLO,效果得到了显著提升。
数据预处理——肺部区域提取
根据以往比赛的经验,肺结节检测需要先把肺部区域提取出来,提取肺部区域的好处是减少了无关区域对模型的影响,使模型在更小的区域规模上进行预测。
我们综合了前面比赛的经验,实现了肺部区域提取代码,大致的流程如下:
1、根据图形学信息进行label标注,使相邻区域有相同的label。
2、提取面积最大的两个label区域,这两个区域就是两个肺结节。
3、由于不同影像的拍摄参数不同,导致影响的origin、spacing等信息也不同,数据重采样是必须的,主要通过插值把图像的分辨率统一起来。
4、进行相应的坐标变换,并进行元信息保存,坐标变换需要注意,除了根据origin、spacing进行世界坐标转换外,还需要根据肺部区域,重新更新ground truth的位置信息。
对于某些特殊的影像,依靠上述步骤很难提取出肺部区域,我们需要进行统计分析,总结出这类影像的分布规律,直接对原始影像进行处理,这部分涉及了很多图形学知识,具体实现可以参考我们的代码。
模型构建
模型构建采用的是3D版本的YOLO,需要注意的是,我们的基础网络架构与原论文的有两点重要不同:
1、基本网络结构我们采用了类似Unet的形式,这种结构的好处是使网络的receptive field变得很大,使网络可以同时融合深层网络的语义信息以及浅层网络的context信息。
2、我们把采样的数据在原始图形的位置信息融入网络,我们认为位置信息有助于肺结节检测。
我们的网络结构先做4次卷积操作和pooling操作,然后做2次反卷积(deconvolution),最后得到的输出比原图要小,最后再做一次卷积,num_output为5*5,第一次的5表示有5种结节anchor大小,第二次的5代表对每一个bounding box预测5个数字,这些数字包括该bounding box的xyz方向的偏移量、直径大小偏移量、肺结节概率,每一次卷积操作都用了2-3层的ResNet结构以及BatchNorm操作和ReLU激活函数,每一次反卷积都会先和前面卷积时候对应大小中间结果连接(concat),第二次连接还加入了Coord,这表示对应每一个点在原图中的xyz坐标。
其他需要注意的有:
1、Online data sample:由于每一个患者的图像大小都不同,每一次获取数据时会以结节位置为中心随机crop图像的一部分,大小为128*128*128,这样不仅能提高训练速度,也能增加数据多样性,也会对crop后的图像做augmetation的操作,随机地翻转、旋转、放大缩小图像,在sample的时候,会控制crop的图像位置,使得大部分crop图像都包含肺结节。
2. Hard mining:由于负样本数量太大且多是容易分类的,因此提出了focal loss解决这一问题,我们采用了hard mining策略来关注那些不容易分类的样本。
3. 结节大小的影响:大部分结节都是小结节(直径为5-10mm),因此对预测结果影响极大,而小结节在神经网络中经过几次pooling之后可能就消失了,在训练过程中要有效地平衡大结节和小结节的数量。
4. NMS(Non-Maximum Suppression):为了丰富肺结节检测的位置分布,我们采用了业界通用的NMS。
5. 模型融合(model ensemble):由于肺结节大小分布的不均匀性,很难用一个模型或
还没有评论,来说两句吧...