天池医疗AI大赛[第一季] Rank5解决方案,天池医疗AI大赛第一季Rank5解决方案详解

马肤

温馨提示:这篇文章已超过446天没有更新,请注意相关的内容是否还可用!

天池医疗AI大赛第一季Rank5的解决方案聚焦于医疗影像分析和疾病诊断。该方案利用深度学习技术,对医学影像进行智能识别和分析,提高疾病诊断的准确性和效率。通过参与竞赛的AI模型,结合先进的算法和大量的医疗数据训练,该方案旨在寻找最优的影像特征表达和诊断模型。这一解决方案不仅有助于提升医疗行业的智能化水平,也为患者带来更加精准和高效的医疗服务。

赛题说明

本次大赛数据集包含数千份高危患者的低剂量肺部CT影像(mhd格式)数据,每个影像包含一系列胸腔的多个轴向切片,影像包含的切片数量会因扫描机器、扫描层厚和患者的不同而有所差异,原始图像为三维图像,由不同数量的二维图像组成,其二维图像数量会受到诸如扫描机器、患者等因素的变化影响,Mhd文件含有关于患者ID的必要信息头部,以及诸如切片厚度的扫描参数。

天池医疗AI大赛[第一季] Rank5解决方案,天池医疗AI大赛第一季Rank5解决方案详解 第1张

训练集和验证集的所有数据全部都有结节,除了进行病理分析的结节外,其它结节都由三位医生进行标记确认,CSV文件标注了结节的位置和大小,参赛者需提交一个CSV文件,标注每一列的名称,分别为图像ID号,坐标和概率,从第二行起的每一行都标记一个检测到的结节,坐标为检测到的结节的中心坐标x, y, z的数值。

赛题解读

这是一个目标检测(object detection)的问题,需要在3D的CT图像中找到结节的位置,目前目标检测做得最好的是Kaiming He团队提出的RCNN系列结构(2D),我们尝试过使用Faster RCNN,但由于其开销特别大,导致我们只能实现2D版本,但2D版本丢失了3D的context信息,使得模型效果不理想,我们参考了以直接预测著称的SSD、YOLO系列,最终决定采用3D版本的YOLO,效果得到了显著提升。

数据预处理——肺部区域提取

根据以往比赛的经验,肺结节检测需要先把肺部区域提取出来,提取肺部区域的好处是减少了无关区域对模型的影响,使模型在更小的区域规模上进行预测。

我们综合了前面比赛的经验,实现了肺部区域提取代码,大致的流程如下:

1、根据图形学信息进行label标注,使相邻区域有相同的label。

2、提取面积最大的两个label区域,这两个区域就是两个肺结节。

3、由于不同影像的拍摄参数不同,导致影响的origin、spacing等信息也不同,数据重采样是必须的,主要通过插值把图像的分辨率统一起来。

4、进行相应的坐标变换,并进行元信息保存,坐标变换需要注意,除了根据origin、spacing进行世界坐标转换外,还需要根据肺部区域,重新更新ground truth的位置信息。

对于某些特殊的影像,依靠上述步骤很难提取出肺部区域,我们需要进行统计分析,总结出这类影像的分布规律,直接对原始影像进行处理,这部分涉及了很多图形学知识,具体实现可以参考我们的代码。

模型构建

模型构建采用的是3D版本的YOLO,需要注意的是,我们的基础网络架构与原论文的有两点重要不同:

天池医疗AI大赛[第一季] Rank5解决方案,天池医疗AI大赛第一季Rank5解决方案详解 第2张

1、基本网络结构我们采用了类似Unet的形式,这种结构的好处是使网络的receptive field变得很大,使网络可以同时融合深层网络的语义信息以及浅层网络的context信息。

2、我们把采样的数据在原始图形的位置信息融入网络,我们认为位置信息有助于肺结节检测。

我们的网络结构先做4次卷积操作和pooling操作,然后做2次反卷积(deconvolution),最后得到的输出比原图要小,最后再做一次卷积,num_output为5*5,第一次的5表示有5种结节anchor大小,第二次的5代表对每一个bounding box预测5个数字,这些数字包括该bounding box的xyz方向的偏移量、直径大小偏移量、肺结节概率,每一次卷积操作都用了2-3层的ResNet结构以及BatchNorm操作和ReLU激活函数,每一次反卷积都会先和前面卷积时候对应大小中间结果连接(concat),第二次连接还加入了Coord,这表示对应每一个点在原图中的xyz坐标。

其他需要注意的有:

1、Online data sample:由于每一个患者的图像大小都不同,每一次获取数据时会以结节位置为中心随机crop图像的一部分,大小为128*128*128,这样不仅能提高训练速度,也能增加数据多样性,也会对crop后的图像做augmetation的操作,随机地翻转、旋转、放大缩小图像,在sample的时候,会控制crop的图像位置,使得大部分crop图像都包含肺结节。

2. Hard mining:由于负样本数量太大且多是容易分类的,因此提出了focal loss解决这一问题,我们采用了hard mining策略来关注那些不容易分类的样本。

3. 结节大小的影响:大部分结节都是小结节(直径为5-10mm),因此对预测结果影响极大,而小结节在神经网络中经过几次pooling之后可能就消失了,在训练过程中要有效地平衡大结节和小结节的数量。

4. NMS(Non-Maximum Suppression):为了丰富肺结节检测的位置分布,我们采用了业界通用的NMS。

5. 模型融合(model ensemble):由于肺结节大小分布的不均匀性,很难用一个模型或


0
收藏0
文章版权声明:除非注明,否则均为VPS857原创文章,转载或复制请以超链接形式并注明出处。

相关阅读

  • 【研发日记】Matlab/Simulink自动生成代码(二)——五种选择结构实现方法,Matlab/Simulink自动生成代码的五种选择结构实现方法(二),Matlab/Simulink自动生成代码的五种选择结构实现方法详解(二)
  • 超级好用的C++实用库之跨平台实用方法,跨平台实用方法的C++实用库超好用指南,C++跨平台实用库使用指南,超好用实用方法集合,C++跨平台实用库超好用指南,方法与技巧集合
  • 【动态规划】斐波那契数列模型(C++),斐波那契数列模型(C++实现与动态规划解析),斐波那契数列模型解析与C++实现(动态规划)
  • 【C++】,string类底层的模拟实现,C++中string类的模拟底层实现探究
  • uniapp 小程序实现微信授权登录(前端和后端),Uniapp小程序实现微信授权登录全流程(前端后端全攻略),Uniapp小程序微信授权登录全流程攻略,前端后端全指南
  • Vue脚手架的安装(保姆级教程),Vue脚手架保姆级安装教程,Vue脚手架保姆级安装指南,Vue脚手架保姆级安装指南,从零开始教你如何安装Vue脚手架
  • 如何在树莓派 Raspberry Pi中本地部署一个web站点并实现无公网IP远程访问,树莓派上本地部署Web站点及无公网IP远程访问指南,树莓派部署Web站点及无公网IP远程访问指南,本地部署与远程访问实践,树莓派部署Web站点及无公网IP远程访问实践指南,树莓派部署Web站点及无公网IP远程访问实践指南,本地部署与远程访问详解,树莓派部署Web站点及无公网IP远程访问实践详解,本地部署与远程访问指南,树莓派部署Web站点及无公网IP远程访问实践详解,本地部署与远程访问指南。
  • vue2技术栈实现AI问答机器人功能(流式与非流式两种接口方法),Vue2技术栈实现AI问答机器人功能,流式与非流式接口方法探究,Vue2技术栈实现AI问答机器人功能,流式与非流式接口方法详解
  • 发表评论

    快捷回复:表情:
    评论列表 (暂无评论,0人围观)

    还没有评论,来说两句吧...

    目录[+]

    取消
    微信二维码
    微信二维码
    支付宝二维码