医学影像处理与智能医学:数据集资源和云端加速路径

2023-12-27 02:43:34

医学影像处理识别是一种利用计算机技术影像进行识别、分析和处理的方法。它主要应用于医学影像学领域,如 X 射线、CT 扫描、MRI 和超声等。通过图像处理技术,可以对这些影像进行数字化处理,提取有用信息,辅助医生进行疾病诊断、治疗规划和病情监测。

为了更好地支持研究人员深入了解医学影像处理技术,助力智能医学的发展,本文将介绍一系列相关的开源数据库和数据集资源。这些资源的综合使用将为医学影像处理技术的发展提供全面而有力的支持。

OpenNEURO 数据库

OpenNEURO 是一个以神经科学数据为主的免费且开源的数据库,其数据集涵盖MRI,MEG,iEEG,ECoG,ASL 和 PET。目前已收录 965 例数据集,共计 37397 名受试者的数据。

  • 数据库地址:https://openneuro.org/

FCON_1000和INDI项目数据库

该数据集的全称是 1000 Functional Connectomes Project (fcon_1000) and International Neuroimaging Data-sharing Initiative (INDI)。它内含很多不同分类的子数据库,主要目的是推进神经影像数据的开放共享。

  • 下载地址:https://fcon_1000.projects.nitrc.org/indi/IndiPro.html

DeepLesion

DeepLesion 是由美国国家卫生研究院(NIH)临床中心公开发布的大型 CT 图像数据集,包含来自 10000 多个病例研究的超过 32000 个病变标注,并且涉及多种病变类型,如肺结节、肝肿瘤、淋巴结肿大等。

  • 论文地址:https://doi.org/10.1117/1.JMI.5.3.036501

  • 下载地址:https://nihcc.app.box.com/v/DeepLesion

SA-Med2D-20M

SA-Med2D-20M 来源于大量公开和私有数据集,由 460 万张医学图像和近 2000 万个对应的掩膜构成,涵盖 10 种模态、31 个主要器官和 219 个类别,是迄今为止最大的医学图像分割数据集。

  • 下载地址:https://openxlab.org.cn/datasets/GMAI/SA-Med2D-20M/tree/main

  • 更多信息:https://zhuanlan.zhihu.com/p/669166729

FastMRI

FastMRI(快速磁共振成像)数据集由膝部 MRI 数据集和脑部 MRI 数据集组成。

膝部 MRI 数据集:1500 多个膝部 MRI 图像数据,以及 10000 张临床膝部 MRI 的 DICOM 数据图像。

脑部 MRI 数据集:6970 个完全采样的脑部 MRI 数据。

  • 下载地址:https://fastmri.med.nyu.edu/

  • 论文地址:https://arxiv.org/abs/2304.09254

  • 代码地址:https://github.com/cai2r/fastMRI_prostate

MNIST: HAM10000

HAM10000 是一个包含 10000 张训练图像的数据集,用于检测色素性皮肤病变。

  • 下载地址:https://www.kaggle.com/datasets/kmader/skin-cancer-mnist-ham10000

WORD

WORD 是一个大规模的腹部器官分割数据集,包含 150 (30495个切片)张全面覆盖腹部区域的 CT 扫描数据,并为 16 种不同腹部器官提供了详细标注。

  • 论文地址:https://arxiv.org/pdf/2111.02403.pdf

  • 下载地址:https://github.com/HiLab-git/WORD

MURA

MURA 是一个大规模的肌肉骨骼放射图像数据集,包含 40561 张多视角放射影像。这些影像是由经验丰富的放射科医生逐一进行精确标注。该数据集源于近15000 篇研究论文,其中 9067 篇为正常上肢骨骼肌 X 光片的研究,5915 篇是异常研究。

上肢包括肩膀、肱部、手肘、前臂、手腕、手、指端。

  • 论文地址:https://arxiv.org/abs/1712.06957

  • 下载地址:https://stanfordmlgroup.github.io/competitions/mura/

NIH Chest X-rays

NIH Chest X-ray 数据集是一个胸部 X 射线数据集,由美国国立卫生研究院临床中心发布,总共收集了 30805 名患者的,112120 张胸部 X 射线图片,其中包括许多患有晚期肺部疾病的患者。

  • 下载地址:https://www.kaggle.com/datasets/nih-chest-xrays/data

  • 论文地址:https://www.nih.gov/news-events/news-releases/nih-clinical-center-provides-one-largest-publicly-available-chest-x-ray-datasets-scientific-community

A chest x-ray identifies a lung mass

Chest X-ray PD Dataset

Chest X-ray PD Dataset 由感染 COVID-19 和其他肺炎的病患以及健康人群的,共计 4575 张 2D 胸部 X 射线图像组成。

  • 下载地址:https://data.mendeley.com/datasets/jctsfj2sfn/1


医学影像处理通常需要运行大量的图像重建、图像分割、特征提取和模式识别等计算密集型任务。GPU 能够通过其并行计算架构,加速这些任务的处理速度,显著缩短处理时间。尤其是对于深度学习和神经网络等需要大量训练和推理计算的任务来说,GPU 能够提供强大的计算能力,加快模型训练和推断的速度。

在趋动云平台,您不仅能够访问丰富多样的模型和数据集资源,还可以选择多种实例,如 P1.large、P1.2xlarge、P1.4xlarge 等。这些实例不仅拥有高达 80G 的大显存,还具备强大的计算能力。您可以根据训练任务的需求,轻松选择最适合的配置,助力您的每一次挑战。

文章来源:https://blog.csdn.net/m0_49711991/article/details/135194853
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。