日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪(fǎng)問(wèn) 生活随笔!

生活随笔

當(dāng)前位置: 首頁(yè) > 编程资源 > 编程问答 >内容正文

编程问答

【数据集】一文道尽医学图像数据集与竞赛

發(fā)布時(shí)間:2025/3/20 编程问答 54 豆豆
生活随笔 收集整理的這篇文章主要介紹了 【数据集】一文道尽医学图像数据集与竞赛 小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

文章首發(fā)于微信公眾號(hào)《有三AI》

【數(shù)據(jù)集】一文道盡醫(yī)學(xué)圖像數(shù)據(jù)集與競(jìng)賽

在AI與深度學(xué)習(xí)逐漸發(fā)展成熟的趨勢(shì)下,人工智能和大數(shù)據(jù)等技術(shù)開(kāi)始進(jìn)入了醫(yī)療領(lǐng)域,它們把現(xiàn)有的一些傳統(tǒng)流程進(jìn)行優(yōu)化,大幅度提高各種流程的效率、精度、用戶(hù)體驗(yàn),同時(shí)也緩解了醫(yī)療資源的壓力和精確度不夠的問(wèn)題。

?

01?醫(yī)學(xué)數(shù)據(jù)集

智能醫(yī)療有很多的發(fā)展方向,例如醫(yī)學(xué)影像處理、診斷預(yù)測(cè)、疾病控制、健康管理、康復(fù)機(jī)器人、語(yǔ)音識(shí)別病歷電子化等。當(dāng)前人工智能技術(shù)新的發(fā)力點(diǎn)中的醫(yī)學(xué)圖像在疾病的預(yù)測(cè)和自動(dòng)化診斷方面有非常大的意義,本篇即針對(duì)醫(yī)學(xué)影像中的病例分析,降噪,分割,檢索等領(lǐng)域來(lái)介紹一些常用的數(shù)據(jù)集。

1.1?病例分析數(shù)據(jù)集

1.1.1 ABIDE

數(shù)據(jù)集地址:

http://preprocessed-connectomes-project.org/abide/

發(fā)布于2013年,這是一個(gè)對(duì)自閉癥內(nèi)在大腦結(jié)構(gòu)的大規(guī)模評(píng)估數(shù)據(jù)集,包括539名患有ASD和573名正常個(gè)體的功能MRI圖像。

1.1.2 OASIS

數(shù)據(jù)集地址:http://www.oasis-brains.org/

OASIS,全稱(chēng)為Open Access Series of?Imaging Studies,已經(jīng)發(fā)布了第3代版本,第一次發(fā)布于2007年,是一項(xiàng)旨在使科學(xué)界免費(fèi)提供大腦核磁共振數(shù)據(jù)集的項(xiàng)目。它有兩個(gè)數(shù)據(jù)集可用,下面是第1版的主要內(nèi)容。

(1) 橫截面數(shù)據(jù)集:年輕,中老年,非癡呆和癡呆老年人的橫斷面MRI數(shù)據(jù)。該組由416名年齡在18歲至96歲的受試者組成的橫截面數(shù)據(jù)庫(kù)組成。對(duì)于每位受試者,單獨(dú)獲得3或4個(gè)單獨(dú)的T1加權(quán)MRI掃描包括掃描會(huì)話(huà)。受試者都是右撇子,包括男性和女性。100名60歲以上的受試者已經(jīng)臨床診斷為輕度至中度阿爾茨海默病。

(2) 縱向集數(shù)據(jù)集:非癡呆和癡呆老年人的縱向磁共振成像數(shù)據(jù)。該集合包括150名年齡在60至96歲的受試者的縱向集合。每位受試者在兩次或多次訪(fǎng)視中進(jìn)行掃描,間隔至少一年,總共進(jìn)行373次成像。對(duì)于每個(gè)受試者,包括在單次掃描期間獲得的3或4次單獨(dú)的T1加權(quán)MRI掃描。受試者都是右撇子,包括男性和女性。在整個(gè)研究中,72名受試者被描述為未被證實(shí)。包括的受試者中有64人在初次就診時(shí)表現(xiàn)為癡呆癥,并在隨后的掃描中仍然如此,其中包括51名輕度至中度阿爾茨海默病患者。另外14名受試者在初次就診時(shí)表現(xiàn)為未衰退,隨后在隨后的訪(fǎng)視中表現(xiàn)為癡呆癥。

1.1.3 DDSM

數(shù)據(jù)集地址:

http://marathon.csee.usf.edu/Mammography/Database.html

發(fā)布于2000年,這是一個(gè)用于篩選乳腺攝影的數(shù)字?jǐn)?shù)據(jù)庫(kù),是乳腺攝影圖像分析研究社區(qū)使用的資源。該項(xiàng)目的主要支持來(lái)自美國(guó)陸軍醫(yī)學(xué)研究和裝備司令部的乳腺癌研究計(jì)劃。DDSM項(xiàng)目是由馬薩諸塞州綜合醫(yī)院(D. Kopans,R. Moore),南佛羅里達(dá)大學(xué)(K. Bowyer)和桑迪亞國(guó)家實(shí)驗(yàn)室(P. Kegelmeyer)共同參與的合作項(xiàng)目。數(shù)據(jù)庫(kù)的主要目的是促進(jìn)計(jì)算機(jī)算法開(kāi)發(fā)方面的良好研究,以幫助篩選。數(shù)據(jù)庫(kù)的次要目的可能包括開(kāi)發(fā)算法以幫助診斷和開(kāi)發(fā)教學(xué)或培訓(xùn)輔助工具。該數(shù)據(jù)庫(kù)包含約2,500項(xiàng)研究。每項(xiàng)研究包括每個(gè)乳房的兩幅圖像,以及一些相關(guān)的患者信息(研究時(shí)間,ACR乳房密度評(píng)分,異常微妙評(píng)級(jí),異常ACR關(guān)鍵字描述)和圖像信息(掃描儀,空間分辨率等)。包含可疑區(qū)域的圖像具有關(guān)于可疑區(qū)域的位置和類(lèi)型的像素級(jí)“地面真實(shí)”信息。

1.1.4 MIAS

數(shù)據(jù)集地址:

http://peipa.essex.ac.uk/pix/mias/all-mias.tar.gz

https://www.repository.cam.ac.uk/handle/1810/250394?show=full

MIAS全稱(chēng)為MiniMammographic Database,是乳腺圖像數(shù)據(jù)庫(kù)。

乳腺M(fèi)G數(shù)據(jù)(Breast Mammography)有個(gè)專(zhuān)門(mén)的database,可以查看很多數(shù)據(jù)集,鏈接地址為:

http://www.mammoimage.org/databases/

1.1.5 MURA

數(shù)據(jù)集地址:

https://stanfordmlgroup.github.io/competitions/mura/

發(fā)布于2018年2月,吳恩達(dá)團(tuán)隊(duì)開(kāi)源了 MURA 數(shù)據(jù)庫(kù),MURA 是目前最大的 X 光片數(shù)據(jù)庫(kù)之一。該數(shù)據(jù)庫(kù)中包含了源自14982項(xiàng)病例的40895張肌肉骨骼X光片。1萬(wàn)多項(xiàng)病例里有9067例正常的上級(jí)肌肉骨骼和5915例上肢異常肌肉骨骼的X光片,部位包括肩部、肱骨、手肘、前臂、手腕、手掌和手指。每個(gè)病例包含一個(gè)或多個(gè)圖像,均由放射科醫(yī)師手動(dòng)標(biāo)記。全球有超過(guò)17億人都有肌肉骨骼性的疾病,因此訓(xùn)練這個(gè)數(shù)據(jù)集,并基于深度學(xué)習(xí)檢測(cè)骨骼疾病,進(jìn)行自動(dòng)異常定位,通過(guò)組織器官的X光片來(lái)確定機(jī)體的健康狀況,進(jìn)而對(duì)患者的病情進(jìn)行診斷,可以幫助緩解放射科醫(yī)生的疲勞。

公開(kāi)可用的醫(yī)學(xué)射線(xiàn)照相圖像數(shù)據(jù)集概述

參考2018年論文:MURA: Large Dataset for Abnormality Detection in Musculoskeletal Radiographs.

1.1.6 ChestX-ray14

數(shù)據(jù)集地址:

https://www.kaggle.com/nih-chest-xrays/data

https://nihcc.app.box.com/v/ChestXray-NIHCC

參考論文:

CheXNet: Radiologist-Level Pneumonia Detection on Chest X-Rays with Deep Learning

ChestX-ray14 是由NIH研究院提供的,其中包含了30,805名患者的112,120個(gè)單獨(dú)標(biāo)注的14種不同肺部疾病(肺不張、變實(shí)、浸潤(rùn)、氣胸、水腫、肺氣腫、纖維變性、積液、肺炎、胸膜增厚、心臟肥大、結(jié)節(jié)、腫塊和疝氣)的正面胸部 X 光片。研究人員對(duì)數(shù)據(jù)采用NLP方法對(duì)圖像進(jìn)行標(biāo)注。利用深度學(xué)習(xí)的技術(shù)早期發(fā)現(xiàn)并識(shí)別胸透照片中肺炎等疾病對(duì)增加患者恢復(fù)和生存的最佳機(jī)會(huì)至關(guān)重要。

1.1.7 LIDC-IDRI

數(shù)據(jù)集地址:

https://wiki.cancerimagingarchive.net/display/Public/LIDC-IDRI

LIDC-IDRI數(shù)據(jù)集是由美國(guó)國(guó)家癌癥研究所(National Cancer Institute)發(fā)起收集的,目的是為了研究高危人群早期肺結(jié)節(jié)檢測(cè)。該數(shù)據(jù)集中,共收錄了1018個(gè)研究實(shí)例。對(duì)于每個(gè)實(shí)例中的圖像,都由4位經(jīng)驗(yàn)豐富的胸部放射科醫(yī)師進(jìn)行兩階段的診斷標(biāo)注。該數(shù)據(jù)集由胸部醫(yī)學(xué)圖像文件(如CT、X光片)和對(duì)應(yīng)的診斷結(jié)果病變標(biāo)注組成。

1.1.8 LUNA16

數(shù)據(jù)集地址:

https://luna16.grand-challenge.org/Home/

發(fā)布于2016年,是肺部腫瘤檢測(cè)最常用的數(shù)據(jù)集之一,它包含888個(gè)CT圖像,1084個(gè)腫瘤,圖像質(zhì)量和腫瘤大小的范圍比較理想。數(shù)據(jù)分為10個(gè)subsets,subset包含89/88個(gè)CT scan。

LUNA16的CT圖像取自L(fǎng)IDC/IDRI數(shù)據(jù)集,選取了三個(gè)以上放射科醫(yī)師意見(jiàn)一致的annotation,并且去掉了小于3mm的腫瘤,所以數(shù)據(jù)集里不含有小于3mm的腫瘤,便于訓(xùn)練。

1.1.9 NSCLC

數(shù)據(jù)集地址:

https://wiki.cancerimagingarchive.net/display/Public/NSCLC+Radiogenomics

發(fā)布于2018年,來(lái)自斯坦福大學(xué)。數(shù)據(jù)集來(lái)自211名受試者的非小細(xì)胞肺癌(NSCLC)隊(duì)列的獨(dú)特放射基因組數(shù)據(jù)集。該數(shù)據(jù)集包括計(jì)算機(jī)斷層掃描(CT),正電子發(fā)射斷層掃描(PET)/ CT圖像。創(chuàng)建該數(shù)據(jù)集是為了便于發(fā)現(xiàn)基因組和醫(yī)學(xué)圖像特征之間的基礎(chǔ)關(guān)系,以及預(yù)測(cè)醫(yī)學(xué)圖像生物標(biāo)記的開(kāi)發(fā)和評(píng)估。

1.1.10 DeepLesion

數(shù)據(jù)集地址:

https://nihcc.app.box.com/v/DeepLesion

DeepLesion由美國(guó)國(guó)立衛(wèi)生研究院臨床中心(NIHCC)的團(tuán)隊(duì)開(kāi)發(fā),是迄今規(guī)模最大的多類(lèi)別、病灶級(jí)別標(biāo)注臨床醫(yī)療CT圖像開(kāi)放數(shù)據(jù)集。在該數(shù)據(jù)庫(kù)中圖像包括多種病變類(lèi)型,目前包括4427個(gè)患者的32,735 張CT圖像及病變信息,同時(shí)也包括腎臟病變,骨病變,肺結(jié)節(jié)和淋巴結(jié)腫大。DeepLesion多類(lèi)別病變數(shù)據(jù)集可以用來(lái)開(kāi)發(fā)自動(dòng)化放射診斷的CADx系統(tǒng)。

1.1.11 ADNI

數(shù)據(jù)集地址:

http : //adni.loni.usc.edu/data-samples/access-data/

ANDI涉及到的數(shù)據(jù)集包括如下幾部分Clinical Data(臨床數(shù)據(jù))、MR Image Data(磁共振成像)、Standardized MRI Data Sets、PET Image Data(正電子發(fā)射計(jì)算機(jī)斷層掃描)、Gennetic Data(遺傳數(shù)據(jù))、Biospecimen Data(生物樣本數(shù)據(jù))。

1.2 醫(yī)學(xué)降噪數(shù)據(jù)集

1.2.1 BrainWeb數(shù)據(jù)集

數(shù)據(jù)集地址:

http://brainweb.bic.mni.mcgill.ca/brainweb/

發(fā)布于1997年,這是一個(gè)仿真數(shù)據(jù)集,用于醫(yī)學(xué)圖像降噪。研究者可以截取不同斷層的正常腦部仿真圖像,包括T1,T2,PD3種斷層,設(shè)置斷層的厚度,疊加高斯噪聲或者醫(yī)學(xué)圖像中常見(jiàn)的萊斯噪聲,最終會(huì)得到181×217大小的噪聲圖像。

1.3 醫(yī)學(xué)分割數(shù)據(jù)集

1.3.1 DRIVE數(shù)據(jù)集

數(shù)據(jù)集地址:

http://www.isi.uu.nl/Research/Databases/DRIVE/download.php

發(fā)布于2003年,這是一個(gè)用于血管分割的數(shù)字視網(wǎng)膜圖像數(shù)據(jù)集,它由40張照片組成,其中7張顯示出輕度早期糖尿病視網(wǎng)膜病變跡象。

1.3.2 SCR數(shù)據(jù)集

數(shù)據(jù)集地址:

http://www.isi.uu.nl/Research/Databases/SCR/

發(fā)布于2000年,胸部X光片的分割,胸部X光片中解剖結(jié)構(gòu)的自動(dòng)分割對(duì)于這些圖像中的計(jì)算機(jī)輔助診斷非常重要。SCR數(shù)據(jù)庫(kù)的建立是為了便于比較研究肺野,心臟和鎖骨在標(biāo)準(zhǔn)的后胸前X線(xiàn)片上的分割。

本著合作科學(xué)進(jìn)步的精神,我們可以自由共享SCR數(shù)據(jù)庫(kù),并致力于在這些分割任務(wù)上維護(hù)各種算法結(jié)果的公共存儲(chǔ)庫(kù)。在這些頁(yè)面上,可以在下載數(shù)據(jù)庫(kù)和上載結(jié)果時(shí)找到說(shuō)明,并且可以檢查各種方法的基準(zhǔn)結(jié)果。

1.3.3?醫(yī)學(xué)圖像分析benchmark

在網(wǎng)址https://grand-challenge.org/challenges/提供了時(shí)間跨度超過(guò)10年的醫(yī)學(xué)圖像資料。

1.3.4 Ardiac MRI

數(shù)據(jù)集地址:

http://www.cse.yorku.ca/~mridataset/

ardiac MRI 是心臟病患者心房醫(yī)療影像數(shù)據(jù),以及其左心室的心內(nèi)膜和外膜的圖像標(biāo)注。包括33位患者案例,每個(gè)受試者的序列由沿著長(zhǎng)的20幀和8-15個(gè)切片組成,共7980張圖像。

1.3.5 NIH

數(shù)據(jù)集地址:

https://www.kaggle.com/nih-chest-xrays

發(fā)布于2017年,這是一個(gè)胸部X射線(xiàn)數(shù)據(jù)集,包含30,805個(gè)患者,14個(gè)疾病圖像標(biāo)簽(其中每個(gè)圖像可以具有多個(gè)標(biāo)簽),112,820個(gè)正面X射線(xiàn)圖像,標(biāo)簽是使用自然語(yǔ)言處理從相關(guān)的放射學(xué)報(bào)告中自動(dòng)提取。十四種常見(jiàn)的胸部病變包括肺不張,鞏固,浸潤(rùn),氣胸,水腫,肺氣腫,纖維化,積液,肺炎,胸膜增厚,心臟擴(kuò)大,結(jié)節(jié),腫塊和疝。由于許多原因,原始放射學(xué)報(bào)告(與這些胸部X射線(xiàn)研究相關(guān))并不是公開(kāi)分享的。所以文本挖掘的疾病標(biāo)簽預(yù)計(jì)準(zhǔn)確度 > 90%,這個(gè)數(shù)據(jù)集適合做半監(jiān)督的學(xué)習(xí)。

1.4?List of Open Access?

在List of Open Access Medical Imaging Datasets網(wǎng)站上可以看到更多的相關(guān)方向的數(shù)據(jù)集。

數(shù)據(jù)集地址:

http://www.radrounds.com/profiles/blogs/list-of-open-access-medical-imaging-datasets

?

02?醫(yī)學(xué)競(jìng)賽

2.1?VISCERAL

地址鏈接:http://www.visceral.eu/

VISCERAL 是Visual Concept Extraction Challenge in Radiology的縮寫(xiě),是放射學(xué)中的視覺(jué)概念提取挑戰(zhàn)賽。他們提供幾種不同成像模式(例如CT和MR)的幾種解剖結(jié)構(gòu)(例如腎,肺,膀胱等)的放射學(xué)數(shù)據(jù)以及一個(gè)云計(jì)算實(shí)例。

2.2 Grand Challenges

地址鏈接:

https://grand-challenge.org/challenges/

提供了醫(yī)學(xué)圖像分析領(lǐng)域內(nèi)所有挑戰(zhàn)的概述,下面舉的例子是2019年的醫(yī)學(xué)圖像方面將要舉辦的競(jìng)賽。

2.3?Dream Challenges

地址鏈接:http : //dreamchallenges.org/

這個(gè)挑戰(zhàn)賽中包括有數(shù)字乳腺攝影夢(mèng)想挑戰(zhàn);ICGC-TCGA DREAM體細(xì)胞突變稱(chēng)為RNA挑戰(zhàn)(SMC-RNA)等等。

?

03?總結(jié)

最后提供給對(duì)醫(yī)學(xué)影像處理感興趣的童鞋一個(gè)超級(jí)贊的github鏈接如下:

https://github.com/beamandrew/medical-data??

這是Github上哈佛 beamandrew機(jī)器學(xué)習(xí)和醫(yī)學(xué)影像研究者貢獻(xiàn)的數(shù)據(jù)集,包括了醫(yī)學(xué)影像數(shù)據(jù)、競(jìng)賽數(shù)據(jù)、來(lái)自電子健康記錄的數(shù)據(jù)、醫(yī)療數(shù)據(jù)、UCI數(shù)據(jù)集、生物醫(yī)學(xué)文獻(xiàn)等。

感謝各位看官的耐心閱讀,不足之處希望多多指教。后續(xù)內(nèi)容將會(huì)不定期奉上,歡迎大家關(guān)注有三公眾號(hào) 有三AI

?

?

總結(jié)

以上是生活随笔為你收集整理的【数据集】一文道尽医学图像数据集与竞赛的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。

如果覺(jué)得生活随笔網(wǎng)站內(nèi)容還不錯(cuò),歡迎將生活随笔推薦給好友。