公开人脸识别数据集
1. FaceMask CelebA數(shù)據(jù)集
FaceMask CelebA是模擬的口罩人臉數(shù)據(jù)集,粘貼的人臉蒙版圖像(RGBA)從從網(wǎng)上下載,裁剪完面部的最小區(qū)域后,將其粘貼到相應(yīng)的位置。FaceMask_CelebA數(shù)據(jù)集中,包括 202599 張口罩人臉圖像和人臉bbox標(biāo)簽。
應(yīng)用項(xiàng)目:人臉檢測(cè)
URL:?https://github.com/sevenHsu/FaceMask_CelebA
2. Flicker-Faces-HQ數(shù)據(jù)集
Flickr-Faces-HQ數(shù)據(jù)集是高質(zhì)量的人臉圖像數(shù)據(jù)集,主要目的為訓(xùn)練生成對(duì)抗網(wǎng)絡(luò)(GAN)模型。數(shù)據(jù)集在年齡,種族和圖像背景方面均存在很大差異,此外,還覆蓋了諸如眼鏡,太陽(yáng)鏡,帽子等附件。圖像是從Flickr抓取的,從而繼承了該網(wǎng)站的所有偏見(jiàn),并使用dlib算法自動(dòng)對(duì)齊和裁剪。Flickr-Faces-HQ數(shù)據(jù)集包含70000張分辨率為1024×1024的高質(zhì)量PNG圖像。
應(yīng)用項(xiàng)目:人臉生成
URL:https://github.com/NVlabs/ffhq-dataset
3.?Make up數(shù)據(jù)集
Make up數(shù)據(jù)集為了研究人臉化妝,對(duì)面部識(shí)別的影響而匯總的女性面部圖像的數(shù)據(jù)集。主要收集了4個(gè)數(shù)據(jù)集:
(1)YMU(YouTube化妝):人臉圖像是從YouTube視頻化妝教程中獲得的。
(2)VMU(虛擬化妝):對(duì)FRGC存儲(chǔ)庫(kù)(http://www.nist.gov/itl/iad/ig/frgc.cfm)中白人女性的面部圖像,經(jīng)過(guò)合成獲得,從而實(shí)現(xiàn)模擬化妝的效果。
(3)MIW:從互聯(lián)網(wǎng)上抓取已經(jīng)化妝、和沒(méi)有化妝的人臉面部圖像。
(4)MIFS(化妝誘發(fā)的面部欺騙):從YouTube視頻化妝教程中獲取對(duì)象的面部圖像,并從互聯(lián)網(wǎng)上獲取相關(guān)目標(biāo)對(duì)象的面部圖像。
不同類型的數(shù)據(jù)集,數(shù)量各不相同。
?
應(yīng)用項(xiàng)目: 人臉美妝
URL:Makeup datasets
4.?VoxCeleb數(shù)據(jù)集
VoxCeleb數(shù)據(jù)集是一個(gè)視聽(tīng)數(shù)據(jù)集,包含人類語(yǔ)音的簡(jiǎn)短剪輯,摘錄自上傳到Y(jié)ouTube的采訪視頻。VoxCeleb數(shù)據(jù)集包含來(lái)自不同種族,口音,專業(yè)和年齡的700位演講者的演講。所有說(shuō)話的臉部表情都被抓取,并帶有背景聊天,笑聲,重疊語(yǔ)音,姿勢(shì)變化和不同的照明條件。此外,在時(shí)長(zhǎng)上,VoxCeleb數(shù)據(jù)集包含2000個(gè)小時(shí)的音頻和視頻,每個(gè)片段至少3秒長(zhǎng)。
應(yīng)用項(xiàng)目:說(shuō)話人識(shí)別、情緒識(shí)別、人臉生成
URL:VoxCeleb
?
5. Anime-Face-Dataset數(shù)據(jù)集
Anime-Face-Dataset中的動(dòng)漫人臉,全都來(lái)自高質(zhì)量動(dòng)畫(huà)的網(wǎng)站www.getchu.com,然后使用動(dòng)畫(huà)面部檢測(cè)算法https://github.com/nagadomi/lbpcascade_animeface,對(duì)人臉進(jìn)行檢測(cè),并縮放到90*90-120*120大小。
應(yīng)用項(xiàng)目:人臉生成
URL:https://github.com/bchao1/Anime-Face-Dataset
6. Generated Faces數(shù)據(jù)集
Generated Faces數(shù)據(jù)集是一個(gè)用于多樣化的合成數(shù)據(jù)集,需要注意的是,此數(shù)據(jù)集并不可以直接下載,而是根據(jù)自己的需要進(jìn)行購(gòu)買下載,可以按照下方類型進(jìn)行定制:
(1)可自定義的背景:彩色,透明,攝影
(2)多樣性:種族,人口統(tǒng)計(jì)學(xué),面部表情和頭部姿勢(shì)
應(yīng)用項(xiàng)目:生成人臉,情緒識(shí)別、人臉識(shí)別
URL:https://generated.photos/datasets#
7. RMFD口罩人臉數(shù)據(jù)集
在疫情期間,基于口罩人臉數(shù)據(jù),設(shè)計(jì)相應(yīng)的口罩遮擋人臉檢測(cè)和識(shí)別算法,幫助社區(qū)封閉時(shí)的人員進(jìn)出管控,車站,機(jī)場(chǎng)的人臉識(shí)別閘機(jī)以及人臉門禁考勤設(shè)備的升級(jí),成為一種需要。RMFD口罩人臉數(shù)據(jù)集,共匯總了多種口罩人臉數(shù)據(jù),可以用來(lái)做人臉檢測(cè)和人臉識(shí)別算法的訓(xùn)練。RMFD口罩人臉數(shù)據(jù)集中,包含多種口罩人臉數(shù)據(jù)。
(1)真實(shí)口罩人臉識(shí)別數(shù)據(jù)集:從網(wǎng)絡(luò)爬取樣本,經(jīng)過(guò)整理,清洗和標(biāo)注后,含525人的5千張口罩人臉,9萬(wàn)正常人臉。
(2)模擬口罩人臉識(shí)別數(shù)據(jù)集:給公開(kāi)數(shù)據(jù)集中的人臉戴上口罩,得到1萬(wàn)人,50萬(wàn)張人臉的模擬口罩人臉數(shù)據(jù)集。
(3)真實(shí)口罩人臉驗(yàn)證數(shù)據(jù)集:包括426個(gè)人的4015張人臉圖像,組合成3589對(duì)相同身份和3589對(duì)不同身份的人臉樣本對(duì)(口罩人臉/正常人臉)。
應(yīng)用項(xiàng)目:人臉檢測(cè)、人臉識(shí)別
URL:https://github.com/X-zhangyang/Real-World-Masked-Face-Dataset
8.?Glint360K數(shù)據(jù)集
Glint360K是格靈深瞳開(kāi)源,通過(guò)清理,合并和發(fā)布最大和最干凈的面部識(shí)別數(shù)據(jù)集。Glint360K數(shù)據(jù)集,包含360232個(gè)人的17091657張圖片
應(yīng)用項(xiàng)目:人臉識(shí)別
URL:https://github.com/deepinsight/insightface/tree/master/recognition/partial_fc#glint360k
9.?Celebrity in Places數(shù)據(jù)集
Celebrity in Places數(shù)據(jù)集包含不同類型場(chǎng)景,以及不同的名人。這些圖像全部是使用Google圖像搜索獲得的,并通過(guò)人工注釋進(jìn)行了驗(yàn)證。
比如第一張圖片的標(biāo)簽為:阿曼達(dá)●塞弗里德-機(jī)場(chǎng)航站樓
第二張圖片的標(biāo)簽為:大衛(wèi)●卡梅隆-宴會(huì)廳
數(shù)據(jù)集包含不同類型場(chǎng)景中約36k名人的圖像。有4611位名人和16個(gè)地方參與其中。
應(yīng)用項(xiàng)目:人臉識(shí)別、場(chǎng)景分類
URL:https://www.robots.ox.ac.uk/~vgg/data/celebrity_in_places/
10.?Public Figures Face人臉數(shù)據(jù)集
從互聯(lián)網(wǎng)收集的人臉數(shù)據(jù)集。包括 200 個(gè)人的 58797 張圖像。同一人的圖像具有不受控的參數(shù)環(huán)境,包括不同的姿勢(shì)、光照、場(chǎng)景、鏡頭、攝像參數(shù)等。
應(yīng)用項(xiàng)目:人臉識(shí)別
URL:http://www.cs.columbia.edu/CAVE/databases/pubfig/
11.?NIST Mugshot Identification人臉數(shù)據(jù)集
國(guó)家標(biāo)準(zhǔn)及技術(shù)研究所發(fā)布的人面部自動(dòng)化識(shí)別測(cè)試數(shù)據(jù)。包含?1573位個(gè)人(男1495、女78),?3248張?面部照片,照片包括正臉照和側(cè)臉照。其中131人有一張以上正臉照,1418人只有一張正臉照。89人有一張以上側(cè)臉照,1268人只有一張側(cè)臉照。
應(yīng)用項(xiàng)目:人臉識(shí)別
URL:https://www.nist.gov/srd/nist-special-database-18
12.?Caltech 10k Web Faces人臉數(shù)據(jù)集
人臉圖像數(shù)據(jù),來(lái)自Google圖像搜索后的人工標(biāo)注。包含?10524張?人臉圖像和標(biāo)注信息,標(biāo)注眼睛、鼻子和嘴巴的位置,并且在不同的設(shè)置中,例如,肖像圖像,人群等。
應(yīng)用項(xiàng)目:人臉檢測(cè)、人臉對(duì)齊
URL:http://www.vision.caltech.edu/Image_Datasets/Caltech_10K_WebFaces/
13.?IMDB-WIKI 500k跨年齡人臉數(shù)據(jù)集
包含名人人臉圖像、年齡、性別的數(shù)據(jù)集,圖像和年齡、性別信息從?IMDB 和 WiKi 網(wǎng)站抓取。總計(jì) 524230 張名人人臉圖像及對(duì)應(yīng)的年齡和性別。其中,獲取自 IMDB 的 460723 張,獲取自 WiKi 的 62328 張。
應(yīng)用項(xiàng)目:人臉識(shí)別、年齡識(shí)別
URL:https://data.vision.ee.ethz.ch/cvl/rrothe/imdb-wiki/
14.?300 Face in Wild人臉檢測(cè)數(shù)據(jù)集
一個(gè)人臉識(shí)別和輪廓標(biāo)注數(shù)據(jù),該數(shù)據(jù)及也是機(jī)器視覺(jué)等級(jí)會(huì)議 ICCV 2013 人臉檢測(cè)競(jìng)賽所使用的數(shù)據(jù)集。
應(yīng)用項(xiàng)目:人臉檢測(cè)
URL:https://ibug.doc.ic.ac.uk/resources/300-W/
15.?Facial-keypoints人臉關(guān)鍵點(diǎn)數(shù)據(jù)集【Kaggle競(jìng)賽】
人臉關(guān)鍵點(diǎn)標(biāo)定競(jìng)賽,為圖像中的人臉標(biāo)定15個(gè)關(guān)鍵位置點(diǎn),圖像時(shí)96x96像素的,每個(gè)關(guān)鍵點(diǎn)對(duì)應(yīng)一個(gè)二維位置坐標(biāo)用以標(biāo)識(shí)關(guān)鍵點(diǎn)的位置。
應(yīng)用項(xiàng)目:人臉對(duì)齊
URL:https://www.kaggle.com/c/facial-keypoints-detection
16. MegaFace人臉識(shí)別數(shù)據(jù)庫(kù)
最大的公開(kāi)面部識(shí)別數(shù)據(jù)集,所有數(shù)據(jù)都是華盛頓大學(xué)從 Flickr(雅虎旗下圖片分享網(wǎng)站)組織收集的。包含一百萬(wàn)張圖片,代表 690000 個(gè)獨(dú)特的人。
應(yīng)用項(xiàng)目:人臉識(shí)別
URL:http://megaface.cs.washington.edu/dataset/download.html
17.?Wider-Face人臉檢測(cè)數(shù)據(jù)集
人臉檢測(cè)基準(zhǔn)數(shù)據(jù)集,主要用于身份鑒定,?2016 年由香港中文大學(xué)的 Yang,Shuo and Luo,Ping and Loy,Chen Change and Tang,Xiaoou 收集發(fā)布。它包含 32203 個(gè)圖像和 393703 個(gè)人臉圖像,在尺度,姿勢(shì),閉塞,表達(dá),裝扮,關(guān)照等方面表現(xiàn)出了大的變化。該數(shù)據(jù)集基于 61 個(gè)事件類進(jìn)行組織。對(duì)于每個(gè)事件類,隨機(jī)選擇了 40%/ 10%/ 50%的數(shù)據(jù)作為培訓(xùn),驗(yàn)證和測(cè)試集。
應(yīng)用項(xiàng)目:人臉檢測(cè)
URL:http://shuoyang1213.me/WIDERFACE/
18.?IJB-B 數(shù)據(jù)集
美國(guó)國(guó)家標(biāo)準(zhǔn)化研究院(NIST)發(fā)布的大型人臉數(shù)據(jù)集,包括從互聯(lián)網(wǎng)采集的靜態(tài)人臉圖像和視頻。共有1845個(gè)對(duì)象,11754張圖片,55026視頻幀,7011個(gè)視頻和10044非人臉圖像。該數(shù)據(jù)集在采集上與其它流行的人臉數(shù)據(jù)集不重疊,如:牛津大學(xué)VGG人臉數(shù)據(jù)集Face?Challenge、CASIA?WEBFace數(shù)據(jù)集等。數(shù)據(jù)集被用于NIST舉辦的?Face?Challenge?競(jìng)賽,進(jìn)行校驗(yàn)、搜索、檢測(cè)、聚類、標(biāo)注等人臉識(shí)別任務(wù)。
應(yīng)用項(xiàng)目:人臉聚類、人臉識(shí)別
URL:https://www.nist.gov/programs-projects/face-challenges
19.?MS-Celeb-1M數(shù)據(jù)集
MSR IRC是目前世界上規(guī)模最大、水平最高的圖像識(shí)別賽事之一,由MSRA(微軟亞洲研究院)圖像分析、大數(shù)據(jù)挖掘研究組組長(zhǎng)張磊發(fā)起,每年定期舉辦。從1M個(gè)名人中,根據(jù)他們的受歡迎程度,選擇100K個(gè)。然后,利用搜索引擎,給100K個(gè)人,每人搜大概100張圖片。共100K*100=10M個(gè)圖片,測(cè)試集包括1000個(gè)名人,這1000個(gè)名人來(lái)自于1M個(gè)明星中隨機(jī)挑選。而且經(jīng)過(guò)微軟標(biāo)注。每個(gè)名人大概有20張圖片,這些圖片都是網(wǎng)上找不到的。
應(yīng)用項(xiàng)目:人臉識(shí)別,人臉檢測(cè)
URL:https://www.microsoft.com/en-us/research/project/ms-celeb-1m-challenge-recognizing-one-million-celebrities-real-world/
20.?Casia-webface數(shù)據(jù)集
2014年中科院發(fā)布,收集了10000多個(gè)名人的照片。包含453453幅人臉圖像的數(shù)據(jù)集,經(jīng)人臉檢測(cè)后共識(shí)別出超過(guò)10575個(gè)身份,然而,這些照片是在網(wǎng)上用爬蟲(chóng)扒下來(lái)的,所以有一些數(shù)據(jù)存在問(wèn)題,這里對(duì)這個(gè)數(shù)據(jù)集做清洗
應(yīng)用項(xiàng)目:人臉識(shí)別
?URL:http://www.cbsr.ia.ac.cn/english/CASIA-WebFace-Database.html
21.?LFW數(shù)據(jù)集
人臉圖片均通過(guò) Viola-Jones 人臉檢測(cè)算法從互聯(lián)網(wǎng)上檢索搜集。包含 13000 張從互聯(lián)網(wǎng)上獲取的人臉圖像,每張圖片都標(biāo)有該人的姓名,其中有 1680 個(gè)人的有超過(guò)2張圖像,共有四個(gè)子數(shù)據(jù)集,分別為 原始數(shù)據(jù)集(lfw)、funneled images、LFW-a、deep funneled images 四組。
?應(yīng)用項(xiàng)目:人臉識(shí)別
URL:http://vis-www.cs.umass.edu/lfw/
總結(jié)
- 上一篇: 华为 eNSP 模拟器安装教程(内含下载
- 下一篇: 【无标题】红外人脸数据集