當前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

计算机视觉

發布時間：2023/12/10 编程问答 27 豆豆

生活随笔收集整理的這篇文章主要介紹了计算机视觉小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

網址：http://www.52ml.net/tags/計算機視覺/page/3

【計算機視覺】Canny Edge邊緣檢測器

2013年10月13日機器學習計算機視覺smallroof

引言?

Canny提出一種新的邊緣檢測方法[1][2]，它對受白噪聲影響的階躍型邊緣是最優的。整個Canny邊緣檢測器算法分成四步.?

Canny邊緣檢測算子

Canny邊緣分成四步：?

噪聲去除。因為這個檢測器用到了微分算子，所以對于局部的不連續是敏感的，某區域的噪聲點很容易造成邊緣的模糊。在我做的這個應用里，因為要檢測的是文本的邊緣，而文本的背景是比較規則的變形后的正方形方格，所以如果用wiki里建議的高斯濾波器，會造成整個圖像都變成一種顏色，即全黑或者全白。因此如果換一種觀點，把這些變形后的方格也看成圖的一部分，因為字體的紋理和方格的紋理不同，所以可以看作是兩種區域組合成的圖像。由此我改用一般的鏡子，增強圖像邊緣。

計算圖像的邊緣梯度。這個是常規運算，用了Sobel算子，分別計算圖像的x和y方向的梯度值，最后計算出圖像各點的梯度值以及梯度角。計算得到梯度角需要進行近似，近似四個值{-45(或135), 0, 45,90}。

非最大梯度值點抑制第2步計算后得到兩組值，第一組是各點的梯度值，第二組是各點梯度角的近似值。這一個非最大梯度值點抑制是比較不好理解的一步。遍歷各點，做如下操作。(1)如果該點(x, y)的梯度角是0，如果其梯度值比北(x – 1, y)和南(x + 1, y)的梯度值大，則認為(x,y)點是一個邊緣點，否則抑制其值，該其梯度值為設定的背景值(0或255)；(2)如果該點(x, y)的梯度角是90，如果其梯度值比西(x, y – 1)和東(x, y +1)的梯度值大，則認為(x, y)點是一個邊緣點，否則抑制其值，該其梯度值為設定的背景值(0或255)；?(3)如果該點(x,y)的梯度角是135(或-45)，如果其梯度值比東北(x – 1, y + 1)和西南(x + 1, y -1)的梯度值大，則認為(x, y)點是一個邊緣點，否則抑制其值，該其梯度值為設定的背景值(0或255)；?(4)如果該點(x,y)的梯度角是45，如果其梯度值比西北(x – 1, y – 1)和東南(x + 1, y + 1)的梯度值大，則認為(x,y)點是一個邊緣點，否則抑制其值，該其梯度值為設定的背景值(0或255)。

產生邊緣.?在第3步里直接用邊緣值和背景值對兩種圖像區域進行了劃分。這么做對于圖像不同區域像素值區別較大的場合比較方便，計算也快，但是對于圖像不同區域像

Canny邊緣檢測代碼和Main程序

// Canny edge detection #include "stdio.h"#include "cv.h"#include "highgui.h"#define PI 3.1415926535#define ORI_SCALE 40.0#define MAG_SCALE 20.0#define MAX_MASK_SIZE 20float ratio = 0.1f;int WIDTH = 0;long seed = 132531;typedef struct image * IMAGE;int range (IMAGE im, int i, int j);void print_se (IMAGE p);IMAGE Input_PBM (char *fn);IMAGE Output_PBM (IMAGE image, char *filename);void get_num_pbm (FILE *f, char *b, int *bi, int *res);void pbm_getln (FILE *f, char *b);void pbm_param (char *s);struct image *newimage (int nr, int nc);void freeimage (struct image *z);void sys_abort (int val, char *mess);void CopyVarImage (IMAGE *a, IMAGE *b);void Display (IMAGE x);float ** f2d (int nr, int nc);void srand32 (long k);double drand32 ();void copy (IMAGE *a, IMAGE b);int trace (int i, int j, int low, IMAGE im,IMAGE mag, IMAGE ori);float gauss(float x, float sigma);float dGauss (float x, float sigma);float meanGauss (float x, float sigma);void hysteresis (int high, int low, IMAGE im, IMAGE mag, IMAGE oriim);void canny (float s, IMAGE im, IMAGE mag, IMAGE ori);void seperable_convolution (IMAGE im, float *gau, int width,float **smx, float **smy);void dxy_seperable_convolution (float** im, int nr, int nc, float *gau, int width, float **sm, int which);void nonmax_suppress (float **dx, float **dy, int nr, int nc,IMAGE mag, IMAGE ori);void estimate_thresh (IMAGE mag, int *low, int *hi);void canny (float s, IMAGE im, IMAGE mag, IMAGE ori){ int width; float **smx,**smy; float **dx,**dy; int i,j,n; float gau[MAX_MASK_SIZE], dgau[MAX_MASK_SIZE], z; // Create a Gaussian and a derivative of Gaussian filter mask for(i=0; i<MAX_MASK_SIZE; i++){ gau[i] = meanGauss ((float)i, s); if (gau[i] < 0.005){ width = i; break; } dgau[i] = dGauss ((float)i, s); } n = width+width + 1; WIDTH = width/2; printf ("Smoothing with a Gaussian (width = %d) ...\n", n); smx = f2d (im->info->nr, im->info->nc); smy = f2d (im->info->nr, im->info->nc); //Convolution of source image with a Gaussian in X and Y directions seperable_convolution (im, gau, width, smx, smy); //Now convolve smoothed data with a derivative printf ("Convolution with the derivative of a Gaussian...\n"); dx = f2d (im->info->nr, im->info->nc); dxy_seperable_convolution (smx, im->info->nr, im->info->nc,dgau, width, dx, 1); free(smx[0]); free(smx); dy = f2d (im->info->nr, im->info->nc); dxy_seperable_convolution (smy, im->info->nr, im->info->nc, dgau, width, dy, 0); free(smy[0]); free(smy); // Create an image of the norm of dx,dy for (i=0; i<im->info->nr; i++) for (j=0; j<im->info->nc; j++) { z = norm (dx[i][j], dy[i][j]); mag->data[i][j] = (unsigned char)(z*MAG_SCALE); } //Non-maximum suppression - edge pixels should be a local max nonmax_suppress (dx, dy, (int)im->info->nr, (int)im->info->nc, mag, ori); free(dx[0]); free(dx); free(dy[0]); free(dy);}int main ( ){ int i,j; float s=1.0; int low= 0,high=-1; FILE *params; IMAGE im, magim, oriim; char name[128]; // Try to read an image printf ("Enter path to the image file to be processed: "); scanf ("%s", name); printf ("Opening file '%s'\n", name); //Read parameters from the file canny.par params = fopen ("canny.par", "r"); if (params){ fscanf (params, "%d", &low); // Lower threshold fscanf (params, "%d", &high); // High threshold fscanf (params, "%f", &s); // Gaussian standard deviation printf ("Parameters from canny.par: HIGH: %d LOW %d Sigma %f\n", high, low, s); fclose (params); } else printf ("Parameter file 'canny.par' does not exist.\n"); im = get_image(name); display_image (im); // Create local image space magim = newimage (im->info->nr, im->info->nc); if (magim == NULL){ printf ("Out of storage: Magnitude\n"); exit (1); } oriim = newimage (im->info->nr, im->info->nc); if (oriim == NULL){ printf ("Out of storage: Orientation\n"); exit (1); } canny (s, im, magim, oriim); // Apply the filter hysteresis (high, low, im, magim, oriim); //Hysteresis thresholding of edge pixels for (i=0; i<WIDTH; i++) for (j=0; j<im->info->nc; j++) im->data[i][j] = 255; for (i=im->info->nr-1; i>im->info->nr-1-WIDTH; i--) for (j=0; j<im->info->nc; j++) im->data[i][j] = 255; for (i=0; i<im->info->nr; i++) for (j=0; j<WIDTH; j++) im->data[i][j] = 255; for (i=0; i<im->info->nr; i++) for (j=im->info->nc-WIDTH-1; j<im->info->nc; j++) im->data[i][j] = 255; ?display_image (im); save_image (im, "canny.jpg"); return 0;}

參考文獻

[1] Canny J. F. "Finding edges and lines in images" Technical Report AI-TR-720,MIT,Artifical Inteligence Labortay,Cambridg,MA,1983.?

[2] Canny J. F. "a Computational Approach to Edge Detection", IEEE Trancsctions on Pattern Analysis and Machine Intelligence, 8(6):679-698,1996.?

====================================================== 轉載請注明出處?：?http://blog.csdn.net/utimes/article/details/8827781 ======================================================?
本文轉載自：CSDN博客 Leave a comment

計算機視覺領域的一些牛人博客，超有實力的研究機構等的網站鏈接—個人整理 – 射手炎魂

2013年10月11日機器學習計算機視覺smallroof

由??carson2005??? 2011-05-06 20:46

提示：本文為筆者原創，轉載請注明出處:blog.csdn.net/carson2005?
以下鏈接是本人整理的關于計算機視覺（ComputerVision, CV）相關領域的網站鏈接，其中有CV牛人的主頁，CV研究小組的主頁，CV領域的paper,代碼，CV領域的最新動態，國內的應用情況等等。打算從事這個行業或者剛入門的朋友可以多關注這些網站，多了解一些CV的具體應用。搞研究的朋友也可以從中了解到很多牛人的研究動態、招生情況等。總之，我認為，知識只有分享才能產生更大的價值，真誠希望下面的鏈接能對朋友們有所幫助。?
（1）googleResearch；??http://research.google.com/index.html?
（2）MIT博士，湯曉歐學生林達華；??http://people.csail.mit.edu/dhlin/index.html?
（3）MIT博士后Douglas Lanman；??http://web.media.mit.edu/~dlanman/?
（4）opencv中文網站；?http://www.opencv.org.cn/index.php/%E9%A6%96%E9%A1%B5?
（5）Stanford大學vision實驗室；??http://vision.stanford.edu/research.html?
（6）Stanford大學博士崔靖宇；??http://www.stanford.edu/~jycui/?
（7）UCLA教授朱松純；??http://www.stat.ucla.edu/~sczhu/?
（8）中國人工智能網；??http://www.chinaai.org/?
（9）中國視覺網；??http://www.china-vision.net/?
（10）中科院自動化所；??http://www.ia.cas.cn/?
（11）中科院自動化所李子青研究員；??http://www.cbsr.ia.ac.cn/users/szli/?
（12）中科院計算所山世光研究員；??http://www.jdl.ac.cn/user/sgshan/?
（13）人臉識別主頁；??http://www.face-rec.org/?
（14）加州大學伯克利分校CV小組；??http://www.eecs.berkeley.edu/Research/P … CS/vision/?
（15）南加州大學CV實驗室；??http://iris.usc.edu/USC-Computer-Vision.html?
（16）卡內基梅隆大學CV主頁；?http://www.cs.cmu.edu/afs/cs/project/ci … ision.html?
（17）微軟CV研究員Richard Szeliski；http://research.microsoft.com/en-us/um/people/szeliski/?
（18）微軟亞洲研究院計算機視覺研究組；??http://research.microsoft.com/en-us/groups/vc/?
（19）微軟劍橋研究院ML與CV研究組；??http://research.microsoft.com/en-us/gro … fault.aspx?
（20）研學論壇；??http://bbs.matwav.com/?
（21）美國Rutgers大學助理教授劉青山；??http://www.research.rutgers.edu/~qsliu/?
（22）計算機視覺最新資訊網；??http://www.cvchina.info/?
（23）運動檢測、陰影、跟蹤的測試視頻下載；?http://apps.hi.baidu.com/share/detail/18903287?
（24）香港中文大學助理教授王曉剛；??http://www.ee.cuhk.edu.hk/~xgwang/?
(25)香港中文大學多媒體實驗室（湯曉鷗）;??http://mmlab.ie.cuhk.edu.hk/?
(26)U.C. San Diego. computer vision; http://vision.ucsd.edu/content/home?
(27)CVonline;??http://homepages.inf.ed.ac.uk/rbf/CVonline/?
(28)computer vision software;??http://peipa.essex.ac.uk/info/software.html?
(29)Computer Vision Resource;??http://www.cvpapers.com/?
(30)computer vision research groups; http://peipa.essex.ac.uk/info/groups.html?
(31)computer vision center;??http://computervisioncentral.com/cvcnews?
(32)浙江大學圖像技術研究與應用（ITRA）團隊：http://www.dvzju.com/?

(33)自動識別網：http://www.autoid-china.com.cn/?

(34)清華大學章毓晉教授：http://www.tsinghua.edu.cn/publish/ee/4157/2010/20101217173552339241557/20101217173552339241557_.html?

(35)頂級民用機器人研究小組Porf.Gary領導的Willow Garage:http://www.willowgarage.com/?

(36)上海交通大學圖像處理與模式識別研究所：http://www.pami.sjtu.edu.cn/?

(37)上海交通大學計算機視覺實驗室劉允才教授：http://www.visionlab.sjtu.edu.cn/?

(38)德克薩斯州大學奧斯汀分校助理教授Kristen Grauman ：http://www.cs.utexas.edu/~grauman/?

(39)清華大學電子工程系智能圖文信息處理實驗室（丁曉青教授）：http://ocrserv.ee.tsinghua.edu.cn/auto/index.asp?

(40)北京大學高文教授：http://www.jdl.ac.cn/htm-gaowen/?

(41)清華大學艾海舟教授：http://media.cs.tsinghua.edu.cn/cn/aihz?

(42)中科院生物識別與安全技術研究中心：http://www.cbsr.ia.ac.cn/china/index%20CH.asp?

(43)瑞士巴塞爾大學 Thomas Vetter教授：http://informatik.unibas.ch/personen/vetter_t.html?

(44)俄勒岡州立大學 Rob Hess博士：http://blogs.oregonstate.edu/hess/?

(45)深圳大學于仕祺副教授：http://yushiqi.cn/?

(46)西安交通大學人工智能與機器人研究所：http://www.aiar.xjtu.edu.cn/?

(47)卡內基梅隆大學研究員Robert T. Collins:http://www.cs.cmu.edu/~rcollins/home.html#Background?

(48)MIT博士Chris Stauffer:http://people.csail.mit.edu/stauffer/Home/index.php?

(49)美國密歇根州立大學生物識別研究組(Anil K. Jain教授)：http://www.cse.msu.edu/rgroups/biometrics/?

(50)美國伊利諾伊州立大學Thomas S. Huang:http://www.beckman.illinois.edu/directory/t-huang1?

(51)武漢大學數字攝影測量與計算機視覺研究中心：http://www.whudpcv.cn/index.asp?

(52)瑞士巴塞爾大學Sami Romdhani助理研究員：http://informatik.unibas.ch/personen/romdhani_sami/?

(53)CMU大學研究員Yang Wang:http://www.cs.cmu.edu/~wangy/home.html?

(54)英國曼徹斯特大學Tim Cootes教授：http://personalpages.manchester.ac.uk/staff/timothy.f.cootes/?

(55)美國羅徹斯特大學教授Jiebo Luo:http://www.cs.rochester.edu/u/jluo/?

(56)美國普渡大學機器人視覺實驗室：https://engineering.purdue.edu/RVL/Welcome.html?

(57)美國賓利州立大學感知、運動與認識實驗室：http://vision.cse.psu.edu/home/home.shtml?

(58)美國賓夕法尼亞大學GRASP實驗室：https://www.grasp.upenn.edu/?

(59)美國內達華大學里諾校區CV實驗室：http://www.cse.unr.edu/CVL/index.php?

(60)美國密西根大學vision實驗室：http://www.eecs.umich.edu/vision/index.html?

(61)University of Massachusetts(麻省大學),視覺實驗室：http://vis-www.cs.umass.edu/index.html?

(62)華盛頓大學博士后Iva Kemelmacher:http://www.cs.washington.edu/homes/kemelmi?

(63)以色列魏茨曼科技大學Ronen Basri:http://www.wisdom.weizmann.ac.il/~ronen/index.html?

(64)瑞士ETH-Zurich大學CV實驗室：http://www.vision.ee.ethz.ch/boostingTrackers/index.htm?

(65)微軟CV研究員張正友：http://research.microsoft.com/en-us/um/people/zhang/?

(66)中科院自動化所醫學影像研究室：http://www.3dmed.net/?

(67)中科院田捷研究員：http://www.3dmed.net/tian/?

(68)微軟Redmond研究院研究員Simon Baker:http://research.microsoft.com/en-us/people/sbaker/?

(69)普林斯頓大學教授李凱：http://www.cs.princeton.edu/~li/?
(70)普林斯頓大學博士賈登：http://www.cs.princeton.edu/~jiadeng/?
(71)牛津大學教授Andrew Zisserman：??http://www.robots.ox.ac.uk/~az/?
(72)英國leeds大學研究員Mark Everingham:http://www.comp.leeds.ac.uk/me/?
(73)英國愛丁堡大學教授Chris William:??http://homepages.inf.ed.ac.uk/ckiw/?
(74)微軟劍橋研究院研究員John Winn:??http://johnwinn.org/?
(75)佐治亞理工學院教授Monson H.Hayes：http://savannah.gatech.edu/people/mhayes/index.html?
(76)微軟亞洲研究院研究員孫劍：http://research.microsoft.com/en-us/people/jiansun/?
(77)微軟亞洲研究院研究員馬毅：http://research.microsoft.com/en-us/people/mayi/?
(78)英國哥倫比亞大學教授David Lowe:??http://www.cs.ubc.ca/~lowe/?
(79)英國愛丁堡大學教授Bob Fisher:??http://homepages.inf.ed.ac.uk/rbf/?
(80)加州大學圣地亞哥分校教授Serge J.Belongie:http://cseweb.ucsd.edu/~sjb/?
(81)威斯康星大學教授Charles R.Dyer:??http://pages.cs.wisc.edu/~dyer/?
(82)多倫多大學教授Allan.Jepson:??http://www.cs.toronto.edu/~jepson/?
(83)倫斯勒理工學院教授Qiang Ji:??http://www.ecse.rpi.edu/~qji/?
(84)CMU研究員Daniel Huber:??http://www.ri.cmu.edu/person.html?person_id=123?
(85)多倫多大學教授：David J.Fleet:??http://www.cs.toronto.edu/~fleet/?
(86)倫敦大學瑪麗女王學院教授Andrea Cavallaro:http://www.eecs.qmul.ac.uk/~andrea/?
(87)多倫多大學教授Kyros Kutulakos:??http://www.cs.toronto.edu/~kyros/?
(88)杜克大學教授Carlo Tomasi:??http://www.cs.duke.edu/~tomasi/?
(89)CMU教授Martial Hebert:??http://www.cs.cmu.edu/~hebert/?
(90)MIT助理教授Antonio Torralba:??http://web.mit.edu/torralba/www/?
(91)馬里蘭大學研究員Yasel Yacoob:??http://www.umiacs.umd.edu/users/yaser/?
(92)康奈爾大學教授Ramin Zabih:??http://www.cs.cornell.edu/~rdz/?
(93)CMU博士田淵棟:??http://www.cs.cmu.edu/~yuandong/?
(94)CMU副教授Srinivasa Narasimhan:??http://www.cs.cmu.edu/~srinivas/?
(95)CMU大學ILIM實驗室：http://www.cs.cmu.edu/~ILIM/?
(96)哥倫比亞大學教授Sheer K.Nayar:??http://www.cs.columbia.edu/~nayar/?
(97)三菱電子研究院研究員Fatih Porikli ：http://www.porikli.com/?
(98)康奈爾大學教授Daniel Huttenlocher：http://www.cs.cornell.edu/~dph/?
(99)南京大學教授周志華：http://cs.nju.edu.cn/zhouzh/index.htm?
(100)芝加哥豐田技術研究所助理教授Devi Parikh:?http://ttic.uchicago.edu/~dparikh/index.html?
(101)瑞士聯邦理工學院博士后Helmut Grabner:?http://www.vision.ee.ethz.ch/~hegrabne/#Short_CV?
(102)香港中文大學教授賈佳亞：http://www.cse.cuhk.edu.hk/~leojia/index.html?

(103)南洋理工大學副教授吳建鑫：http://c2inet.sce.ntu.edu.sg/Jianxin/index.html?

(104)GE研究院研究員李關：http://www.cs.unc.edu/~lguan/?

(105)佐治亞理工學院教授Monson Hayes:http://savannah.gatech.edu/people/mhayes/?

(106)圖片檢索國際會議VOC(微軟劍橋研究院組織):?http://pascallin.ecs.soton.ac.uk/challenges/VOC/?
(107)機器視覺開源處理庫匯總：http://archive.cnblogs.com/a/2217609/?

(108)布朗大學教授Benjamin Kimia:??http://www.lems.brown.edu/kimia.html???

(109)數據堂-圖像處理相關的樣本數據：http://www.datatang.com/data/list/602026/p1?

(110)東軟基于CV的汽車輔助駕駛系統：http://www.neusoft.com/cn/solutions/1047/?

(111)馬里蘭大學教授Rema Chellappa:http://www.cfar.umd.edu/~rama/?
(112)芝加哥豐田研究中心助理教授Devi Parikh：http://ttic.uchicago.edu/~dparikh/index.html?

(113)賓夕法尼亞大學助理教授石建波：http://www.cis.upenn.edu/~jshi/?

(114)比利時魯汶大學教授Luc Van Gool：http://www.vision.ee.ethz.ch/members/get_member.cgi?id=1,http://www.vision.ee.ethz.ch/~vangool/?
(115)行人檢測主頁：http://www.pedestrian-detection.com/?

(116)法國學習算法與系統實驗室Basilio Noris博士：http://lasa.epfl.ch/people/member.php?SCIPER=129576?http://mldemos.epfl.ch/?
(117)美國馬里蘭大學LARRY S.DAVIS教授：http://www.umiacs.umd.edu/~lsd/?

(118)計算機視覺論文分類導航：http://www.visionbib.com/bibliography/contents.html?

(119)計算機視覺分類信息導航：http://www.visionbib.com/?
(120)西班牙馬德里理工大學博士Marcos Nieto：http://marcosnieto.net/?
(121)香港理工大學副教授張磊：http://www4.comp.polyu.edu.hk/~cslzhang/?

(122)以色列技術學院教授Michael Elad：http://www.cs.technion.ac.il/~elad/?

(123)韓國啟明大學計算機視覺與模式識別實驗室：http://cvpr.kmu.ac.kr/?

(124)英國諾丁漢大學Michel Valstar博士：http://www.cs.nott.ac.uk/~mfv/?

(125)卡內基梅隆大學Takeo Kanade教授:http://www.ri.cmu.edu/people/kanade_takeo.html?
(126)微軟學術搜索：http://libra.msra.cn/?
(127)比利時天主教魯汶大學Radu Timofte博士：http://homes.esat.kuleuven.be/~rtimofte/，交通標志檢測，定位，3D跟蹤?
(128)迪斯尼匹茲堡研究院研究員：Iain Matthews:http://www.iainm.com/iainm/Home.html

http://www.ri.cmu.edu/person.html?type= … son_id=741??AAM,三維重建?

（129）康奈爾大學視覺與圖像分析組：http://www.via.cornell.edu/ 醫學圖像處理?

（130）密西根州立大學生物識別研究組：http://www.cse.msu.edu/biometrics/ 人臉識別、指紋識別、圖像檢索?
（131）柏林科技大學計算機視覺與遙感實驗室：http://www.cv.tu-berlin.de/menue/computer_vision_remote_sensing/parameter/en/ 圖像分析、物體重建、基于圖像的表面測量、醫學圖像處理?

（132）英國布里斯托大學數字多媒體研究組：http://www.cs.bris.ac.uk/Research/Digitalmedia/ 運動檢測與跟蹤、視頻壓縮、3D重建、字符定位?

（133）英國薩利大學視覺、語音與信號處理中心：??http://www.surrey.ac.uk/cvssp/??人臉識別、監控、3D、視頻檢索、?
（134）北卡萊羅納大學教堂山分校Marc Pollefeys教授：http://www.cs.unc.edu/~marc/ 基于視頻的3D模型生成、相機標定、運動檢測與分析、3D重建?

（135）澳大利亞國立大學Richard Hartley教授：http://users.cecs.anu.edu.au/~hartley/ 運動估計、稀疏子空間、跟蹤、?

（136）百度技術副總監于凱：http://www.dbs.ifi.lmu.de/~yu_k/ 深度學習，稀疏表示，圖像分類?

（137）西安電子科技大學高新波教授：http://web.xidian.edu.cn/xbgao/index.html 質量評判、水印、稀疏表示、超分辨率?

（138）加州大學伯克利分校Michael I.Jordan教授：http://www.cs.berkeley.edu/~jordan/ 機器學習?

（139）加州理工行人檢測相關資料：http://www.vision.caltech.edu/Image_Datasets/CaltechPedestrians/?

（140）微軟Redmond研究院研究員Piotr Dollar:??http://vision.ucsd.edu/~pdollar/??行人檢測、特征提取、?

（141）視覺計算研究論壇：http://www.sigvc.org/bbs/ 中科院視覺計算研究小組的論壇?

（142）美國坦桑尼亞州立大學稀疏學習軟件包：http://www.public.asu.edu/~jye02/Software/SLEP/index.htm 稀疏學習?

（143）美國加州大學圣地亞哥分校Jacob Whitehill博士：http://mplab.ucsd.edu/~jake/ 機器學習?

（144）美國布朗大學Michael J.Black教授：http://cs.brown.edu/~black/ 人的姿態估計和跟蹤?

（145）美國加州大學圣地亞哥分校David Kriegman教授：http://cseweb.ucsd.edu/~kriegman/ 人臉識別?

（146）南加州大學Paul Debevec教授：http://ict.debevec.org/~debevec/ 或?http://www.pauldebevec.com/??將CV和CG結合研究人臉捕捉重建技術?

（147）伊利諾伊大學D.A.Forsyth教授：http://luthuli.cs.uiuc.edu/~daf/ 三維重建?

（148）英國牛津大學Ian Reid教授：http://www.robots.ox.ac.uk/~ian/ 跟蹤和機器人導航?

（149）CMU大學Alyosha Efros 教授:??https://www.cs.cmu.edu/~efros/??圖像紋理合成?

（150）加州大學伯克利分校Jitendra Malik教授：http://www.cs.berkeley.edu/~malik/ 輪廓檢測、圖像/視頻分割、圖形匹配、目標識別?

（151）MIT教授William Freeman：??http://people.csail.mit.edu/billf/??應用于CV的ML、可視化感知的貝葉斯模型、計算攝影學；最有影響力的研究成果：圖像紋理合成?

（152）CMU博士Henry Schneiderman：??http://www.cs.cmu.edu/~hws/??目標檢測和識別；最有影響力的研究成果：目標檢測；2000年CVPR上發表了”A statistical method for 3D object detection applied to faces and cars”。該算法采用多視角訓練樣本，可用于檢測不同視角下的物體，如人臉和車，是第一個能夠檢測側臉的算法。他創建了PittPatt公司，后被Google收購?

（153）微軟研究員Paul Viola:??http://research.microsoft.com/en-us/um/people/viola/?AdaBoost算法?

（154）微軟研究員Antonio Criminisi:??http://research.microsoft.com/en-us/people/antcrim/??圖像修補，三維重建，目標檢測與跟蹤；?

（155）魏茨曼科學研究所教授Michal Irani:??http://www.wisdom.weizmann.ac.il/~irani/?超分辨率?

（156）瑞士洛桑理工學院Pascal Fua教授：http://people.epfl.ch/pascal.fua/bio?lang=en 立體視覺，增強現實?

（157）佐治亞理工學院Irfan Essa教授：http://www.ic.gatech.edu/people/irfan-essa 人臉表情識別?

整理的內容不見得完善，也不見得能滿足所有朋友的需要。如果您有更好的網站資源，歡迎推薦給我。另外，如果你不想記錄所有這些鏈接，也可以去我的博客，所有這些網址在我的博客都有鏈接。而且，以后我還會不斷更新！我的博客是：http://blog.csdn.net/carson2005

最后由??carson2005??編輯于 2013-03-02 9:44，總共編輯了 20 次

my blog:??http://blog.csdn.net/carson2005??QQ：1079185264

carson2005

OpenCV博士 ?

帖子:??577

注冊:??2008-10-01 19:22

本文轉載自：博客園-原創精華區 Leave a comment

圖像檢索和視頻檢索領域的會議和雜志

2013年10月4日機器學習信息檢索,?模式識別,?計算機視覺smallroof

下面介紹一些圖像檢索（Image Retrieval）和視頻檢索（Video Retrieval）領域相關的國際會議和雜志。

Conferences

[1] ACM international conference on Multimedia

[2] IEEE International Conference on Multimedia and Expo (ICME)

[3] ACM International Conference on Multimedia Information Retrieval (MIR)

[4] International Conference on Image and Video Retrieval (CIVR)

[5] IEEE Pacific-Rim Conference On Multimedia (PCM)

[6] IEEE International Conference on Computer Vision and Pattern Recognition (CVPR)

[7] International Conference on Computer Vision (ICCV)

[8] European Conference on Computer Vision (ECCV)

[9] International Conference on Acoustics, Speech, and Signal Processing (ICASSP)

[10] IEEE International Conference on Image Processing (ICIP)

[11] International Conference on Pattern Recognition (ICPR)

Journals

[1] IEEE Transactions on Pattern Analysis and Machine Intelligence

[2] IEEE Transaction on Multimedia

[3] IEEE Trans. on Circuits Systems for Video Technology (T-CSVT)

[4] Pattern Recognition

[5] IEEE Image Processing

[6] Multimedia Systems

[7] Image and Vision Computing

[8] Multimedia Analysis for Security Application

[9] Foundations and Trends? in Information Retrieval

[10] International Journal of Image and Graphics (IJIG?)

本文轉載自：Tech2Vision Leave a comment

AppSeed：用計算機視覺和手機加速UI設計

2013年10月3日機器學習用戶界面設計,?計算機視覺smallroof

數字設計師們，把你們的眼睛放到?Kickstarter項目AppSeed?上，它利用計算機視覺技術來加速設計過程的早期階段。AppSeed的想法是讓設計師們能快速將紙上的草圖變成可操作的UI原型，以便測試工作流，獲取早期設計觀點的反饋。

要怎么才能做到這一點呢？活動發起人的計劃是制作一款名為AppSeed的應用，設計師可以用手機拍攝設計草圖，AppSeed的計算機視覺算法會區分并識別出草圖上的不同UI元素，并且給元素以應有的功能。比如，一個文本框的草圖會變成可以輸入文本的框。

AppSeed的制作者們使用開源計算機視覺庫?OpenCV?和自行設計的算法來區分并識別UI元素。該應用會通過分析元素的形狀或相對位置，來猜測元素是什么。如果應用不能立即判斷出元素所屬的種類，它會向用戶彈出UI元素列表，要求用戶選取元素的功能。

AppSeed的格雷格·格拉斯基(Greg Goralski)解釋道：“AppSeed使用OpenCV庫來識別封閉形狀，然后根據元素位置、大小和形狀來判定元素所屬分類。因此，左上方的箭頭很有可能就是返回鍵，而同一位置畫上三條水平短線就可能是菜單按鈕。50px高、非常寬的空長方形可以被認為是文本輸入框。”

“AppSeed默認將元素變成按鈕。當然，設計師可以直接設置元素類型（這也是搞定事情的主要做法）。它使用了發現輪廓和匹配模板這兩項技術來識別形狀和特定元素。”

AppSeed的重心就放在UI設計的早期階段——“最初的頭腦風暴和回爐重做階段”。“你在項目之初的想法越多，最終產品就越好。我們想讓最初階段的UI設計變得更容易、更快、更自然。”

有趣的是，這款面向數字設計師們的應用認為紙會繼續在這一過程中扮演關鍵角色，即便有很多電子方法可以直接在計算機（平板電腦、智能筆、設計軟件等）上畫草圖。但在頭腦風暴早期設計上，格拉斯基認為很難打敗紙筆。

“我們當然能直接引入數字文件，但感覺用紙和筆來畫草圖還會陪伴我們很長時間”，他說道：“筆和紙（以及白板和標記筆）如此快、如此自然，開始項目時自然會選擇它們。數字工具很棒，也出現很長時間了，但筆和紙讓人感覺很對，也很容易進行協作，且能常伴左右。”

從紙上轉移到AppSeed中的設計將會作為UI原型在應用內運行，也可以以HTML5原型的形式分享給其他人，無需安裝AppSeed就可以測試工作流。

目前還沒有最終應用的完整UI元素列表（假設其融資成功的話），該團隊計劃從支持者獲得反饋，了解他們想要的元素種類。格拉斯基表示，可能加入的元素包括：地圖、街景、滑塊、彈窗、邊欄目錄、開關、列表、返回鍵、社交媒體連接、打開相機（和其他按鈕），還包括掃動、捏放和輕點等手勢。

在AppSeed的原型階段完成后，設計就可以移交至下一階段的設計，用Photoshop制作分層文件（比如每個按鈕或元素都有單獨的層，以便于操控）。

格拉斯基稱，AppSeed概念的主要競爭對手是?POP?和?Protosketch?，但通過在應用中加入計算機視覺技術，AppSeed要更好。“兩款[競爭應用]都是拍攝草圖照片并在應用中顯示。區別在于我們會用計算機視覺來區分元素。正是這一階段讓我們把圖形變成UI元素。這一區別差異巨大。”

目前，AppSeed團隊已經制作出了可運作的應用原型，但在尋求資金將它變成完整的iOS應用（眾籌活動中也將推出Android應用列入了計劃之中）。

他們正在尋求籌資3萬加元來制作iOS應用，目前已接近籌款目標的一半，而30天的籌款活動還剩下大概10天。Kickstarter活動版應用的價格起價為8加元和30加元（30加元可以得到應用和速寫薄）。他們計劃在1月發布應用。

本文轉載自：TechCrunch中國 Leave a comment

模式識別，計算機視覺，計算機圖形學，智能控制，信號處理，語音識別，知識處理，機器學習，數據挖掘領域區別

2013年9月22日機器學習模式識別,?計算機視覺,?語音識別smallroof 1.人工智能：給機器賦予人類的智能，讓機器能夠像人類那樣獨立思考。當然，目前的人工智能沒有發展到很高級的程度，這種智能與人類的大腦相比還是處于非常幼稚的階段，但目前我們可以讓計算機掌握一定的知識，更加智能化的幫助我們實現簡單或復雜的活動。2.機器學習。通俗的說就是讓機器自己去學習，然后通過學習到的知識來指導進一步的判斷。舉個最簡單的例子，我們訓練小狗狗接飛碟時，當小狗狗接到并送到主人手中時，主人會給一定的獎勵，否則會有懲罰。于是狗狗就漸漸學會了接飛碟。同樣的道理，我們用一堆的樣本數據來讓計算機進行運算，樣本數據可以是有類標簽的，并設計懲罰函數，通過不斷的迭代，機器就學會了怎樣進行分類，使得懲罰最小。然后用學習到的分類規則進行預測等活動。3.數據挖掘。數據挖掘是一門交叉性很強的學科，可以用到機器學習算法以及傳統統計的方法，最終的目的是要從數據中挖掘到為我所用的知識，從而指導人們的活動。所以我認為數據挖掘的重點在于應用，用何種算法并不是很重要，關鍵是能夠滿足實際應用背景。而機器學習則偏重于算法本身的設計。數據挖掘與知識發現（第二版）中說道，數據挖掘任務分類：包括分類或預測模型知識發現，數據總結，數據聚類，關聯規則發現，時序模式發現，依賴關系或依賴模型發現，異常和趨勢發現等。數據挖掘對象分類：包括數據庫，面向對象數據庫，空間數據庫，時態數據庫，文本數據庫，多媒體數據庫，異構數據庫，數據倉庫，演繹數據庫和Web數據庫等。數據挖掘方法分類：包括統計方法，機器學習方法，神經網絡方法和數據庫方法。4.模式識別。我覺得模式識別偏重于對信號、圖像、語音、文字、指紋等非直觀數據方面的處理，如語音識別，人臉識別等，通過提取出相關的特征，利用這些特征來進行搜尋我們想要找的目標。 ????? 數據挖掘是數據庫知識發現（KDD）過程中應用數據分析和發現算法的一個步驟，在可接受的計算效率的局限性之內，在數據上產生一種特殊的列舉模式（或模型）。要注意模式空間通常是無限的而且模式的列舉包括對那個空間某種形式的搜索。 5.計算機視覺

計算機視覺是一門關于如何運用照相機和計算機來獲取我們所需的，被拍攝對象的數據與信息的學問。形象地說，就是給計算機安裝上眼睛（照相機）和大腦（算法），讓計算機能夠感知環境。我們中國人的成語"眼見為實"和西方人常說的"One picture is worth ten thousand words"表達了視覺對人類的重要性。不難想象，具有視覺的機器的應用前景能有多么地寬廣。

計算機視覺既是工程領域，也是科學領域中的一個富有挑戰性重要研究領域。計算機視覺是一門綜合性的學科，它已經吸引了來自各個學科的研究者參加到對它的研究之中。其中包括?計算機科學?和工程、?信號處理?、?物理學?、應用數學和統計學，神經生理學和認知科學?等。

6.智能控制

智能控制的定義一：智能控制是由智能機器自主地實現其目標的過程。而?智能機器?則定義為，在結構化或非結構化的，熟悉的或陌生的環境中，自主地或與人交互地執行人類規定的任務的一種機器。

定義二： K.J.奧斯托羅姆則認為，把人類具有的直覺推理和試湊法等智能加以形式化或機器模擬，并用于控制系統的分析與設計中，以期在一定程度上實現控制系統的智能化，這就是智能控制。他還認為自調節控制，自適應控制就是智能控制的低級體現。

定義三：智能控制是一類無需人的干預就能夠自主地驅動智能機器實現其目標的自動控制，也是用計算機模擬人類智能的一個重要領域。

定義四：智能控制實際只是研究與模擬人類智能活動及其控制與信息傳遞過程的規律，研制具有仿人智能的工程控制與信息處理系統的一個新興分支學科。

從20世紀60年代起，計算機技術和人工智能技術迅速發展，為了提高控制系統的自學習能力，控制界學者開始將?人工智能技術應用于控制系統?。

??人工智能?是?計算機科學?的一個分支，它企圖了解智能的實質，并生產出一種新的能以人類智能相似的方式做出反應的智能機器，該領域的研究包括機器人、?語言識別?、?圖像識別?、?自然語言處理?和?專家系統?等。研究范疇：

自然語言處理，知識表現，智能搜索，推理，規劃，機器學習，知識獲取，組合調度問題，感知問題，模式識別，邏輯程序設計軟計算，不精確和不確定的管理，人工生命，神經網絡，復雜系統，遺傳算法。

7.信號處理，語音識別，知識處理都是人工智能所要研究的內容。

區別：以上內容都包括在人工智能的范圍之內。對數據挖掘而言，數據庫提供數據管理技術，機器學習和統計學提供數據分析技術。由于統計學往往醉心于理論的優美而忽視實際的效用，因此，統計學界提供的很多技術通常都要在機器學習界進一步研究，變成有效的機器學習算法之后才能再進入數據挖掘領域。從這個意義上說，統計學主要是通過機器學習來對數據挖掘發揮影響，而機器學習和數據庫則是數據挖掘的兩大支撐技術。從數據分析的角度來看，絕大多數數據挖掘技術都來自機器學習領域，但機器學習研究往往并不把海量數據作為處理對象，因此，數據挖掘要對算法進行改造，使得算法性能和空間占用達到實用的地步。同時，數據挖掘還有自身獨特的內容，即關聯分析。

而模式識別和機器學習的關系是什么呢，傳統的模式識別的方法一般分為兩種：統計方法和句法分析方法。句法分析一般是不可學習的，而統計分析則是發展了不少機器學習的方法。也就是說，機器學習同樣是給模式識別提供了數據分析技術。

至于，數據挖掘和模式識別，那么從其概念上來區分吧，數據挖掘重在?發現知識?，模式識別重在?認識事物?。

機器學習的目的是建模隱藏的數據結構，然后做識別、預測、分類等。

因此，機器學習是方法，模式識別是目的。

智能控制包括機器學習這個方面?。智能控制與數據挖掘的區別，智能控制也包括數據挖掘。?計算機視覺也包括數據挖掘?？？？

有不少學科的研究目標與?計算機視覺?相近或與此有關。這些?學科?中包括圖像處理、?模式識別?或?圖像識別?、景物分析、圖象理解等。計算機視覺包括圖像處理和模式識別，除此之外，它還包括空間形狀的描述，幾何建模以及認識過程。實現圖像理解是計算機視覺的終極目標。

圖像處理?技術把輸入圖像轉換成具有所希望特性的另一幅圖像。例如，可通過處理使輸出圖象有較高的信-噪比，或通過增強處理突出圖象的細節，以便于操作員的檢驗。在計算機視覺研究中經常利用圖象處理技術進行預處理和?特征抽取?。

模式識別?技術?根據從圖象抽取的統計特性或結構信息，把圖像分成予定的類別。例如，文字識別或?指紋識別?。在計算機視覺中模式識別技術經常用于對圖象中的某些部分，例如分割區域的識別和分類。

根據我的研究體會，三者之間既有區別，又有聯系。計算機圖形學是給定關于景象結構、表面反射特性、光源配置及相機模型的信息，生成圖像。而計算機視覺是給定圖象，推斷景象特性實現的是從模型到圖像的變換，也就是說從圖象數據提取信息，包括景象的三維結構，運動檢測，識別物體等。模式識別則是從特征空間到類別空間的變換。研究內容包括特征提取（PCA，LDA，LFA，Kernel，Mean Shift，SIFT，ISOMAP，LLE）；特征選擇；分類器設計（SVM，AdaBoost）等。

本文轉載自：CSDN博客 Leave a comment

Some good resources: – Leo Han

2013年9月14日機器學習計算機視覺smallroof

對一個方向的深入研究，必須建立在廣泛且有質量的閱讀、領悟之上。

研一的一年時間里，感覺雖然黃老師給我的任務并不重，課程壓力也不大，但思想負擔不輕。想在計算機視覺領域做出點東西，這一年是打基礎、搞研究最重要的一年。

抓得住現在，才抓得住未來。

今天也找了一些計算機視覺領域的前沿陣地，有時間一定多看看。多學知識、多總結。

資源分為三類，第一類是一些注明的計算機視覺研究中心：

谷歌研究院：?http://research.google.com/index.html

斯坦福視覺研究中心：?http://vision.stanford.edu/research.html

中國視覺網：?http://www.china-vision.net/

微軟亞洲計算機視覺：?http://research.microsoft.com/en-us/groups/vc/

微軟劍橋研究院ML與CV研究組：?http://research.microsoft.com/en-us/groups/mlp/default.aspx

香港中文大學多媒體實驗室（湯曉鷗）：?http://mmlab.ie.cuhk.edu.hk/

第二類是不少的技術博客，關于做研究的一些心得和不少新鮮資訊，也可以研究一下。

偶爾能看到一篇挺好的文章，可惜都沒有整理下來記住來源，看過就錯過了，以后有發現再補上吧。

第三類是頂級會議、大牛期刊的錄取paper，可以多看看學習學習。

應該定期從PAMI上精讀一兩篇文章。

主要的有：

三大頂級會議：BMVC ICCV???????? CVPR

巔峰期刊：??? ? PAMI

本文轉載自：博客園-所有隨筆區 Leave a comment

49 款人臉檢測/識別的API、庫和軟件

2013年8月31日機器學習人臉識別,?計算機視覺smallroof

自從谷歌眼鏡被推出以來，圍繞人臉識別，出現了很多爭議。我們相信，不管是不是通過智能眼鏡，人臉識別將在人與人交往甚至人與物交互中開辟無數種可能性。

為了幫助研究過程中探索人臉識別，我們列出以下人臉檢測和識別API。希望有所幫助！

Face Recognition?–?拉姆達實驗室斯蒂芬弄的。示例代碼和圖形演示點擊http://api.lambdal.com/docs，?我們的API提供了面部識別，面部檢測，眼睛定位，鼻子定位，嘴巴定位，和性別分類。如果您有任何疑問，只需發一封郵件到s@lambdal.com?。

Face (Detection)??–??計算機視覺面部識別和面部檢測。這是一個完美的face.com替代品。目前，我們有一個免費的API進行人臉檢測。

Animetrics Face Recognition??–??Animetrics的人臉識別API可用于圖片中的人臉檢測。面部特征或“地標”的信息被返回作為圖象上的坐標。?Animetrics人臉識別也會在三維坐標軸上偵測并返回臉部位置信息。

Skybiometry Face Detection and Recognition?一個易于使用的人臉檢測與識別的API。必須在您的SkyBiometry帳戶中創建應用程序來使用它。（如果你還沒有帳戶，請先注冊）。

ImageVision Face Detection??–??測試版發布更好的人臉檢測服務！ImageVision是一個計算機視覺公司改進技術，確定在任意的（數字）的圖像中的人臉的位置和大小。

Face and scene recognition by Rekognition.com??–??Face.com的替代品！快速，強大和可擴展的rekognition引擎可以做面部檢測，采集，識別，場景理解！它可以自動訓練使用Facebook上的圖像和標簽！

FaceRect?-???FaceRect是一個功能強大且免費的API進行人臉檢測，能夠發現網頁中的或者上傳文件中特定圖片上的臉部（包括正面和側面），并能夠在一張圖片中找到多張人臉，生成的 JSON輸出每個臉部的邊界框。

Infatics Face Detection??-簡單的?人臉檢測?API。

OpenCV Face Recognizer??-基于?OpenCV?（開源計算機視覺庫：??http://opencv.org?）是一個開源的BSD授權的庫，其中包括數百個計算機視覺算法。

Libface??–??Libface庫旨在使人臉識別技術應用于開源社區。這是用?C++?編寫的，托管在???Sourceforge上?。這個庫使用?OpenCV?2.0???，目標是成為一個中間件，在人臉識別和檢測時，開發人員不必包括任何OpenCV的代碼。

Automatic naming of characters in video?用來是標記電視或電影每個幀中出現的人名。

CCV??-現代計算機視覺庫。

OpenBR?-開源的生物特征識別。

Flandmark??-開源實現面部地標探測器。

計算機表情識別工具箱（CERT）?-一個終端到終端的完全自動化的實時面部表情識別系統。

Nviso 3D facial imaging technology?-從面部表情分析人類的情感。比任何其他方法更直接和自動化。

FaceReader?–??FaceReader是世界上第一個能夠自動分析面部表情的工具，使用戶能夠客觀的評估一個人的情緒。

Affdex?–??–??通過攝像頭，Affdex從面部表情讀取的人們的情緒狀態，比如喜好和興趣，使營銷人員更快，更準確地洞察到消費者對品牌和媒體的回應。

Faceware??–??分析儀從視頻中抓取一個演員的面部表現，生成用于在?Retargeter???的IMPD文件??。它通過將用戶在前端的簡單輸入和在后端的復雜的計算機視覺算法組合起來實現這一功能。

20.?? Face detection in iOS?–?在iOS中的人臉檢測?。

Face-Recognition-SDK?-在您的應用程序添加面部識別。

Oddcast face detection API?-這個人臉跟蹤API允許Flash開發人員利用以前只在高端視頻游戲中使用的高級技術。

BioID?-世界上第一個基于攝像頭的個人識別。

Betaface API?-人臉檢測和識別。

Discrete Area Filters Face Detector?—可檢測臉部15個點，4個部分，多張臉，或遮住的臉。

Face detection using Support Vector Machine?-該程序是克隆MATLAB中的“人臉檢測系統”，可以代替神經網絡算法的?人臉檢測?，它是基于 SVG。

fdlib?–?是一個?C / C + +??和??MATLAB的人臉檢測庫，可檢測圖像中的正臉。

Visage?-一個人機接口，旨在用臉部取代傳統的鼠標。用一個攝像頭，將臉部面相的運動變成鼠標指針的運動。如左/右眼睛閃爍產生左/右鼠標點擊事件。

Face tracking Project?（卡耐基梅隆大學）–結合可變形模板和顏色匹配來跟蹤臉部。

Real-time face detection program?（?實時人臉檢測程序?）-來自德國弗勞恩霍夫研究所IIS的演示。展示了用邊緣定位匹配的面部跟蹤和檢測。

Evaluation of Face Recognition Algorithms?-來自科羅拉多州立大學研究人員開發的人臉識別算法，它提供了一套標準的眾所周知的算法，并建立實驗?協議?。

Computer Vision Source Code?-實用的圖像處理代碼集合。

Acsys biometrics SDK?（?ACSYS生物識別SDK??）-允許第三方開發者用先進的面部生物識別技術來實現自己應用。

Cognitec SDK?-為世界各地的企業和政府客戶開發領先的人臉識別技術和應用。

KeyLemonFaceSDK?-為主要的操作系統提供集成識別技術。

FaceIT SDK

FaceSDK?– 人臉識別和基于面部的生物識別功能，易整合。

Verilook SDK?-–使用了VeriLook算法，該算法確保快速和可靠的面部識別。

Beyond Reality Face SDK?-在視頻流中的一張簡單圖片上，計算面部位置和3D角度。這些信息可以被用來將三維對象放置到圖像上，或通過頭部運動控制一個應用程序。

InSight SDK?-通過測量面部肌肉的運動，對人臉進行完全自動化分析，并將這些面部肌肉運動轉化為七個普遍的面部表情。

Visage FaceDetect SDK?-以C++軟件開發工具包的形式，包含了很多在靜止圖像中發現臉和五官的有用技術。

Microsoft Research Face SDK Beta?– 集成了微軟研究團隊最新的面部識別技術。

How To: Kinect for Windows SDK Face Recognition

Bayometric FaceIt Face Recognition SDK?-結合了傳統的面部皮膚生物識別技術。

FacePhi FaceRecognition SDK?–包含了一組.NET和Silverlight庫

360Biometrics Face SDK?-非常先進的臉部識別系統，用來將人臉圖像嵌入或鏈接到已有的數據庫中。

Hunter TrueID

IMRSV?-現實世界中的實時感知計算軟件，用一個基本的攝像頭，就可以測量25英尺外，多達25人的性別，年齡，關注點，目光等信息。它也有一個REST API（應用編程接口）

Bob?-一個信號處理和機器學習工具箱，最初是由IDIAP研究所的生物識別技術團隊在瑞士開發的??。

還有哪些是這個名單上缺少的嗎？如果有，請在評論中添加。

原文鏈接：?mashape????翻譯：?伯樂在線?–?伯樂在線讀者?
譯文鏈接：?http://blog.jobbole.com/45936/

(mashape)

本文轉載自：流媒體家園 – 羅索工作室 Leave a comment

《用Python構建機器學習》——第十章：計算機視覺-模式識別讀后小結

2013年8月28日機器學習Python,?模式識別,?計算機視覺smallroof

本文是《Building Machine Learning Systems with Python》第十章的筆記。?亞馬遜英文版鏈接?（話說亞馬遜現在圖書的介紹圖像做得很贊啊！）

這本書和圖靈出版的《機器學習實戰》一書有點類似。《機器學習實戰》那本書是非常建議購買一本的，如果這本書出版了，也建議購買一本。這里將閱讀第十章的一些心得記錄下來。

首先，關于第十章《Computer Vision: Pattern Recognition》。這一章有點名不符實，本章一半篇幅在介紹圖像的基本處理，這一部分有點充數的感覺。

另外，本章使用了我以前沒聽過的?Mahotas?圖像處理庫。關于這個庫的介紹可參見：?介紹?、?Github?、?官網?、?文檔?。

我其實不清楚為什么作者使用這個庫而不用OpenCV。比如，Mahotas遠沒有OpenCV功能強大，從?目前已有的信息?來看，Mahotas已有的優點，OpenCV都具有。另外，更重要的一點，根據國外友人的測試，OpenCV的速度遠遠快于其他常見的Python上的圖像處理庫，OpenCV比Mahotas快20-30倍，地址?在這?（自備梯子）。當然，不排除我對OpenCV先入為主的一些看法。

其實，上面一段是調侃的。。。因為后來我發現Mahotas軟件包的作者就是本書的作者之一——Luis Pedro Coelho，這就不難理解為什么本書使用這個以前我沒聽過的庫了。（仰天長笑，我還以為我out了。。。）

言歸正傳。本章的布局為：

10.1 Introducing image processing?
10.2 Loading and displaying images?
10.3 Basic image processing?

Thresholding?
Gaussian blurring?
Filtering for different effects?
Adding salt and pepper noise?
Putting the center in focus?

10.4 Pattern recognition?
10.5 Computing features from images?
10.6 Writing your own features?
10.7 Classifying a harder dataset?
10.8 Local feature representations

標題號是我自己加上去的，為了方便下文的說明。10.4之前的內容，除了Putting the center in focus的內容沒有介紹外，其他都能在我的《?OpenCV-Python教程?》中找到。

10.4是模式識別，但這里有些誤導。他用Tip來提示作者：“模式識別就是圖像分類。由于歷史原因，曾經將圖像分類稱為圖像分類。但有關模式識別的應用和方法不只局限于圖像方面。”根據機械工業出版社的《模式識別》一書，模式識別是將對象進行分類，這些對象包括圖像、信號波形或者任何可測量且需要分類的對象。所以建議讀者在記住知識點時，不要只看Tip的標題，還要看其說明。^_^。

10.5和10.6介紹計算特征圖像以及如何自己編寫特征。?Sobel算子?、?Laplacian算子?和Canny算子?都是計算圖像特征的。圖像特征并沒有統一的定義，但可以看一下?維基百科的詞條?，這個詞條是介紹特征提取，可以作為參考。

10.7是對10.8的鋪墊，而10.8這介紹用Mahotas包中的函數應用SURF算法，并用K均值對不同結果進行了精度評價。有空我寫一篇OpenCV-Python關于SURF的文章。

個人觀點，這一章對計算機視覺的機器學習方面做了初步的介紹，并且宣傳了作者自己的Mahotas函數包。讀者要想在計算機視覺充分利用機器學習，還需要進一步的學習。

友情提示：尊重版權，請勿索要電子版，謝謝。?

本文轉載自：sunny2038的專欄 Leave a comment

[收藏]40多個關于人臉檢測/識別的API、庫和軟件

2013年8月19日機器學習人臉識別,?計算機視覺smallroof

補充：

50：Face++：??http://cn.faceplusplus.com/

—-

收藏原因：忒多了。。

原文鏈接：??mashape????翻譯：??伯樂在線??–??伯樂在線讀者?
譯文鏈接：??http://blog.jobbole.com/45936/

————————————

為了幫助研究過程中探索人臉識別，我們列出以下人臉檢測和識別 API。希望有所幫助！

Face Recognition??-?拉姆達實驗室斯蒂芬弄的。示例代碼和圖形演示點擊http://api.lambdal.com/docs，?我們的 API 提供了面部識別，面部檢測，眼睛定位，鼻子定位，嘴巴定位，和性別分類。如果您有任何疑問，只需發一封郵件到s@lambdal.com?。

Face (Detection)??–??計算機視覺面部識別和面部檢測。這是一個完美的 face.com 替代品。目前，我們有一個免費的 API 進行人臉檢測。

Animetrics Face Recognition??–??Animetrics 的人臉識別 API 可用于圖片中的人臉檢測。面部特征或“地標”的信息被返回作為圖象上的坐標。?Animetrics 人臉識別也會在三維坐標軸上偵測并返回臉部位置信息。

Skybiometry Face Detection and Recognition??一個易于使用的人臉檢測與識別的 API。必須在您的 SkyBiometry 帳戶中創建應用程序來使用它。（如果你還沒有帳戶，請先注冊）。

ImageVision Face Detection??–??測試版發布更好的人臉檢測服務！ImageVision 是一個計算機視覺公司改進技術，確定在任意的（數字）的圖像中的人臉的位置和大小。

Face and scene recognition by Rekognition.com??-??Face.com 的替代品！快速，強大和可擴展的 rekognition 引擎可以做面部檢測，采集，識別，場景理解！它可以自動訓練使用 Facebook 上的圖像和標簽！

FaceRect?-???FaceRect 是一個功能強大且免費的 API 進行人臉檢測，能夠發現網頁中的或者上傳文件中特定圖片上的臉部（包括正面和側面），并能夠在一張圖片中找到多張人臉，生成的 JSON 輸出每個臉部的邊界框。

Infatics Face Detection??-簡單的?人臉檢測?API。

OpenCV Face Recognizer???-基于 OpenCV（開源計算機視覺庫：?http://opencv.org??）是一個開源的 BSD 授權的庫，其中包括數百個計算機視覺算法。

Libface??-??Libface 庫旨在使人臉識別技術應用于開源社區。這是用 C++ 編寫的，托管在???Sourceforge 上?。這個庫使用??OpenCV???2. 0???，目標是成為一個中間件，在人臉識別和檢測時，開發人員不必包括任何 OpenCV 的代碼。

Automatic naming of characters in video??用來是標記電視或電影每個幀中出現的人名。

CCV??-現代計算機視覺庫。

OpenBR?-開源的生物特征識別。

Flandmark??-開源實現面部地標探測器。

計算機表情識別工具箱（CERT）?-一個終端到終端的完全自動化的實時面部表情識別系統。

Nviso 3D facial imaging technology?-從面部表情分析人類的情感。比任何其他方法更直接和自動化。

FaceReader?-??FaceReader 是世界上第一個能夠自動分析面部表情的工具，使用戶能夠客觀的評估一個人的情緒。

Affdex??-??–??通過攝像頭，Affdex 從面部表情讀取的人們的情緒狀態，比如喜好和興趣，使營銷人員更快，更準確地洞察到消費者對品牌和媒體的回應。

Faceware??–??分析儀從視頻中抓取一個演員的面部表現，生成用于在?Retargeter???的 IMPD 文件??。它通過將用戶在前端的簡單輸入和在后端的復雜的計算機視覺算法組合起來實現這一功能。

20. ?? Face detection in iOS?-?在 iOS 中的人臉檢測?。

Face-Recognition-SDK?-在您的應用程序添加面部識別。

Oddcast face detection API?-這個人臉跟蹤 API 允許 Flash 開發人員利用以前只在高端視頻游戲中使用的高級技術。

BioID?-世界上第一個基于攝像頭的個人識別。

Betaface API?-人臉檢測和識別。

Discrete Area Filters Face Detector?—可檢測臉部 15 個點，4 個部分，多張臉，或遮住的臉。

Face detection using Support Vector Machine?-該程序是克隆 MATLAB 中的“人臉檢測系統”，可以代替神經網絡算法的?人臉檢測?，它是基于 SVG。

fdlib??–?是一個?C / C + +??和??MATLAB 的人臉檢測庫，可檢測圖像中的正臉。

Visage?-一個人機接口，旨在用臉部取代傳統的鼠標。用一個攝像頭，將臉部面相的運動變成鼠標指針的運動。如左/右眼睛閃爍產生左/右鼠標點擊事件。

Face tracking Project?（卡耐基梅隆大學）–結合可變形模板和顏色匹配來跟蹤臉部。

Real-time face detection program?（?實時人臉檢測程序?）-來自德國弗勞恩霍夫研究所 IIS 的演示。展示了用邊緣定位匹配的面部跟蹤和檢測。

Evaluation of Face Recognition Algorithms?-來自科羅拉多州立大學研究人員開發的人臉識別算法，它提供了一套標準的眾所周知的算法，并建立實驗協議。

Computer Vision Source Code?-實用的圖像處理代碼集合。

Acsys biometrics SDK?（?ACSYS 生物識別 SDK??）-允許第三方開發者用先進的面部生物識別技術來實現自己應用。

Cognitec SDK?-為世界各地的企業和政府客戶開發領先的人臉識別技術和應用。

KeyLemonFaceSDK?-為主要的操作系統提供集成識別技術。

FaceIT SDK

FaceSDK?- 人臉識別和基于面部的生物識別功能，易整合。

Verilook SDK?-–使用了 VeriLook 算法，該算法確保快速和可靠的面部識別。

Beyond Reality Face SDK?-在視頻流中的一張簡單圖片上，計算面部位置和 3D 角度。這些信息可以被用來將三維對象放置到圖像上，或通過頭部運動控制一個應用程序。

InSight SDK?-通過測量面部肌肉的運動，對人臉進行完全自動化分析，并將這些面部肌肉運動轉化為七個普遍的面部表情。

Visage FaceDetect SDK?-以 C++ 軟件開發工具包的形式，包含了很多在靜止圖像中發現臉和五官的有用技術。

Microsoft Research Face SDK Beta?- 集成了微軟研究團隊最新的面部識別技術。

How To: Kinect for Windows SDK Face Recognition

Bayometric FaceIt Face Recognition SDK?-結合了傳統的面部皮膚生物識別技術。

FacePhi FaceRecognition SDK??–包含了一組 .NET 和 Silverlight 庫

360Biometrics Face SDK?-非常先進的臉部識別系統，用來將人臉圖像嵌入或鏈接到已有的數據庫中。

Hunter TrueID

IMRSV?-現實世界中的實時感知計算軟件，用一個基本的攝像頭，就可以測量 25 英尺外，多達 25 人的性別，年齡，關注點，目光等信息。它也有一個 REST API（應用編程接口）

Bob?-一個信號處理和機器學習工具箱，最初是由 IDIAP 研究所的生物識別技術團隊在瑞士開發的??。

還有哪些是這個名單上缺少的嗎？如果有，請在評論中添加。

本文轉載自：丕子 Leave a comment

幾個模式識別和計算機視覺相關的Matlab工具箱 – Hanson-jun

2013年7月2日機器學習MATLAB,?模式識別,?計算機視覺smallroof

模式識別、計算機視覺、圖像處理等領域大部分是對一些圖像等數據的處理，比較常用的語言是C++和Matlab，相應也對應很多庫，象opencv等，都是很好用功能也很強大，但是對于數據處理更方便的應該還是Matlab了，其強大的矩陣處理能力真是解決了很多問題，提高了編碼效率。

這里我搜集了一些關于模式識別、視覺相關的Matlab工具箱（Toolbox），其中涵蓋的東西就很多了，像是一些分類聚類的模型和算法，一些數據的表示和繪制等，應該會有所幫助，但是一般都是英文的，還是那句話，用到的話肯定英文也不是問題了，對吧。自己解決就行。

第一個，這個很全面但是很雜，直接涵蓋了各行各業的，物理化學都有，不過還是以咱們的方向為主：

Matlab Toolboxes

下面介紹的幾個在上面這個已經包含進去了，也相當于一個全面的鏈接庫。

Statistical Pattern Recognition Toolbox?，這算是一個相當好用的了，也比較全面，看幾個圖：

再一個：

DCPR (Data Clustering & Pattern Recognition) Toolbox?，也看幾個圖：

gmmGrowDemo?: Animation of GMM (Gaussian mixture models) growing with center splitting

再來一個：?David M.J. Tax — Data description toolbox (dd_tools)

當然，網上還有很多很多，還有很多很多牛人作者頁面上的很多很多源碼，在做研究的時候有機緣碰到選擇一下就一般能用。

本文轉載自：Hanson-jun Blog

總結

以上是生活随笔為你收集整理的计算机视觉的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

上一篇： java学习（22）：if语句
下一篇：玩转oracle 11g（1）：Orac