站在巨人的肩膀上,Adrian与dlib中face_recongnition模块的贡献者Adam的采访部分翻译
這篇博客是Adrain對Adam Geitgey的采訪部分翻譯
Adrian:pyimagesearch博客作者,博士,寫了很多關于OpenCV,人臉識別,機器學習,深度學習,計算機視覺等的高質量博客,今年發現的一個寶藏作者,在這里可以學到一些很有實際意義的課程。(人臉檢測、制作GIF、圖片去重、圖片模糊度檢查等)
Adam:dlib中face_recognition模塊貢獻者,https://www.machinelearningisfun.com/的作者。
Adam采訪概述:
- 1. 自述
- 2. 他如何以及為什么創造face_recognition Python模塊
- 3. 使用RNN生成新的《超級馬里奧兄弟》游戲關卡
- 4. 他最喜歡的工具和庫
- 5. 對剛開始學習計算機視覺和深度學習的讀者的建議
- 6. 他的工作包括基于深度學習的細分,自動駕駛汽車和衛星/航空攝影
- 參考
1. 自述
對于我來說,嘗試將主題簡化為基本知識并以任何人都可以理解的方式呈現,這對我來說更具挑戰性和樂趣。我沉迷于嘗試將復雜的主題分解為最簡單的形式。這可能與我的學習方式有關——我喜歡在了解細節之前先了解全局。
如果您可以寫出清晰、簡單的電子郵件來說明您的團隊正在解決的問題,那么僅此一項,就可以使您在一家大型科技公司的職業生涯中走得很遠。
2. 他如何以及為什么創造face_recognition Python模塊
Adrain: 您的face_recognition庫是GitHub上最受歡迎的面部識別庫之一。我甚至在過去的三篇博客文章中都使用過它!您能告訴我們更多創建它的過程嗎?
Adam:我一直在尋找Python中人臉識別的良好解決方案,但是我發現大多數研究代碼都是作為一次性實驗編寫的。通常必須先重寫它,然后才能在生產應用程序中使用它。而且所有內容都用幾種不同的編程語言拼湊而成,并且需要下載額外的文件。
我寫了一篇有關人臉識別工作原理的文章,但是我遇到的大多數問題來自無法正確安裝庫的讀者。我想要的東西像“ pip install face_recognition”一樣易于部署。
大約在那時,戴維斯·金(Davis King)更新了他出色的dlib庫,以包括一個新的面部識別模型。這似乎很適合我想做的事情。由于Davis已經完成了大部分艱苦的工作,因此我要做的就是將其打包到我喜歡的API中,編寫大量文檔和示例并將其托管在pip上。
3. 使用RNN生成新的《超級馬里奧兄弟》游戲關卡
Adrian:您見過face_recognition的最酷/最酷的項目是什么?庫用于什么?
Adam: 人們已經使用它來構建各種整潔的項目,例如使用面部識別功能在教室里自動上課的工具。但是對我來說最酷的是一個使用面部識別模型生成的編碼作為輸入來訓練情緒檢測模型的用戶。轉移學習真的很酷,我喜歡利用現有模型來構建新模型的想法。
4. 他最喜歡的工具和庫
Adrian:您選擇什么工具和庫?
Adam: 我使用Python進行編碼和編碼大約已有20年了,我將其用于我的所有機器學習項目。最好的部分是所有令人驚嘆的庫!
我最喜歡的一些庫是用于訓練新神經網絡的Keras,用于自然語言處理的spaCy和用于快速建立文本分類模型的fastText。而且,真正了解如何使用numpy和Pandas可以節省許多時間來清理數據。
5. 對剛開始學習計算機視覺和深度學習的讀者的建議
Adrian:您對剛開始學習計算機視覺和深度學習的讀者有什么建議嗎?
Adam: 如果您是Python編程語言的新手,請花一些時間來學習語法和語言結構。從長遠來看,它將為您節省大量時間。我得到的許多問題實際上只是Python語法問題或誤解。它是與C ++或Java不同的語言。
除此之外,學習訓練模型的基本概念,然后跳入并在您感興趣的項目中進行嘗試! 通過這樣做,相比只是閱讀它將學到更多。
6. 他的工作包括基于深度學習的細分,自動駕駛汽車和衛星/航空攝影
Adrian:接下來是什么?您正在進行什么類型的項目?
Adam: 我正在撰寫有關自然語言處理的新系列文章。
Adrian:您將在PyImageSearch自己的計算機視覺和深度學習會議PyImageConf 2018上發言,我們很高興邀請到您!您能否告訴我們更多有關您的談話內容的信息?
Adam: 我將要討論如何進行圖像分割。圖像分割是您拍攝照片的地方,不僅可以識別其中的對象,還可以在每個對象周圍實際繪制線條。
圖像分割有很多潛在用途。例如,無人駕駛汽車需要能夠將相機對準道路并以高精度識別每個行人,而圖像分割是做到這一點的一種方法。您可以想象未來版本的Photoshop能夠自動自動跟蹤每個對象,從而非常擅長從圖像中提取對象。
圖像分割最令人興奮的用途是處理衛星和航空攝影。通過圖像分割,我們實際上可以輸入原始衛星照片,然后讓計算機自動跟蹤每座建筑物的輪廓并跟蹤每條道路。這是過去數千人手工完成的工作,花費了數百萬美元。
圖像分割具有改變整個制圖業的潛力。隨著圖像分割技術的普及,計算機將能夠完成80%的地圖追蹤工作,從而繪制整個世界的地圖,然后人類只需清理并注釋結果即可。
圖像分割技術具有最終加快處理速度的潛力,其目標將不再僅僅是映射整個世界,而是看我們能夠基于最新的衛星圖像繪制整個世界的速度有多快。
對于人道主義和醫療團隊而言,訪問偏遠地區的高質量地圖數據至關重要。更好地獲取偏遠人口居住地的地圖可能挽救生命。
參考
https://www.pyimagesearch.com/2018/07/11/an-interview-with-adam-geitgey-creator-of-the-face_recognition-python-library/
總結
以上是生活随笔為你收集整理的站在巨人的肩膀上,Adrian与dlib中face_recongnition模块的贡献者Adam的采访部分翻译的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 使用Python,dlib中新型、更快、
- 下一篇: windows用 tree命令查看目录文