日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 人工智能 > pytorch >内容正文

pytorch

深度学习新手入门课

發布時間:2023/12/14 pytorch 48 豆豆
生活随笔 收集整理的這篇文章主要介紹了 深度学习新手入门课 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

課程介紹

伴隨人工智能時代的到來,越來越多的人開始關注深度學習,且希望能夠入行深度學習,其中不乏一些行業小白、非計算機專業的人士。

本達人課,共計11篇文章,涵蓋了入行深度學習所涉及到的大多數疑問,以及行業介紹、前景展望和實戰 Demo,作者希望通過最樸實、通俗的語言,從一個入門者的角度,分享自己曾經遇到的那些坑和學習經驗,幫助那些希望轉行、找不到方向的朋友走進深度學習的世界。

本課程共包含三大部分:

第一部分(第1篇)帶您初步認識深度學習,了解行業背景、優勢、前景以及入行深度學習需要的一些準備工作,為那些準備入行的人答疑、解惑。

第二部分(第2-7篇)帶您具體了解深度學習技術在不同行業的應用,并分享學習深度學習的經驗,幫助大家找到研究方向。

第三部分(第8-11篇)熟悉深度學習的兩種框架 Caffe 和 TensorFlow,通過簡單的 Demo 引導大家開始深度學習實戰。

作者介紹

王學寬,曾就職于??低曆芯吭簱斡嬎銠C視覺方向算法工程師,發表多篇學術論文、申請多項國家專利,參與多項圖像、自然語言項目相關課題研發工作,在計算機視覺領域具有深厚的專業知識和工程開發經驗。運營有公眾號:白話機器學習(微信號:simpleml90hou),開設有知乎專欄:《深度學習干貨鋪》。

課程內容

第01課:深度學習行業概述

目前,“深度學習”這一詞已經變得越來越普及,生活中也是到處都充斥著這一詞匯,同時也有越來越多的人開始想要從事這一行的相關工作,嘗試著接觸、了解這一行業。

當然,關于這一行業的相關介紹很多,也很雜亂,初學者往往很容易被各種各樣的概念搞得很迷惑,即便是計算機從業者有時候也分不清很多涉及到深度學習的很多問題和概念。

因此,本文希望通過一些通俗的語言來系統的介紹下關于深度學習行業的一些相關知識,引導一些初學者,建立一個相對比較完整的全局觀,明白自己到底在學什么,以及學習這些知識,能夠對社會的發展和人們的生活帶來哪些便利。更實際一點來講,對于一個深度學習算法工程師,在以后就業會主要從事哪些工作?

這里我們先了解下深度學習的發展歷程。

對于深度學習的框架,可以最早追溯到1980年福島邦彥提出的新認知機,然而,受限于當時的計算能力,而且缺少有效的訓練手段來解決其中涉及到的梯度消失的問題,因此,這一技術也就在20世紀90年代到21世紀初的時候遇到了寒冬期。而在此期間,SVM (支持向量機)處于統治地位,此外,還有隨機森林、稀疏表示、判別分析等方法。

這個階段的機器學習方法,主要是多種方法的集成,雖然在小規模樣本上具有較好的性能,但是對于大規模樣本卻并沒有表現出太好的優勢。然而,大數據時代的到來,這些傳統的機器學習方法難以滿足數據處理、表達的新時代需求,不管是工業屆還是學術屆,都需要一種處理大規模數據的機器學習方法。

恰恰在這個時候,杰弗里·辛頓(Geoffrey Hinton)和魯斯蘭·薩拉赫丁諾夫(Ruslan Salakhutdinov)提出了一種在前饋神經網絡中進行有效訓練的算法,為深度學習方法帶來了新的研究曙光,并在各個領域得到迅速的發展,尤其是在自然語言處理、計算機視覺和語音識別中,成為各種領先系統的一部分。

接下來,我們看下深度學習發展中的大事件。

  • 2007年,杰弗里·辛頓(Geoffrey Hinton)和魯斯蘭·薩拉赫丁諾夫(Ruslan Salakhutdinov)提出了一種在前饋神經網絡中進行有效訓練的算法;
  • 2009年,在 ICDAR 2009舉辦的連筆手寫識別競賽中,在沒有任何先驗知識的情況下,深度多維長短期記憶神經網絡取得了其中三場比賽的勝利;
  • 2010年,在于爾根·施密德胡伯位于瑞士人工智能實驗室 IDSIA 的研究組中,丹·奇雷尚(Dan Ciresan)和他的同事展示了利用 GPU 直接執行反向傳播算法而忽視梯度消失問題的存在。這一方法在燕樂存等人給出的手寫識別 MNIST 數據集上戰勝了已有的其他方法;
  • 2011年,前饋神經網絡深度學習中最新的方法是交替使用卷積層(Convolutional Layers)和最大值池化層(Max-pooling Layers)并加入單純的分類層作為頂端。訓練過程也無需引入無監督的預訓練。從2011年起,這一方法的 GPU 實現多次贏得了各類模式識別競賽的勝利,包括 IJCNN 2011交通標志識別競賽和其他比賽;
  • 2011年,語音識別領域憑借深度學習取得重大突破;
  • 2012年,AlexNet,一個8層的神經網絡,以超越第二名10個百分點的成績在 ImageNet 競賽中奪冠(圖像分類的 Top5 錯誤率為16.4%),深度學習終迎來包括學術探索與工業應用中的熱潮。不斷提升的層數逐步提升計算機分類視覺的準確率;
  • 2013年,Zfnet,獲得 ILSVRC 冠軍;
  • 2014年,VGGNet、GoogleNet、DeepFace、RCNN,在分類、人臉識別、目標檢測等領域取得優異的性能;
  • 2015年,奪冠的 ResNet 深達152層,以3.57%的錯誤率超越人類視覺的5.1%;
  • 2016年-至今,Fast-Rcnn、Faster-Rcnn、Yolo、SSD 等目標檢測算法突破。
  • 2016年,AlphaGo 擊敗人類。

目前,深度學習技術已經在圖像、語音、自然語言、推薦算法等這些常見的領域中,得到重大突破,并且已經服務于我們的日常生產、生活中。比如:安防領域的人臉識別、ADAS 系統中目標檢測與跟蹤、OCR 識別、語音識別與合成、文本情感分析、主題挖掘等等。

談了這么多深度學習的歷程,那到底什么是深度學習呢?其實,關于深度學習的解釋非常多,總結來說,它是一種具有多層結構的神經網絡算法,屬于機器學習算法一種,而機器學習則是實現 AI 的一種技術手段。換言之,深度學習對于人工智能技術的發展具有重大意義。我們看一下,如下圖所示的深度學習結構:

一個完整的度網絡,主要包括了輸入層、輸出層和中間的隱層,每一層網絡由一個個節點組成,而不同層之間則通過節點和節點之間的線連接起來,而這些點和連接就表達為線性組合關系。當然,目前深度學習網路結構的多樣性,也存在很多類似的非線性組合的網絡層。深度學習就是通過這些節點和節點之間的關系來表達客觀世界中的事物、邏輯關系等等。

關于深度學習的概念,已經足夠火熱,當然我們在認識它的時候,依然需要保持冷靜的頭腦,必須認識到:

  • 深度學習并不是萬能的,尤其對于工程上的實際分析,有時候,單純的使用深度學習的方案并不能有效的解決問題,對于一個實際的項目而言,往往需要考慮到各個方面的問題,一個好的項目,一定是一個無比細致工作的體現。
  • 深度學習不會取代所有其他機器學習算法和數據科學技術,至少還沒有被證明是這樣。
  • 深度學習能夠解決的任務目前主要集中在分類、識別、檢測、回歸等這些可定義的、比較明確的任務上,并沒有擴大到非常復雜的問題,例如“解決世界和平”。
  • 深度學習與大數據的關系

    “大數據”在幾年前剛出現的時候,也存在各種各樣的文章來定義大數據,我也不打算在這個概念上花太多的精力。簡單來講,大數據通常被定義為“超出常用軟件工具捕獲,管理和處理能力”的數據集。它不是具體的方法,甚至不算具體的研究學科,而只是對某一類問題,或需處理的數據的描述。

    通常,大數據的“大”主要體現在 Volume(數據量), Velocity(數據速度)還有 variety(數據類別)。大數據問題(Big-data Problem)可以指那種在這三個“V”上因為大而帶來的挑戰。在之前我們也提到了,傳統的機器學習方法的表達能力有限,在小規模數據上能夠表現較好的性能,但是在大數據背景下則顯得很無力。而深度學習則不同,通過增加節點數目、網絡深度等,它能夠表達更多的數據,針對大數據的背景,它的數據擬合能力遠遠優于傳統的機器學習方法。從這個角度上來看,二者的關系則是相輔相成的,沒有大數據的存在,深度學習的方法也很難得到有效的訓練和優化,而沒有深度學習方法,大數據本身也就沒有了價值。

    深度學習與人工智能的關系

    1956年,在達特茅斯會議(Dartmouth Conferences)上,計算機科學家首次提出了“AI”術語,AI 由此誕生,在隨后的日子里,AI 成為實驗室的“幻想對象”。幾十年過去了,人們對 AI 的看法不斷改變,有時會認為 AI 是預兆,是未來人類文明的關鍵,有時認為它只是技術垃圾,只是一個輕率的概念,野心過大,注定要失敗。直到今天,深度學習技術的發展,才使得 AI 變得越來越可能。

    其實,對于大多數人工智能從業者而言,很難去對其進行一個精確的定義。如果非要對其進行定義的話,我覺得這個概念更加合適“它企圖了解智能的實質,并生產出一種新的能以人類智能相似的方式做出反應的智能體,它必然會經歷從模仿人類智能到超越人類智能的過程。”而深度學習則是機器學習的一種,它屬于實現人工智能的一種技術手段。

    今天,越來越多的人經常會提到“我想學習人工智能”,其實這是一個非常大的概念。從數據存在的形態來看,主要包括了文本、語音、數字圖像,而人工智能需要智能體對這些客觀世界存在信息進行理解、表達,并學會利用這些信息進行決策、分析。這些行為的實現,單純的依靠數據是無法實現的,需要一個框架來完成存儲、表達、理解、分析、決策的過程,而深度學習則是這些任務實現的一種關鍵技術,它能夠有效的完整對大數據的刻畫和理解,特征抽取與表達,對人工智能的發展起到了核心關鍵作用。

    深度學習行業現狀

    深度學習作為一種技術,在行業中的體現,依然要依托于智能化的產品和相應的人工智能企業。根據2016年烏鎮智庫推出《全球人工智能發展報告產業篇》,該報告詳實的描繪出全球人工智能發展的最新趨勢,展示出各國在人工智能領域的競爭態勢。報告指出,在2000-2016年,美國累積新增人工智能企業3033家,占全球累積總數的37.41%。中國在同年段間,人工智能企業數累積增長1477家,占全球人工智能總數的12.91%。雖然在數量上不及美國,但三組數據值得關注:

    美國每年新增人工智能企業數占當年全球新增人工智能企業總數的比例一直在下降,2000年時這一比例為45%,2016年時下降至26%。而中國每年新增人工智能企業數占全球當年新增企業總數的比例保持上升趨勢,2015年達到近17年來的最高值,超過25%。近五年來看,美國新增人工智能企業數占全國人工智能總數的59.38%,中國新增人工智能企業數占全國人工智能總數則為72.71%。在人工智能專利數上,最近五年,中國專利數平均每年增速為43%,美國增數為21.7%。透過這三組數據,可以看到中國近年來在人工智能上發展迅猛。

    下圖,給出了2017年,人工智能公司的排名,當然,此排名可能存在一些不準確的情況,僅供參考。

    從這些人工智能公司來看,目前深度學習的應用領域十分廣泛,涉及到了安防領域、搜索引擎、智能推薦、語音識別、自然語言處理、人機交互、智慧醫療、生物信息識別、機器人、3D 視覺、智慧教育、智能圖像理解與分析等等。

    另外,從政策的角度來看,2016年7月,在國務院印發的《“十三五”國家科技創新規劃》中,人工智能被作為新一代信息技術中的一項列入規劃。2017年3月,“人工智能”首度被列入政府工作報告。2017年,國務院又下發了《新一代人工智能發展規劃的通知》,通知中寫道,“到2020年人工智能總體技術和應用與世界先進水平同步,到2025年人工智能基礎理論實現重大突破,到2030年人工智能理論、技術與應用總體達到世界領先水平”??梢灶A計,中國的人工智能產業將迎來“大躍進”的時代。

    綜上,智能社會的到來,必須依賴于人工智能技術的發展,而深度學習則是目前能夠實現人工智能的最有效的手段之一,甚至在很多領域具備了統治地位。深度學習行業如何?必然大有所為。

    參考資料

    • 重磅 | 國務院印發新一代人工智能發展規劃,到 2030 年達到世界領先水平
    • 2017年人工智能與深度學習——年度大事件
    • 硅谷最有潛力的人工智能公司有哪些:參考一、參考二
    第02課:深度學習在計算機視覺行業中的應用

    伴隨著深度學習技術的發展和普及,“計算機視覺”這一詞匯也受到越來越多的人關注。尤其是深度學習計算芯片技術的發展,使得圖像信息處理的能力大大加強,市場上關于計算機視覺技術的產品也越來越多。那到底什么是計算機視覺?它和深度學習有什么關系?目前有哪些計算機視覺相關的產品需要用到深度學習呢?

    首先,我們解釋下什么是計算機視覺?

    計算機視覺是指用計算機實現人的視覺功能——對客觀世界的三維場景的感知、識別和理解。這里主要有兩類方法:一類是仿生學的方法,參照人類視覺系統的結構原理,建立相應的處理模塊完成類似的功能和工作;另一類是工程的方法,從分析人類視覺過程的功能著手,并不去刻意模擬人類視覺系統內部結構,而僅考慮系統的輸入和輸出,并采用任何現有的可行的手段實現系統功能。[摘自《圖像理解與計算機視覺》]

    舉個例子,最經典也是工業化水平最高的計算機視覺技術就是人臉識別技術。一個簡單的人臉識別系統,包括了人臉數據庫和人臉比對算法,判定兩個人臉是否是同一個人臉,最直接的方法就是計算兩張人臉圖像之間的差異,然而,這樣做往往是很難有效的區分相同人臉和不同人臉的。而計算機視覺技術的存在,就是通過對人臉圖像進行特征表示,也就是抽取人臉圖像中那些共性和差異性的特征,并用來對人臉圖像進行重新表示,在結合度量方法來進行相似性的衡量。其中,表示和度量的過程,我們通常也就是采用機器學習的方法來完成。因此,機器學習技術就是解決計算機視覺任務的一種關鍵性技術。

    那計算機視覺和人工智能是什么關系呢? 它屬于人工智能的一個子領域,主要關注于圖像信號數據的處理、理解和分析。因此,我們在研究計算機視覺技術的時候,會發現計算機視覺的理念在某些方面其實與很多概念有部分重疊,包括:人工智能、數字圖像處理、機器學習、深度學習、模式識別、概率圖模型、科學計算以及一系列的數學計算等。

    還有一個概念經常會和計算機視覺搞混淆,那就是機器視覺。 很多人在開始接觸到這兩個概念的時候會簡單的認為計算機也屬于機器的一種,因此,計算機視覺就是機器視覺的一個方面。當然,這樣認為也不是完全有錯誤,只是會顯得有些局限。計算機視覺研究的是人眼的仿真,而機器視覺則側重于為工業中的制造業提供更多有利于提高產品質量和提高生產效率的支持。我們強調機器視覺、計算機視覺和圖像處理不是同義的。它們其中之一都不是任何其他兩個的子集。計算機視覺是計算機科學的一個分支,而機器視覺是系統工程一個特殊領域。

    深度學習屬于機器學習的一種,對于大數據背景下的計算機視覺任務,尤其在檢測、分類、識別等任務上,都表現出難以匹配的優勢。尤其,目前越來越多的深度學習芯片的生產和制造,也確保了深度學習技術,在計算機視覺任務中的核心地位。接下來,我們看一下深度學習在計算機視覺任務中有哪些重要的應用領域。

    1.深度學習在安防領域的重要應用。

    利用計算機視覺技術來完成安防領域的解決方案,這是大多數視覺公司都會選擇切入的一個領域,涉及到的企業包括??低?、商湯科技、依圖科技、Face++,甚至互聯網公司百度、騰訊、阿里巴巴等。其中,一個重要的應用就是人臉識別技術,自2014年的 DeepFace 開始至今,深度學習的方法在該領域幾乎達到壟斷地位。而人臉識別技術,在安檢、反恐等安防領域有著重要的意義。當然,除去人臉識別,近幾年也開始研究從行人的角度出發的 ReID 技術,利用深度學習來進行人的檢測、并刻畫目標的特征,為后續的跟蹤、異常行為分析提供有效的支撐。

    2.深度學習在無人駕駛領域的重要應用。

    在無人駕駛領域,考慮到激光、雷達等傳感器價格昂貴等特點,這使得基于計算機視覺的解決方案大受追捧。而對于無人駕駛的攝像機采集到的視頻數據,需要機器對其中的內容進行理解、分析并用于后續的決策控制,比如:前車碰撞預警等。因此,需要一系列的計算視覺算法來完成其中涉及的任務,具體包括了目標檢測和識別、多目標跟蹤、車道線檢測分離等。而基于深度學習的目標檢測和識別、基于深度學習的目標分割等方法,同樣相對于傳統的方法有著明顯的優勢。并且目前越來越多的深度學習芯片,尤其關注無人駕駛領域的問題,對相關算法的支持也越來越好,這也使得深度學習技術對無人駕駛技術的發展起到了重要的推動作用。目前國內對問題研究的機構同樣非常多,包括了 Google、百度、??低?、Mobileye 等,可以說,深度學習是無人駕駛領域的一種重要的基礎算法。

    3.深度學習在智能家居領域的重要應用。

    傳統的智能家居產品更多的是采用手機端結合藍牙或者 WiFi 等通信手段來完成對家居的控制和使用。雖然此類解決方案能夠實現一定程度上的家居智能,但是我們會依然覺得,智能化的程度依然不夠。而深度學習的方法,則對于智能家居的發展起到了重要的作用。除了語音識別、語音合成以外,另一個重要的點就是利用視覺技術進行人機交互,比如:手勢識別等。

    4.深度學習在智慧教育領域的應用。

    在教育領域,目前比較火熱的產品就是拍照試題等 App,通過手機端輸入一張圖片后,App 利用智能算法,來對獲取到的區域的內容進行理解和分析,同樣涉及到了深度學習的方法,比如:題目的檢測、目標區域文字檢測與識別等等。同樣,深度學習的方法對于類問題的解決,依然有著重大的性能優勢。

    5.深度學習在 OCR 領域的重要應用。

    除了教育會涉及到文字檢測與識別,在一些諸如:簡歷的識別、文檔的識別、身份證識別等等領域,同樣會存在一些關于圖片中文字的內容理解和分析的部分,而對于這也任務而言,同樣深度學習是一種更優的選擇。此類問題,其實可以直接概括為自然場景下的文本檢測和識別任務。

    6.深度學習在圖片檢索領域的重要應用。

    以圖搜索圖的目的是為了找到和原圖相似的圖片,它不僅會涉及到圖像檢索引擎的建立,同樣也依賴于一個較好的圖像特征抽取的方法。而深度學習依然成為了一種較為有效的技術手段和方法,并在眾多的圖像檢測問題中,起到了重要的作用。

    7.深度學習在醫療影像數據中的應用。

    深度學習在醫療健康領域的機遇主要有七大方向:一是提供臨床診斷輔助系統等醫療服務,應用于早期篩查、診斷、康復、手術風險評估場景;二是醫療機構的信息化,通過數據分析,幫助醫療機構提升運營效率;三是進行醫學影像識別,幫助醫生更快更準地讀取病人的影像所見;四是利用醫療大數據,助力醫療機構大數據可視化及數據價值提升;五是在藥企研發領域,解決藥品研發周期長、成本高的問題;六是健康管理服務,通過包括可穿戴設備在內的手段,監測用戶個人健康數據,預測和管控疾病風險;七是在基因測序領域,將深度學習用于分析基因數據,推進精準醫療。而醫學影像是醫生判斷疾病的一個重要手段,放射科、病理科等擅長讀圖的醫生增長率和診斷效率急需提升,成為很多醫療機構的心病。目前,在人類醫學專家的幫助下,國內外研究團隊已經在心血管、腫瘤、神內、五官等領域建立了多個精準深度學習醫學輔助診斷模型,取得了良好的進展。其中,依圖科技則在深度學習醫療領域取得了不錯的成績。

    8.深度學習與美顏相機。

    對于美顏相機,大家一定都不陌生。在美顏相機中會有哪些地方涉及到深度學習的算法呢?其中最重要的就是人臉的關鍵點定位。只有找到關鍵點,才能有效的進行一些眼睛的修飾等操作,同樣,相比于其他方法,基于深度學習的方法能夠實現更優的性能。

    9.深度學習在 Fashion 領域的探索。

    目前,阿里巴巴攜手香港理工舉辦了 FashionAI 的比賽,旨在探索如果通過機器學習的方法來完成關于流行趨勢的分析和預測。而深度學習無疑會成為眾多方法中的寵兒。其中涉及到了服裝關鍵點檢測和定位,服裝分類等等問題。

    10.深度學習芯片。

    對于大多是計算機視覺從業者而言,往往會更多的側重于深度學習算法而忽略了深度學習芯片。大家也都知道,深度學習算法的火爆,必然依托于深度學習芯片的發展。尤其最近的中興事件暴露出的國產芯片的一系列問題,也使得越來越多的人開始關注芯片行業。而一項深度學習工程,其實可以分為訓練和推斷兩個環節,對于訓練環節大多采用 GPU 來完成,而實際在使用的時候,考慮到功耗等問題,推斷芯片的研發也變得尤為重要,除了 CPU 和 GPU 以外,FPGA、ASIC 等同樣發揮著重要的作用。對于智能社會而言,深度學習芯片將會起到重要的基石作用。

    當然,除上述領域外,深度學習在其他的很多領域都有著重要的應用,比如:車牌識別、圖像質量恢復、自動圖像描述等等。總之,深度學習技術對于眾多的計算機視覺任務而言,已經逐步占據了統治地位,作為一個計算機視覺從業者,它也成為了大家的基本技能。至于原因,大家可以看一下《為什么深度學習幾乎成了計算機視覺研究的標配?》這篇文章,這里不再贅述。

    第03課:深度學習在語音技術領域的應用
    第04課:深度學習在自然語言處理行業中的應用
    第05課:如何入行深度學習
    第06課:怎樣選擇一個合適自己的深度學習研究方向?
    第07課:針對自己的研究方向,如何展開調研、學習和實驗?
    第08課:動手實戰之基于 Caffe 的深度學習環境了解和搭建
    第09課:動手實戰之基于 Caffe 的分類識別任務
    第10課:動手實戰之基于 TensorFlow 的深度學習環境了解和搭建
    第11課:動手實戰之基于 TensorFlow 的分類識別任務

    閱讀全文: http://gitbook.cn/gitchat/column/5afb8f050fe11d2f8ffc79a8

    總結

    以上是生活随笔為你收集整理的深度学习新手入门课的全部內容,希望文章能夠幫你解決所遇到的問題。

    如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。