日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 人工智能 > ChatGpt >内容正文

ChatGpt

AI 从业者都会用到的 10 个深度学习方法

發布時間:2024/8/23 ChatGpt 40 豆豆
生活随笔 收集整理的這篇文章主要介紹了 AI 从业者都会用到的 10 个深度学习方法 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

過去十年里,人們對機器學習的興趣經歷了爆炸式的整長。我們幾乎每天都可以在計算機程序、行業會議和媒體上看到機器學習的身影。很多關于機器學習的討論都混淆了“機器學習能做什么”和“人類希望機器學習能做什么”。從根本上講,機器學習是運用算法從原始數據中提取信息,并用某種類型的模型進行表示,然后使用該模型對一些尚未用模型表示的其他數據來進行推斷。

神經網絡就是機器學習各類模型中的其中一類,并且已經存在了至少50年。神經網絡的基本單位是節點,它的想法大致來源于哺乳動物大腦中的生物神經元。生物大腦中的神經元節點之間的鏈接是隨著時間推移不斷演化的,而神經網絡中的神經元節點鏈接也借鑒了這一點,會不斷演化(通過“訓練”的方式)。

神經網絡中很多重要框架的建立和改進都完成于二十世紀八十年代中期和九十年代初期。然而,要想獲得較好結果需要大量的時間和數據,由于當時計算機的能力有限,神經網絡的發展受到了一定的阻礙,人們的關注度也隨之下降。二十一世紀初期,計算機的運算能力呈指數級增長,業界也見證了計算機技術發展的“寒武紀爆炸”——這在之前都是無法想象的。深度學習以一個競爭者的姿態出現,在計算能力爆炸式增長的十年里脫穎而出,并且贏得了許多重要的機器學習競賽。其熱度在2017年仍然不減。如今,在機器學習的出現的地方我們都能看到深度學習的身影。

為了跟上時代的潮流,我參加了 Udacity 的“深度學習”課程。這是一個很好的入門課程,包括深度學習的動機和在 TensorFlow 中針對復雜的和/或大規模數據集進行學習的智能系統的設計。 對于課程作業,我使用和開發了用于圖像識別的卷積神經網絡,帶有嵌入的自然語言處理以及運用遞歸神經網絡/長期短期記憶的基于字符的文本生成程序。所有 Jupyter Notebook 的代碼都在我的?GitHub。

下圖是課程作業的一個結果,詞向量的 t-SNE 投影,通過相似性進行聚類。

最近,我開始閱讀關于深度學習的學術論文。根據我的個人研究,以下文章對這個領域的發展產生了巨大的影響:

  • NYU 1998 年的文章《基于梯度學習的文檔識別》(Gradient-Based Learning Applied to Document Recognition)?介紹了卷積神經網絡在機器學習中的應用。

  • Toronto 2009年的文章《深度波茲曼機器》(Deep Boltzmann Machines)?針對波茲曼機提出了一種新的學習算法,其中包含許多隱藏層。

  • Stanford 和 Google 2012年聯合發表的文章《使用大規模非監督學習構建高層特征》(Building High-Level Features Using Large-Scale Unsupervised Learning)?解決了僅利用未標記的數據構建高級、特定類的特征檢測器的問題。

  • Berkeley 2013年的文章《用于一般視覺識別的深層卷積激活特征》(DeCAF——A Deep Convolutional Activation Feature for Generic Visual Recognition)?發布了名為 DeCAF 的算法,這是深度卷積激活特征的一個開源實現,使用相關的網絡參數,視覺研究人員能夠利用一系列視覺概念學習范例進行深入實驗。

  • DeepMind 2016年的文章《用深度強化學習玩Atari》(Playing Atari with Deep Reinforcement Learning)?提出了第一個可以成功地通過強化學習從高維感官輸入中直接學習控制策略的深度學習模型。

通過研究和學習,我學到了大量關于深度學習的相關知識。在這里,我想分享人工智能工程師 10 個用于解決機器學習問題的強大的深度學習方法。但是,我們首先需要定義什么是深度學習。

如何定義深度學習是很多人面臨的一個挑戰,因為它的形式在過去的十年中已經慢慢地發生了改變。下圖直觀地展示了人工智能,機器學習和深度學習之間的關系。

人工智能領域廣泛,存在時間較長。深度學習是機器學習領域的一個子集,而機器學習是人工智能領域的一個子集。一般將深度學習網絡與“典型”前饋多層網絡從如下方面進行區分:

  • 深度學習網絡具有比前饋網絡更多的神經元

  • 深度學習網絡連接層之間的方式更復雜

  • 深度學習網絡需要有像“寒武紀大爆發”式的計算能力進行訓練

  • 深度學習網絡能夠自動提取特征

上文提到的“更多的神經元”是指近年來神經元的數量不斷增加,就可以用更復雜的模型來表示。層也從多層網絡中每一層完全連接,發展到卷積神經網絡中神經元片段的局部連接,以及與遞歸神經網絡中的同一神經元的循環連接(與前一層的連接除外)。

因此,深度學習可以被定義為以下四個基本網絡框架中具有大量參數和層數的神經網絡:

  • 無監督預訓練網絡

  • 卷積神經網絡

  • 循環神經網絡

  • 遞歸神經網絡

在這篇文章中,我主要討論三個框架:

  • 卷積神經網絡(Convolutional Neural Network基本上就是用共享權重在空間中進行擴展的標準神經網絡。卷積神經網絡主要是通過內部卷積來識別圖片,內部卷積可以看到圖像上識別對象的邊緣。

  • 循環神經網絡(Recurrent Neural Network基本上就是在時間上進行擴展的標準神經網絡,它提取進入下一時間步的邊沿,而不是在同一時間進入下一層。循環神經網絡主要是為了識別序列,例如語音信號或者文本。其內部的循環意味著網絡中存在短期記憶。

  • 遞歸神經網絡(Recursive Neural Network更類似于分層網絡,其中輸入序列沒有真正的時間面,但是必須以樹狀方式分層處理。以下10種方法均可應用于這些框架。



  • 1、反向傳播

    反向傳播是一種計算函數偏導數(或梯度)的簡單方法,它的形式是函數組合(如神經網絡)。在使用基于梯度的方法求解最優化問題(梯度下降只是其中之一)時,需要在每次迭代中計算函數梯度。

    對于一個神經網絡,其目標函數是組合形式。那么應該如何計算梯度呢?有2種常規方法:(i)微分解析法。函數形式已知的情況下,只需要用鏈式法則(基礎微積分)計算導數。(ii)有限差分法近似微分。這種方法運算量很大,因為函數評估的數量級是 O(N),其中 N 是參數的個數。與微分解析法相比,這種方法運算量更大,但是在調試時,通常會使用有限差分驗證反向傳播的效果。

    2、隨機梯度下降

    梯度下降的一個直觀理解就是想象一條源自山頂的河流。這條河流會沿著山勢的方向流向山麓的最低點,而這也正是梯度下降法的目標。

    我們所期望的最理想的情況就是河流在到達最終目的地(最低點)之前不會停下。在機器學習中,這等價于我們已經找到了從初始點(山頂)開始行走的全局最小值(或最優值)。然而,可能由于地形原因,河流的路徑中會出現很多坑洼,而這會使得河流停滯不前。在機器學習術語中,這種坑洼稱為局部最優解,而這不是我們想要的結果。有很多方法可以解決局部最優問題(這里不再討論)。

    因此,由于地形(即函數性質)的限制,梯度下降算法很容易卡在局部最小值。但是,如果能夠找到一個特殊的山地形狀(比如碗狀,術語稱作凸函數),那么算法總是能夠找到最優點。在進行最優化時,遇到這些特殊的地形(凸函數)自然是最好的。另外,山頂初始位置(即函數的初始值)不同,最終到達山底的路徑也完全不同。同樣,不同的流速(即梯度下降算法的學習速率或步長)也會導致到達目的地的方式有差異。是否會陷入或避開一個坑洼(局部最小值),都會受到這兩個因素的影響。

    3、學習率衰減

    調整隨機梯度下降優化算法的學習速率可以提升性能并減少訓練時間。這被稱作學習率退火或自適應學習率。訓練中最簡單也最常用的學習率自適應方法就是逐漸降低學習率。在訓練初期使用較大的學習率,可以對學習率進行大幅調整;在訓練后期,降低學習率,以一個較小的速率更新權重。這種方法在早期可以快速學習獲得較好的權重,并在后期對權重進行微調。

    兩個流行而簡單的學習率衰減方法如下:

    • 線性地逐步降低學習率

    • 在特定時點大幅降低學習率


    4、Dropout

    擁有大量參數的深度神經網絡是非常強大的機器學習系統。然而,在這樣的網絡中,過擬合是一個很嚴重的問題。而且大型網絡的運行速度很慢,這就使得在測試階段通過結合多個不同的大型神經網絡的預測來解決過擬合問題是很困難的。Dropout 方法可以解決這個問題。

    其主要思想是,在訓練過程中隨機地從神經網絡中刪除單元(以及相應的連接),這樣可以防止單元間的過度適應。訓練過程中,在指數級不同“稀疏度”的網絡中剔除樣本。在測試階段,很容易通過使用具有較小權重的單解開網絡(single untwined network),將這些稀疏網絡的預測結果求平均來進行近似。這能有效地避免過擬合,并且相對于其他正則化方法能得到更大的性能提升。Dropout 技術已經被證明在計算機視覺、語音識別、文本分類和計算生物學等領域的有監督學習任務中能提升神經網絡的性能,并在多個基準數據集中達到最優秀的效果。

    5、最大池

    最大池是一種基于樣本的離散化方法。目標是對輸入表征(圖像、隱藏層輸出矩陣等)進行下采樣,降低維度并且允許對子區域中的特征進行假設。

    通過提供表征的抽象形式,這種方法可以在某種程度上解決過擬合問題。同樣,它也通過減少學習參數的數目以及提供基本的內部表征轉換不變性來減少計算量。最大池是通過將最大過濾器應用于通常不重疊的初始表征子區域來完成的。

    6、批量標準化

    當然,包括深度網絡在內的神經網絡需要仔細調整權重初始值和學習參數。批量標準化能夠使這個過程更加簡單。

    權重問題:

    • 無論怎么設置權重初始值,比如隨機或按經驗選擇,初始權重和學習后的權重差別都很大。考慮一小批權重,在最初時,對于所需的特征激活可能會有很多異常值。

    • 深度神經網絡本身就具有病態性,即初始層的微小變化就會導致后一層的巨大變化。

    在反向傳播過程中,這些現象會導致梯度的偏移,這就意味著在學習權重以產生所需要的輸出之前,梯度必須補償異常值。而這將導致需要額外的時間才能收斂。

    批量標準化將這些梯度從異常值調整為正常值,并在小批量范圍內(通過標準化)使其向共同的目標收斂。

    學習率問題:通常來說,學習率都比較小,這樣只有一小部分的梯度用來校正權重,因為異常激活的梯度不應該影響已經學習好的權重。通過批量標準化,這些異常激活的可能性會被降低,就可以使用更大的學習率加速學習過程。

    7、長短期記憶

    長短期記憶網絡(LSTM)和其他遞歸神經網絡中的神經元有以下三個不同點:

    • 它可以決定何時讓輸入進入神經元

    • 它可以決定何時記住上一個時間步中計算的內容

    • 它可以決定何時讓輸出傳遞到下一個時間戳

    LSTM的強大之處在于它可以只基于當前的輸入就決定上述所有。請看下方的圖表:

    當前時間戳的輸入信號 x(t) 決定了上述三點。輸入門(input gate)決定了第一點,遺忘門(forget gate)決定了第二點,輸出門(output gate)決定了第三點。只依賴輸入就可以完成這三項決定。這是受到大腦工作機制的啟發,大腦可以基于輸入來處理突然的上下文語境切換。

    8、Skip-gram

    詞嵌入模型的目的是針對每個詞學習一個高維密集表征,其中嵌入向量之間的相似性顯示了相應詞語之間語義或句法的相似性。Skip-gram 是一種學習詞嵌入算法的模型。

    skip-gram 模型(包括很多其它詞嵌入模型)背后的主要思想是:如果兩個詞匯項有相似的上下文,則它們是相似的。

    換句話說,假設有一個句子,比如“cats are mammals”,如果用“dogs”替換“cats”,該句子仍然是有意義的。因此在這個例子中,“dogs”和“cats”有相似的上下文(即“are mammals”)。

    基于以上假設,我們可以考慮一個上下文窗口(包含 K 個連續項)。然后跳過其中一個詞,試著學習一個可以得到除了跳過的這個詞以外所有詞項,并且可以預測跳過的詞的神經網絡。因此,如果兩個詞在一個大語料庫中多次具有相似的上下文,那么這些詞的嵌入向量將會是相似的。

    9、連續詞袋模型

    在自然語言處理中,我們希望將文檔中的每一個單詞表示為一個數值向量,使得出現在相似上下文中的單詞具有相似或相近的向量表示。在連續詞袋模型中,我們的目標是利用一個特定單詞的上下文,預測該詞。

    ?

    首先在一個大的語料庫中抽取大量的句子,每看到一個單詞,同時抽取它的上下文。然后我們將上下文單詞輸入到一個神經網絡,并預測在這個上下文中心的單詞。

    當我們有成千上萬個這樣的上下文詞匯和中心詞時,我們就得到了一個神經網絡數據集的實例。然后訓練這個神經網絡,在經過編碼的隱藏層的最終輸出中,我們得到了特定單詞的嵌入式表達。當我們對大量的句子進行訓練時也能發現,類似上下文中的單詞都可以得到相似的向量。

    10、遷移學習

    我們來考慮一下卷積神經網絡是如何處理圖像的。假設有一張圖像,對其應用卷積,并得到像素的組合作為輸出。假設這些輸出是邊緣,再次應用卷積,那么現在的輸出將是邊緣或線的組合。然后再次應用卷積,此時的輸出將是線的組合,以此類推。可以把它想象成是在每一層尋找一個特定的模式。神經網絡的最后一層通常會變得非常特別。如果基于 ImageNet 進行訓練,那么神經網絡的最后一層或許就是在尋找兒童、狗或者飛機之類的完整圖像。再往后倒退幾層,可能會看到神經網絡在尋找眼睛、耳朵、嘴巴或者輪子等組成部分。

    深度卷積神經網絡中的每一層逐步建立起越來越高層次的特征表征,最后幾層通常是專門針對輸入數據。另一方面,前面的層則更為通用,主要用來在一大類圖片中有找到許多簡單的模式。

    遷移學習就是在一個數據集上訓練卷積神經網絡時,去掉最后一層,在不同的數據集上重新訓練模型的最后一層。直觀來講,就是重新訓練模型以識別不同的高級特征。因此,訓練時間會減少很多,所以在沒有足夠的數據或者需要太多的資源時,遷移學習是一個很有用的工具。

    本文只是簡單地對這些方法進行了概述,若想深入理解,建議繼續閱讀以下文章:

    • Andrew Beam?的?“Deep Learning 101”

    • Andrey Kurenkov?的?“A Brief History of Neural Nets and Deep Learning”

    • Adit Deshpande 的??“A Beginner’s Guide to Understanding Convolutional Neural Networks”

    • Chris Olah:?“Understanding LSTM Networks”

    • Algobean:?“Artificial Neural Networks”

    • Andrej Karpathy:?“The Unreasonable Effectiveness of Recurrent Neural Networks”

    深度學習是非常注重技術實踐的。本文對每個新想法都沒有太多具體的解釋。大多數新想法的提出都會附帶實驗結果以證明它們的可行性。學習深度學習就像玩樂高,玩好樂高和掌握其他藝術一樣具有挑戰性,但是入門就相對容易很多的。

    源:伯樂在線

    編輯?∑ Gemini


    微信公眾號“算法數學之美”,由算法與數學之美團隊打造的另一個公眾號,歡迎大家掃碼關注!


    更多精彩:

    ?如何向5歲小孩解釋什么是支持向量機(SVM)?

    ?自然底數e的意義是什么?

    ?費馬大定理,集驚險與武俠于一體

    ?簡單的解釋,讓你秒懂“最優化” 問題

    ?一分鐘看懂一維空間到十維空間

    ??本科、碩士和博士到底有什么區別?

    ?小波變換通俗解釋

    ?微積分必背公式

    ?影響計算機算法世界的十位大師

    ?數據挖掘之七種常用的方法



    算法數學之美微信公眾號歡迎賜稿

    稿件涉及數學、物理、算法、計算機、編程等相關領域,經采用我們將奉上稿酬。

    投稿郵箱:math_alg@163.com


    總結

    以上是生活随笔為你收集整理的AI 从业者都会用到的 10 个深度学习方法的全部內容,希望文章能夠幫你解決所遇到的問題。

    如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。

    主站蜘蛛池模板: 激情综合五月网 | 中文字幕久久一区 | 一区二区久久 | 日韩网红少妇无码视频香港 | 老女人一区 | 肉大捧一进一出免费视频 | 日韩中文电影 | 色欲av永久无码精品无码蜜桃 | 亚洲精品欧美在线 | 性开放淫合集 | 香港三日本8a三级少妇三级99 | 日韩国产在线一区 | 性久久久 | 人成免费 | 欧美a级在线观看 | 人人看人人干 | 人人干人人爽 | 久草a在线 | www射| 国语对白精彩对话 | 大乳女喂男人吃奶 | 色老大视频 | 亚洲综合色在线 | 国产高清中文字幕 | 欧美黄色免费看 | a免费看| 欧美18一19性内谢 | 黄色在线观看网站 | 精品国产一区二区三区久久久 | 五月婷婷综合色 | 国产成人精品免高潮费视频 | 欧美一级专区免费大片 | 九九热在线精品 | 4438成人网 | 欧美大片aaa | 懂色av一区二区三区蜜臀 | 成人午夜影视 | 男女洗澡互摸私密部位视频 | 夜色在线影院 | 激情六月婷婷 | 免费成人毛片 | 欧美精品在线视频 | 日韩精品在线视频免费观看 | 青青偷拍视频 | 国产黄色免费网站 | av特黄| 一区二区三区四区视频在线观看 | 在线免费观看欧美大片 | 国产欧美中文字幕 | 日韩成人短视频 | 亚洲在线看片 | 亚洲一区二区三区黄色 | 狠狠爱亚洲 | 国产淫视 | 日韩福利在线观看 | 可以在线观看av的网站 | 国产精品二区视频 | 中文字幕久久久久久久 | 日韩精品一区二区视频 | www.国产欧美| 国产精品高清在线 | 艳妇臀荡乳欲伦交换在线看 | 欧美一区二不卡视频 | 91精品国产欧美一区二区成人 | 成人无码精品1区2区3区免费看 | 欧美r级在线 | 日韩久久精品一区二区 | 成人涩涩软件 | 99精品视频在线免费观看 | 天堂a在线| 国产成人三级在线观看视频 | 亚洲精华液一区二区 | 婷婷激情小说 | 男女性高潮免费网站 | free女性xx性老大太 | 日本亚洲精品 | 91美女诱惑| 求av网址 | 欧美又粗又长 | 亚洲综合免费视频 | 自拍三区 | 亚洲国产图片 | 亚洲天堂手机在线观看 | 国产香蕉在线视频 | 久久香蕉精品 | 九色91在线 | 免费看黄色的视频 | 国产成人精品网 | 91色视频在线 | 免费爱爱网址 | 成人综合网址 | 特级西西人体4444xxxx | 女性裸体不遮胸图片 | 激情综合网五月 | zzjj国产精品一区二区 | 黄色1级毛片| 热99精品| 国产精品二区一区二区aⅴ污介绍 | 五月激情片 |