[深度学习] Attention机制,一文搞懂从实例到原理
一 人類的視覺注意力
擴展閱讀:
Attention and Augmented Recurrent Neural Networks【譯文】
不用看數學公式!圖解谷歌神經機器翻譯核心部分:注意力機制
Attn: Illustrated Attention
Deep Reading | 從0到1再讀注意力機制,此文必收藏!
從注意力模型的命名方式看,很明顯其借鑒了人類的注意力機制,因此,我們首先簡單介紹人類視覺的選擇性注意力機制。
圖1 人類的視覺注意力
視覺注意力機制是人類視覺所特有的大腦信號處理機制。人類視覺通過快速掃描全局圖像,獲得需要重點關注的目標區域,也就是一般所說的注意力焦點,而后對這一區域投入更多注意力資源,以獲取更多所需要關注目標的細節信息,而抑制其他無用信息。
這是人類利用有限的注意力資源從大量信息中快速篩選出高價值信息的手段,是人類在長期進化中形成的一種生存機制,人類視覺注意力機制極大地提高了視覺信息處理的效率與準確性。
圖1形象化展示了人類在看到一副圖像時是如何高效分配有限的注意力資源的,其中紅色區域表明視覺系統更關注的目標,很明顯對于圖1所示的場景,人們會把注意力更多投入到人的臉部,文本的標題以及文章首句等位置。
深度學習中的注意力機制從本質上講和人類的選擇性視覺注意力機制類似,核心目標也是從眾多信息中選擇出對當前任務目標更關鍵的信息。
?
Attention機制的應用
前文有述,Attention機制在深度學習的各種應用領域都有廣泛的使用場景。上文在介紹過程中我們主要以自然語言處理中的機器翻譯任務作為例子,下面分別再從圖像處理領域和語音識別選擇典型應用實例來對其應用做簡單說明。
????????????????????? 圖13 圖片-描述任務的Encoder-Decoder框架
圖片描述(Image-Caption)是一種典型的圖文結合的深度學習應用,輸入一張圖片,人工智能系統輸出一句描述句子,語義等價地描述圖片所示內容。很明顯這種應用場景也可以使用Encoder-Decoder框架來解決任務目標,此時Encoder輸入部分是一張圖片,一般會用CNN來對圖片進行特征抽取,Decoder部分使用RNN或者LSTM來輸出自然語言句子(參考圖13)。
此時如果加入Attention機制能夠明顯改善系統輸出效果,Attention模型在這里起到了類似人類視覺選擇性注意的機制,在輸出某個實體單詞的時候會將注意力焦點聚焦在圖片中相應的區域上。圖14給出了根據給定圖片生成句子“A person is standing on a beach with a surfboard.”過程時每個單詞對應圖片中的注意力聚焦區域。
??????????????????? 圖14 圖片生成句子中每個單詞時的注意力聚焦區域
圖15給出了另外四個例子形象地展示了這種過程,每個例子上方左側是輸入的原圖,下方句子是人工智能系統自動產生的描述語句,上方右側圖展示了當AI系統產生語句中劃橫線單詞的時候,對應圖片中聚焦的位置區域。比如當輸出單詞dog的時候,AI系統會將注意力更多地分配給圖片中小狗對應的位置。
??????????????? 圖15 圖像描述任務中Attention機制的聚焦作用
???????????????????? 圖16 語音識別中音頻序列和輸出字符之間的Attention
語音識別的任務目標是將語音流信號轉換成文字,所以也是Encoder-Decoder的典型應用場景。Encoder部分的Source輸入是語音流信號,Decoder部分輸出語音對應的字符串流。
圖16可視化地展示了在Encoder-Decoder框架中加入Attention機制后,當用戶用語音說句子 how much would a woodchuck chuck 時,輸入部分的聲音特征信號和輸出字符之間的注意力分配概率分布情況,顏色越深代表分配到的注意力概率越高。從圖中可以看出,在這個場景下,Attention機制起到了將輸出字符和輸入語音信號進行對齊的功能。
上述內容僅僅選取了不同AI領域的幾個典型Attention機制應用實例,Encoder-Decoder加Attention架構由于其卓越的實際效果,目前在深度學習領域里得到了廣泛的使用,了解并熟練使用這一架構對于解決實際問題會有極大幫助。
?
原文:干貨 | 關于深度學習中的注意力機制,這篇文章從實例到原理都幫你參透
https://zhuanlan.zhihu.com/p/37601161
?
總結
以上是生活随笔為你收集整理的[深度学习] Attention机制,一文搞懂从实例到原理的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 吴京:拍《流浪地球》之前对科幻一无所知
- 下一篇: [深度学习] 分布式Pytorch介绍(