神经网络应用场景
神經網絡應用場景
(1)語音識別
自2006 年Hinton等提出深度學習的概念,神經網絡再次回到人們的視野中,語音識別是第1個取得突破的領域。傳統語音識別的方法主要利用聲學研究中的低層特征,利用高斯混合模型進行特征提取,并用隱馬爾可夫模型進行序列轉移狀態建模,并據此識別語音所對應的文字。歷經數十年的發展,傳統語音識別任務的錯誤率改進卻停滯不前,停留在25% 左右,難以達到實用水平。
2013 年,Hinton 與微軟公司合作,利用神經網絡改進語音識別中的特征提取方法,將錯誤率降低至17.7%,并在大會現場展示了同聲傳譯產品,效果驚人。此后,研究者們又陸續采用回復式神經網絡改進語音識別的預測和識別,將錯誤率降至7. 9%。這一系列的成功使得語音識別實用化成為可能,激發了大量的商業應用。至2016 年,同聲速記產品準確率已經突破95%,超過人類速記員的水平。
(2)計算機視覺
計算機視覺一直以來都是一個熱門的研究領域。傳統的研究內容主要集中在根據圖像特點人工設計不同的特征,如邊緣特征、顏色特征、尺度不變特征等。利用這些特征完成特定的計算機視覺任務,如圖像分類、圖像聚類、圖像分割、目標檢測、目標追蹤等。
傳統的圖像特征依賴于人工設計,一般為比較直觀的初級特征,抽象程度較低,表達能力較弱。神經網絡方法利用大量的圖像數據,完全自動地學習特征。在深度神經網絡中,各層特征形成了邊緣、線條、輪廓、形狀、對象等的層次劃分,抽象程度逐漸提高。
2012 年,在大規模圖像數據集ImageNet 上,神經網絡方法取得了重大突破,準確率達到84.7%。在LFW 人臉識別評測權威數據庫上,基于深度神經網絡的人臉識別方法DeepID 在2014、2015 年分別達到準確率99.15% 和99.53%,遠超人類識別的準確率97.53%。
(3)醫學醫療
醫學醫療因為其應用的特殊性一直是科學研究的前沿,既要快速的推進,又要求格外嚴謹。如何利用好大數據解決醫學和醫療中的問題,進一步改善醫療條件,提高診治水平,是值得人們關注和研究的。隨著神經網絡各類應用的成功和成熟,在醫學和醫療領域也出現了新的突破。
2016 年1 月,美國Enlitic 公司開發的基于深度神經網絡的癌癥檢測系統,適用于從X 光、CT 掃描、超聲波檢查、MRI 等的圖像中發現惡性腫瘤,其中,肺癌檢出率超過放射技師水平。
同年,Google 利用醫院信息數據倉庫的醫療電子信息存檔中的臨床記錄、診斷信息、用藥信息、生化檢測、病案統計等數據,構建病人原始信息數據庫,包括病人的用藥信息、診斷信息、診療過程、生化檢測等信息,采用基于神經網絡的無監督深度特征學習方法學習病人的深度特征表達,并借助這一表達進行自動臨床決策,其準確率超過92%。這些成果為實現基于醫療大數據的精準醫療打下了扎實基礎。
(4)智能博弈
圍棋被譽為“最復雜也是最美的游戲”,自從國際象棋世界冠軍被深藍電腦擊敗后,圍棋也成為了“人類智慧最后堡壘”。2016 年,Google 旗下Deep-Mind 團隊的AlphaGo對戰人類圍棋世界冠軍李世乭九段,不但引起圍棋界和人工智能界的熱切注視,還吸引了眾多群眾的關注。
最終AlphaGo 以4:1戰勝李世乭九段,其背后成功的秘訣正是采用了神經網絡與增強學習相結合,借助神經網絡強大的特征提取能力捕捉人類難以分析的高層特征; 再利用增強學習,采用自我對弈的方法產生大量的數據,從自己的嘗試中學習到超越有限棋譜的技巧,成功掌握了致勝技巧。
這一結果在人工智能界非常振奮人心,因為它提出了一種自發學習到超越現有數據的學習方法,標志了增強學習與神經網絡的成功結合,也是“大數據+ 神經網絡”的成功的應用。
總結
- 上一篇: Pytorch install
- 下一篇: SQL SERVER 判断是否存在并删除