监督学习和无监督学习_机器学习的要素是什么? 有监督学习和无监督学习两大类...
如前所述,機器學習是AI的一個子集,通常分為兩大類:有監督學習和無監督學習。
監督學習
教學AI系統的常用技術是通過使用大量帶標簽的示例來訓練它們。這些機器學習系統被饋入大量數據,這些數據已被注釋以突出顯示感興趣的功能。這些照片可能被標記為照片以表明它們是否包含狗或帶有腳注的書面句子,以表明“低音”一詞與音樂還是魚類有關。經過培訓后,系統便可以將這些標簽罐應用于新數據,例如應用于剛剛上傳的照片中的狗。
人工智能
通過示例教學機器的過程稱為監督學習,并且標記這些示例的角色通常由 在線工作人員執行,并通過諸如Amazon Mechanical Turk之類的平臺雇用。
訓練這些系統通常需要大量的數據,有些系統需要搜尋數百萬個示例來學習如何有效地執行任務-盡管在大數據和廣泛的數據挖掘時代,這越來越有可能。訓練數據集龐大且規模不斷擴大 Google的Open Images Dataset擁有約900萬張圖像,而其帶有標簽的視頻存儲庫YouTube-8M鏈接了700萬個帶有標簽的視頻。ImageNet是這類早期數據庫之一,擁有超過1400萬張分類圖像。該文件經過兩年的編寫,由近50,000人(其中大部分是通過Amazon Mechanical Turk招募的)匯集在一起??的,他們檢查,分類并標記了將近10億張候選圖片。
人工智能
從長遠來看,與龐大的計算能力相比,訪問具有大量標記數據集的重要性可能不那么重要。近年來,Generative Adversarial Networks(GAN)展示了向機器學習系統饋送少量標記數據的方式,然后可以生成大量新鮮數據來自學。
這種方法可能會導致半監督學習的興起,在這種情況下,系統可以使用遠遠少于當今使用監督學習的訓練系統所需要的標記數據來學習如何執行任務。
人工智能
無監督學習
相比之下,無監督學習則使用另一種方法,即算法嘗試識別數據中的模式,尋找可用于對數據進行分類的相似性。
一個例子可能是將重量相似的水果或發動機尺寸相似的汽車聚集在一起。
該算法并非預先設置為挑選特定類型的數據,它只是尋找可以根據其相似性進行分組的數據,例如Google News每天將相似主題的故事分組在一起。
人工智能
強化學習
強化學習的粗略類比是當寵物在表演把戲時獎勵其零食。
在強化學習中,系統嘗試根據其輸入數據最大化獎勵,基本上要經過反復試驗的過程,直到獲得最佳結果。
強化學習的一個例子是Google DeepMind的Deep Q網絡,該網絡 已被用于在各種經典視頻游戲中實現最佳人類表現。系統從每個游戲中獲取像素,并確定各種信息,例如屏幕上對象之間的距離。
通過查看每個游戲中獲得的分數,系統會建立一個模型,該模型的動作將在不同情況下使分數最大化,例如,在視頻游戲Breakout的情況下,應將球拍移至其中以攔截球。
總結
以上是生活随笔為你收集整理的监督学习和无监督学习_机器学习的要素是什么? 有监督学习和无监督学习两大类...的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 1到100的偶数之和是多少_新射雕群侠传
- 下一篇: 高通cpu排行_安卓手机芯片排行:麒麟9