端到端的含义,统计学习、机器学习和深度学习的区别与联系
什么是端到端(end-to-end)
端到端通俗來說就是不需要進(jìn)行特征提取,輸入的是原始的數(shù)據(jù),輸出的就是最后的結(jié)果。
經(jīng)典機(jī)器學(xué)習(xí)方式是以人類的先驗(yàn)知識將raw數(shù)據(jù)預(yù)處理成feature,然后對feature進(jìn)行分類。分類結(jié)果十分取決于feature的好壞。所以過去的機(jī)器學(xué)習(xí)專家將大部分時間花費(fèi)在設(shè)計(jì)feature上。那時的機(jī)器學(xué)習(xí)有個更合適的名字叫特征工程(feature engineering)
隨著深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)的發(fā)展,讓網(wǎng)絡(luò)自己學(xué)習(xí)如何抓取feature效果更佳。由于多層神經(jīng)網(wǎng)絡(luò)被證明能夠耦合任意非線性函數(shù),通過一些配置能讓網(wǎng)絡(luò)去做以前需要人工參與的特征設(shè)計(jì)這些工作,然后配置合適的功能如分類、回歸。而現(xiàn)在神經(jīng)網(wǎng)絡(luò)可以通過配置layers的參數(shù)達(dá)到這些功能,整個輸入到最終輸出無需太多人工設(shè)置,從raw data 到最終輸出指標(biāo)。于是興起了表征學(xué)習(xí)(representation learning),自編碼器就是表征學(xué)習(xí)的一個例子。這種方式對數(shù)據(jù)的擬合更加靈活。
端到端(end to end)的優(yōu)缺點(diǎn)
通過縮減人工預(yù)處理和后續(xù)處理,盡可能使模型從原始輸入到最終輸出,給模型更多可以根據(jù)數(shù)據(jù)自動調(diào)節(jié)的空間,增加模型的整體契合度。
但是,由于端到端的特征提取依賴于隱層模型,其相比較傳統(tǒng)機(jī)器學(xué)習(xí)方法來說解釋性弱,趨于黑盒子過程。
這里就引出了基于端到端的深度學(xué)習(xí)、機(jī)器學(xué)習(xí)和統(tǒng)計(jì)學(xué)習(xí)的關(guān)聯(lián)和區(qū)別。
統(tǒng)計(jì)學(xué)習(xí),機(jī)器學(xué)習(xí)與深度學(xué)習(xí)概念的關(guān)聯(lián)與區(qū)別
簡單總結(jié)來說:
1、機(jī)器學(xué)習(xí)與統(tǒng)計(jì)學(xué)習(xí)有較大的重疊,或者說機(jī)器學(xué)習(xí)是建立在統(tǒng)計(jì)學(xué)習(xí)的基礎(chǔ)之上;
2、統(tǒng)計(jì)學(xué)習(xí)是theory-driven,對數(shù)據(jù)分布進(jìn)行假設(shè),以強(qiáng)大的數(shù)學(xué)理論支撐解釋因果,注重參數(shù)推斷(Inference);
3、機(jī)器學(xué)習(xí)是data-driven,依賴于大數(shù)據(jù)規(guī)模預(yù)測未來,弱化了收斂性問題,注重模型預(yù)測(Prediction);
4、深度學(xué)習(xí)是機(jī)器學(xué)習(xí)的一個子領(lǐng)域,特征提取更依賴于隱層模型,解釋性弱,趨于黑盒子。
如下圖所示,統(tǒng)計(jì)學(xué)習(xí)、機(jī)器學(xué)習(xí)、深度學(xué)習(xí)是一個包含又交叉的關(guān)系:
(圖片轉(zhuǎn)自網(wǎng)絡(luò))
對于人工智能領(lǐng)域來說,所謂人工智能可以理解為能夠感知、推理、行動和適應(yīng)的程序。而機(jī)器學(xué)習(xí)屬于人工智能的子領(lǐng)域,指能夠隨著數(shù)據(jù)量的增加不斷改進(jìn)性能的算法。深度學(xué)習(xí)又是機(jī)器學(xué)習(xí)的一個子領(lǐng)域,指利用多層神經(jīng)網(wǎng)絡(luò)從大量數(shù)據(jù)集中進(jìn)行學(xué)習(xí)的技術(shù)。
References
http://jacoxu.com/statisticandmachinelearning
https://blog.csdn.net/happyhorizion/article/details/100607429
總結(jié)
以上是生活随笔為你收集整理的端到端的含义,统计学习、机器学习和深度学习的区别与联系的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 使用数据增强技术提升模型泛化能力
- 下一篇: 人脸识别及对比_没有“色彩对比可及性的神