机器学习常见知识点自查50问与答
機器學習常見知識點自查50問與答
- 1.什么是機器學習
- 2.機器學習與數據挖掘的區別
- 3.什么是機器學習的過度擬合現象
- 4.過度擬合產生的原因
- 5.如何避免過擬合
- 6.什么是感應式的機器學習
- 7.機器學習的五個流行算法是什么
- 8.機器學習有哪些不同的算法技術
- 9.機器學習建立模型的三個階段是什么
- 10.什么是監督學習的標準方法
- 11.什么是訓練數據集和測試數據集
- 12.機器學習的各種方法
- 13.非機器學習有哪些類型
- 14.什么是非監督學習的功能
- 15.什么是監督學習的功能
- 16.什么是算法獨立的機器學習
- 17.人工智能與機器學習的區別
- 18.機器學習中分類器是什么
- 19.樸素貝葉斯方法的優勢是什么
- 20.在哪些領域使用模式識別技術
- 21.什么是遺傳編程
- 22.歸納邏輯程序設計是什么
- 23.模型的選擇是什么
- 24.用于監督學習校準的兩種方法是什么
- 25.什么方法通常用于防止過擬合
- 26.規則學習的啟發式方法和決策樹的啟發式方法之間的區別是什么
- 27.什么是感知機器學習
- 28.貝葉斯邏輯程序的兩個組成部分是什么
- 29.什么是貝葉斯網絡
- 30.為什么基于實例的學習算法有時也被稱為懶惰學習算法
- 31.支持向量機能處理哪兩種分類方法
- 32.什么是集成學習?
- 33.為什么集成學習被應用?
- 34.什么使用集成學習?
- 35.什么是集成方法的兩種范式?
- 36.什么是集成方法的一般原則,在集成方法中套袋(bagging)和爆發(boosting)指的是什么?
- 37.什么是集成方法分類錯誤的偏置方差分解?
- 38.在集成方法中什么是增量合成方法?
- 39.PCA,KPCA和ICE如何使用?
- 40.在機器學習中降維是什么意思?
- 41.什么是支持向量機?
- 42.關系評價技術的組成部分是什么?
- 43.連續監督學習有什么不同方法?
- 44.在機器人技術和信息處理技術的哪些方面會相繼出現預測問題?
- 45.什么是批量統計學習?
- 46.什么是PAC學習?
- 47.有哪些不同的類別可以分為序列學習過程?
- 48.什么是序列學習?
- 49.機器學習的兩種技術是什么?
- 50.你在日常工作中看到的機器學習的一個流行應用是什么?
1.什么是機器學習
機器學習是為了應對系統程序設計,屬于計算機科學類的學科,能根據經驗進行自動學習和提高。例如:一個由程序操控的機器人,能根據從傳感器收集到的數據,完成一系列的任務和工作,能根據數據自動學習的應用程序。
2.機器學習與數據挖掘的區別
機器語言是指在沒有明確的程序指令的情況下,給予計算機學習能力,使它能夠自主的學習、設計和擴展相關算法。數據挖掘則是一種從非結構化數據里面提取知識或者未知的、人們感興趣的數據,這個過程中應用了機器學習算法。
3.什么是機器學習的過度擬合現象
在機器學習中,當一個統計模型首先描述隨機誤差或噪聲,而不是自身的基本關系時,過度擬合就會出現。當一個模型過于復雜,過擬合通常容易出現,因為相對訓練數據類型的數量,模型參數過于龐大。
4.過度擬合產生的原因
由于用于訓練模型的標準并不等同于判斷模型效率的標準,這導致了產生過度擬合的可能性。
5.如何避免過擬合
當使用較小的數據集進行機器學習時,容易產生過度擬合,因此使用較大的數據量能避免過擬合現象。但是,當不得不使用小數據集進行建模時,可以使用交叉驗證的技術,將數據分成兩節即訓練集和測試集。在交叉驗證技術中,一個模型通常是被給定有先驗知識的數據集(訓練數據集)進行訓練,沒有先驗知識的數據集進行測試。交叉驗證的思想是:在訓練階段,定義一個數據集來驗證模型。
6.什么是感應式的機器學習
感應機器學習涉及由實踐進行學習的過程,能從一組可觀測的例子,嘗試推導出普遍性規則。
7.機器學習的五個流行算法是什么
- 決策樹
- BP神經網絡(反向傳播)
- 概率網絡
- 最鄰近法
- 支持向量機
8.機器學習有哪些不同的算法技術
- 監督學習
- 非監督學習
- 半監督學習
- 轉導推理(Transduction):通過觀察特定的訓練樣本,進而預測特定的測試樣本的方法。
- 學習推理(Learning to Learn)
9.機器學習建立模型的三個階段是什么
- 建立模型
- 測試模型
- 模型應用
10.什么是監督學習的標準方法
監督學習的標準方法是將一組示例數據分成訓練數據集和測試數據集。
11.什么是訓練數據集和測試數據集
在類似于機器學習的各個信息科學相關領域中,一組數據被用來發現潛在的預測關系,稱為“訓練數據集”。訓練數據集是提供給學習者的案例,而試驗數據集是用于測試由學習者提出的假設關系的準確度。
12.機器學習的各種方法
- 概念與分類學習(Concept Vs Classification Learning)
- 符號與統計學習(Symbolic Vs Statistical Learning)
- 歸納與分類學習(Inductive Vs Analytical Learning)
13.非機器學習有哪些類型
人工智能、規則推理
14.什么是非監督學習的功能
- 求數據的集群
- 求出數據的低維表達
- 查找數據有趣的方向
- 有趣的坐標和相關性
- 發現顯著的觀測值和數據集清理
15.什么是監督學習的功能
- 分類
- 語音識別
- 回歸
- 時間序列預測
- 注釋字符串
16.什么是算法獨立的機器學習
機器學習在基礎數學領域獨立于任何特定分類器或者學習算法,被稱為算法獨立的機器學習。
17.人工智能與機器學習的區別
基于經驗數據的特性而設計和開發的算法被稱為機器學習。而人工智能不但包含機器學習,還包括諸如知識表示、自然語言處理、規劃、機器人技術等其他方法。
18.機器學習中分類器是什么
分類器是指輸入離散或者連續特征值的向量,并輸出單個離散值或者類型的系統。
19.樸素貝葉斯方法的優勢是什么
樸素貝葉斯分類器會比判別模型,譬如邏輯回歸收斂地更快,因此只需要更少的訓練數據。主要缺點是無法學習特征間的交互關系。
20.在哪些領域使用模式識別技術
- 計算機視覺
- 語言識別
- 統計
- 數據挖掘
- 非正式檢索
- 生物信息學
21.什么是遺傳編程
遺傳編程是機器學習常用的方法之一。該模型基于測試,并在一系列的結果當中,獲取最佳選擇。
22.歸納邏輯程序設計是什么
歸納邏輯程序設計(ILP)是利用邏輯程序設計表達的背景知識和實例,是機器學習的一個分支。
23.模型的選擇是什么
在不同的數學模型中,選擇用于描述相同的數據集的模型的過程被稱為模型選擇。模型選擇被應用于統計、機器學習和數據挖掘等相關領域。
24.用于監督學習校準的兩種方法是什么
- 普拉特校準
- 保序回歸
25.什么方法通常用于防止過擬合
當有足夠的數據進行等滲回歸時,這通常被用來防止過擬合問題。
26.規則學習的啟發式方法和決策樹的啟發式方法之間的區別是什么
決策樹的啟發式方法評價的是一系列不相交的集合的平均質量;然而規則學習的啟發式方法僅僅評價在候選規則覆蓋下的實例ji。
27.什么是感知機器學習
感知器是一種輸入到幾個可能的非二進制輸出的監督分類方法。
28.貝葉斯邏輯程序的兩個組成部分是什么
第一部分由一組貝葉斯條款組成,能捕捉特定領域的定性結構。
第二部分是定量的,能對量化信息進行編碼。
29.什么是貝葉斯網絡
貝葉斯網絡是用來表示一組變量之間未概率關系的圖像模型。
30.為什么基于實例的學習算法有時也被稱為懶惰學習算法
基于實例的學習算法也被稱為懶惰學習算法,因為它們延緩誘導或泛化過程,直到分類完成。
31.支持向量機能處理哪兩種分類方法
- 結合二分類法
- 修改二進制納入多分類法
32.什么是集成學習?
為了解決特定的計算程序,如分類器或專家知識等多種模式,進行戰略性生產和組合。這個過程被稱為集成學習。
33.為什么集成學習被應用?
集成學習能提高模型的分類,預測,函數逼近等方面的精度。
34.什么使用集成學習?
當你構建一個更準確,相互獨立的分類器時,使用集成學習。
35.什么是集成方法的兩種范式?
集成方法的兩種范式是:
- 連續集成方法
- 并行集成方法。
36.什么是集成方法的一般原則,在集成方法中套袋(bagging)和爆發(boosting)指的是什么?
集成方法的一般原則是要結合定的學習算法多種預測模型,相對于單一模型,其有更強的健壯性。套袋是一種能提高易變的預測或分類方案集成方法。爆發方法被依次用來減少組合模型的偏差。爆發和裝袋都可以通過降低方差減少誤差。
37.什么是集成方法分類錯誤的偏置方差分解?
學習算法的期望誤差可以分解為偏差和方差。偏置項衡量由學習方法產生的平均分類器與目標函數是否匹配。
38.在集成方法中什么是增量合成方法?
增量學習方法是一種從新數據進行學習,并能應用于后續由現有的數據集生成的分類器的算法。
39.PCA,KPCA和ICE如何使用?
PCA(主成分分析),KPCA(基于內核主成分分析)和ICA(獨立成分分析)是用于降維的重要特征提取技術。
40.在機器學習中降維是什么意思?
在機器學習和統計應用中,降維是指在計算時減少隨機變量數目的處理過程,并且可以分為特征選擇和特征提取。
41.什么是支持向量機?
支持向量機是一種監督學習算法,適用于分類和回歸分析。
42.關系評價技術的組成部分是什么?
關系評價技術的重要組成部分如下:
1.數據采集2. 地面實況采集3. 交叉驗證技術4. 查詢類型5. 評分標準6. 顯著性檢驗。
43.連續監督學習有什么不同方法?
連續監督學習問題的不同解決辦法如下:
1.滑動窗口方法
2. 復發性推拉窗
3. 隱藏馬爾科夫模型
4. 最大熵馬爾科夫模型
5. 條件隨機域
6. 圖變換網絡
44.在機器人技術和信息處理技術的哪些方面會相繼出現預測問題?
在機器人技術和信息處理技術中,相繼出現預測問題的是:
1.模仿學習
2. 結構預測
3. 基于模型的強化學習。
45.什么是批量統計學習?
統計學習技術允許根據一組觀察到的數據進行學習功能和預測,這可以對無法觀察和未知的數據進行預測。這些技術提供的學習預測器對未來未知數據的預測提供性能保證。
46.什么是PAC學習?
可能近似正確模型 (PAC) 學習是一個已經被引入到分析學習算法和統計效率的學習框架。
47.有哪些不同的類別可以分為序列學習過程?
1.序列預測
2. 序列生成
3. 序列識別
4. 順序決定
48.什么是序列學習?
序列學習是一種以合乎邏輯的方式進行教學和學習的方法。
49.機器學習的兩種技術是什么?
機器學習的兩種技術是:
1.遺傳編程
2.歸納學習
50.你在日常工作中看到的機器學習的一個流行應用是什么?
各大電商網站上已部署好的推薦引擎使用的是機器學習。
總結
以上是生活随笔為你收集整理的机器学习常见知识点自查50问与答的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 【百度飞浆】YOLO系列目标检测算法详解
- 下一篇: 机器学习理论《统计学习方法》学习笔记:第