日韩av黄I国产麻豆传媒I国产91av视频在线观看I日韩一区二区三区在线看I美女国产在线I麻豆视频国产在线观看I成人黄色短片

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 >

周志华《机器学习》课后习题解析(第一章)绪论

發(fā)布時間:2025/3/8 39 豆豆
生活随笔 收集整理的這篇文章主要介紹了 周志华《机器学习》课后习题解析(第一章)绪论 小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

周志華老師的《機器學(xué)習(xí)》(西瓜書)一書,沒有公布答案,于是我們從網(wǎng)上搜集了各題目的答案,供大家參考。

參考答案 第一章 緒論

1.1.表1.1中若只包含編號為1,4的兩個樣例,試給出相應(yīng)的版本空間。

表1.1 西瓜數(shù)據(jù)集(精簡)

編號色澤根蒂敲聲好瓜
1青綠蜷縮濁響
2烏黑稍蜷沉悶

本題解答:CSDN博主「四去六進一」

原文鏈接:https://blog.csdn.net/icefire_tyh/java/article/details/52065224

答:

假設(shè)空間指的是問題所有假設(shè)組成的空間,我們可以把學(xué)習(xí)過程看作是在假設(shè)空間中搜索的過程,搜索目標是尋找與訓(xùn)練集“匹配”的假設(shè)。

假設(shè)數(shù)據(jù)集有種屬性,第個屬性可能的取值有種,加上該屬性的泛化取值,所以可能的假設(shè)有。再用空集表示沒有正例,假設(shè)空間中一共種假設(shè)。現(xiàn)實問題中常面臨很大的假設(shè)空間,我們可以尋找一個與訓(xùn)練集一致的假設(shè)集合,稱之為版本空間。版本空間從假設(shè)空間剔除了與正例不一致和與反例一致的假設(shè),它可以看成是對正例的最大泛化。版本空間的可以通過搜索假設(shè)空間來得到,這樣需要遍歷完整的假設(shè)空間。如果數(shù)據(jù)集中有正例,則可以先對一個正例進行最大泛化,得到個假設(shè),然后再對這些假設(shè)進行剔除操作,可以適當精簡計算量。數(shù)據(jù)集有3個屬性,每個屬性2種取值,一共 種假設(shè),分別為

  • 1.色澤=青綠 根蒂=蜷縮 敲聲=濁響

  • 2.色澤=青綠 根蒂=蜷縮 敲聲=沉悶

  • 3.色澤=青綠 根蒂=稍蜷 敲聲=濁響

  • 4.色澤=青綠 根蒂=稍蜷 敲聲=沉悶

  • 5.色澤=烏黑 根蒂=蜷縮 敲聲=濁響

  • 6.色澤=烏黑 根蒂=蜷縮 敲聲=沉悶

  • 7.色澤=烏黑 根蒂=稍蜷 敲聲=濁響

  • 8.色澤=烏黑 根蒂=稍蜷 敲聲=沉悶

  • 9.色澤=青綠 根蒂=蜷縮 敲聲=*

  • 10.色澤=青綠 根蒂=稍蜷 敲聲=*

  • 11.色澤=烏黑 根蒂=蜷縮 敲聲=*

  • 12.色澤=烏黑 根蒂=稍蜷 敲聲=*

  • 13.色澤=青綠 根蒂=* 敲聲=濁響

  • 14.色澤=青綠 根蒂=* 敲聲=沉悶

  • 15.色澤=烏黑 根蒂=* 敲聲=濁響

  • 16.色澤=烏黑 根蒂=* 敲聲=沉悶

  • 17.色澤=* 根蒂=蜷縮 敲聲=濁響

  • 18.色澤=* 根蒂=蜷縮 敲聲=沉悶

  • 19.色澤=* 根蒂=稍蜷 敲聲=濁響

  • 20.色澤=* 根蒂=稍蜷 敲聲=沉悶

  • 21.色澤=青綠 根蒂=* 敲聲=*

  • 22.色澤=烏黑 根蒂=* 敲聲=*

  • 23.色澤=* 根蒂=蜷縮 敲聲=*

  • 24.色澤=* 根蒂=稍蜷 敲聲=*

  • 25.色澤=* 根蒂=* 敲聲=濁響

  • 26.色澤=* 根蒂=* 敲聲=沉悶

  • 27.色澤=* 根蒂=* 敲聲=*

  • 28.空集?
    編號1的數(shù)據(jù)可以刪除(不包含數(shù)據(jù))
    編號1的數(shù)據(jù)可以刪除 (包含了數(shù)據(jù))
    所以版本空間為:

  • 1.色澤=青綠 根蒂=蜷縮 敲聲=濁響

  • 9.色澤=青綠 根蒂=蜷縮 敲聲=*

  • 13.色澤=青綠 根蒂=* 敲聲=濁響

  • 17.色澤=* 根蒂=蜷縮 敲聲=濁響

  • 21.色澤=青綠 根蒂=* 敲聲=*

  • 23.色澤=* 根蒂=蜷縮 敲聲=*

  • 25.色澤=* 根蒂=* 敲聲=濁響

    一般情況下版本空間是正例的泛化,但由于數(shù)據(jù)集中只有1個正例,所以在版本空間中依然包含了這個樣本的假設(shè)(假設(shè)1)。


1.2.與使用單個合取式來進行假設(shè)表示相比,使用“析合范式”將使得假設(shè)空間具有更強的表示能力。例如:

會把“(色澤=青綠)^(根蒂=蜷縮)^(敲聲=清脆”以及“(色澤=烏黑)^(根蒂=硬挺)^(敲聲=沉悶)”都分類為“好瓜”,若使用最多包含k個合取式的析合范式來表達1.1的西瓜分類問題的假設(shè)空間,試估算有多少種可能的假設(shè)。

本題解答:CSDN博主「weixin_41587767」

原文鏈接:https://blog.csdn.net/weixin_41587767/java/article/details/86290695

答:

表1.1包含4個樣例,3種屬性,假設(shè)空間中有3?4?4+1=493?4?4+1=49種假設(shè)。最多包含k個合取式來表達假設(shè)空間,顯然k的最大值是49。

不考慮空集的話,剩下48種可能:

全部不泛化 2?3?3=182?3?3=18種假設(shè)

一個屬性泛化:2?3+3?3+2?3=212?3+3?3+2?3=21種假設(shè)

兩個屬性泛化:2+3+3=82+3+3=8種假設(shè)

三屬性泛化:1種假設(shè)

用這48種假設(shè)的排列組合來組成析合范式,展開序列為(也就是楊輝三角的一排):

1, 48, 1128, 17296,...... 17296, 1128, 48, 1 共49個數(shù), 左邊的1代表‘空’,一個都不選,右邊的1代表全部選。

如果k=48,就是說最多采用48種合取式來組成析合范式,排除一種都不選的情況,就是2^48 - 1種。(2^48是根據(jù)二項式定理得的)

如果0<k<48,那就把展開序列的前k+1(因為展開序列從0開始數(shù))項全部加起來再減1

如果指定了k的個數(shù),那就是展開序列的第k+1(因為展開序列從0開始數(shù))項的數(shù)

但是,這個結(jié)果得去重才行,因為泛化是對若干種假設(shè)的包含(包容),它本身不是某種假設(shè)。把泛化的 * 展開后,

就是若干種具體的假設(shè)。如果此題采取48,那么把 * 展開后,假設(shè)集合中一定有重復(fù),而且一種具體假設(shè)還不止重復(fù)一次。

此題應(yīng)該采用18種具體假設(shè)來計算, 就是:2^18 - 1

以下python代碼沒有考慮全部為空的情況(-1),且沒有考慮去重。

#?-*-?coding:?utf-8?-*-def?strige(max):#楊輝三角S?=?[1]while?max:?N?=?S[:]N.append(0)S?=?[N[i-1]+N[i]?for?i?in?range(len(N))]max?-=?1return?S?def?cal_Permutations(total_num?=0,select_num=?0,most_num?=?0):re_total_num?=?0re_select_num?=?0re_most_num?=?0if?total_num?==?0:raise?ValueError,'pls?indicate?total?numbers'returnif?select_num>total_num?or?most_num>total_num:raise?ValueError,'select_num?or?most_num?can?not?bigger?than?total_num'returns?=?strige(total_num)for?x?in?s:re_total_num?+=?xre_select_num?=?s[select_num]for?y?in?range(0,most_num+1):re_most_num?+=?s[y]return?{'input_parameter':{'total_num':total_num,'most_num':most_num,'select_num':select_num},'output_permutations':s,'output_usual_count':{'total_num':re_total_num,'most_num':re_most_num,'select_num':re_select_num}}result?=?cal_Permutations(48,40,48) print?(result)

1.3.若數(shù)據(jù)包含噪聲,則假設(shè)空間中可能不存在與所有訓(xùn)練樣本都一致的假設(shè)。在此情形下,試設(shè)計一種歸納偏好用于假設(shè)選擇。

本題解答:CSDN博主「四去六進一」

原文鏈接:https://blog.csdn.net/icefire_tyh/java/article/details/52065224

答:

通常認為兩個數(shù)據(jù)的屬性越相近,則更傾向于將他們分為同一類。若相同屬性出現(xiàn)了兩種不同的分類,則認為它屬于與他最臨近幾個數(shù)據(jù)的屬性。也可以考慮同時去掉所有具有相同屬性而不同分類的數(shù)據(jù),留下的數(shù)據(jù)就是沒誤差的數(shù)據(jù),但是可能會丟失部分信息。


4.本章1.4節(jié)在論述“沒有免費的午餐”定理時,默認使用了“分類錯誤率”作為性能度量來對分類器進行評估。若換用其他性能度量,則式(1.1)將改為:

,

試證明沒有免費的午餐”定理仍成立。

本題解答:CSDN博主「四去六進一」

原文鏈接:https://blog.csdn.net/icefire_tyh/java/article/details/52065224

答:

還是考慮二分類問題,NFL首先要保證真是目標函數(shù)均勻分布,對于有個樣本的二分類問題,顯然f共有 種情況。其中一半是與假設(shè)一致的,也就 。
此時, ,應(yīng)該是個常數(shù),隱含的條件就該是(一個比較合理的充分條件) 。如果不滿足, NFL 應(yīng)該就不成立了(或者不那么容易證明)。


5.試述機器學(xué)習(xí)在互聯(lián)網(wǎng)搜索的哪些環(huán)節(jié)起什么作用。

本題解答:CSDN博主「四去六進一」

原文鏈接:https://blog.csdn.net/icefire_tyh/java/article/details/52065224

答:

1.最常見的,消息推送,比如某東經(jīng)常說某些商品我可能會感興趣,然而并沒有。

2.網(wǎng)站相關(guān)度排行,通過點擊量,網(wǎng)頁內(nèi)容進行綜合分析。

3.圖片搜索,現(xiàn)在大部分還是通過標簽來搜索,不過基于像素的搜索也總會有的吧。

往期精彩回顧適合初學(xué)者入門人工智能的路線及資料下載機器學(xué)習(xí)及深度學(xué)習(xí)筆記等資料打印機器學(xué)習(xí)在線手冊深度學(xué)習(xí)筆記專輯AI基礎(chǔ)下載(pdf更新到25集)機器學(xué)習(xí)的數(shù)學(xué)基礎(chǔ)專輯獲取一折本站知識星球優(yōu)惠券,復(fù)制鏈接直接打開:https://t.zsxq.com/yFQV7am本站qq群1003271085,加入微信群請掃碼喜歡文章,點個在看

總結(jié)

以上是生活随笔為你收集整理的周志华《机器学习》课后习题解析(第一章)绪论的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯,歡迎將生活随笔推薦給好友。