日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

周志华《机器学习》课后习题解析(第一章)绪论

發布時間:2025/3/8 编程问答 35 豆豆
生活随笔 收集整理的這篇文章主要介紹了 周志华《机器学习》课后习题解析(第一章)绪论 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

周志華老師的《機器學習》(西瓜書)一書,沒有公布答案,于是我們從網上搜集了各題目的答案,供大家參考。

參考答案 第一章 緒論

1.1.表1.1中若只包含編號為1,4的兩個樣例,試給出相應的版本空間。

表1.1 西瓜數據集(精簡)

編號色澤根蒂敲聲好瓜
1青綠蜷縮濁響
2烏黑稍蜷沉悶

本題解答:CSDN博主「四去六進一」

原文鏈接:https://blog.csdn.net/icefire_tyh/java/article/details/52065224

答:

假設空間指的是問題所有假設組成的空間,我們可以把學習過程看作是在假設空間中搜索的過程,搜索目標是尋找與訓練集“匹配”的假設。

假設數據集有種屬性,第個屬性可能的取值有種,加上該屬性的泛化取值,所以可能的假設有。再用空集表示沒有正例,假設空間中一共種假設。現實問題中常面臨很大的假設空間,我們可以尋找一個與訓練集一致的假設集合,稱之為版本空間。版本空間從假設空間剔除了與正例不一致和與反例一致的假設,它可以看成是對正例的最大泛化。版本空間的可以通過搜索假設空間來得到,這樣需要遍歷完整的假設空間。如果數據集中有正例,則可以先對一個正例進行最大泛化,得到個假設,然后再對這些假設進行剔除操作,可以適當精簡計算量。數據集有3個屬性,每個屬性2種取值,一共 種假設,分別為

  • 1.色澤=青綠 根蒂=蜷縮 敲聲=濁響

  • 2.色澤=青綠 根蒂=蜷縮 敲聲=沉悶

  • 3.色澤=青綠 根蒂=稍蜷 敲聲=濁響

  • 4.色澤=青綠 根蒂=稍蜷 敲聲=沉悶

  • 5.色澤=烏黑 根蒂=蜷縮 敲聲=濁響

  • 6.色澤=烏黑 根蒂=蜷縮 敲聲=沉悶

  • 7.色澤=烏黑 根蒂=稍蜷 敲聲=濁響

  • 8.色澤=烏黑 根蒂=稍蜷 敲聲=沉悶

  • 9.色澤=青綠 根蒂=蜷縮 敲聲=*

  • 10.色澤=青綠 根蒂=稍蜷 敲聲=*

  • 11.色澤=烏黑 根蒂=蜷縮 敲聲=*

  • 12.色澤=烏黑 根蒂=稍蜷 敲聲=*

  • 13.色澤=青綠 根蒂=* 敲聲=濁響

  • 14.色澤=青綠 根蒂=* 敲聲=沉悶

  • 15.色澤=烏黑 根蒂=* 敲聲=濁響

  • 16.色澤=烏黑 根蒂=* 敲聲=沉悶

  • 17.色澤=* 根蒂=蜷縮 敲聲=濁響

  • 18.色澤=* 根蒂=蜷縮 敲聲=沉悶

  • 19.色澤=* 根蒂=稍蜷 敲聲=濁響

  • 20.色澤=* 根蒂=稍蜷 敲聲=沉悶

  • 21.色澤=青綠 根蒂=* 敲聲=*

  • 22.色澤=烏黑 根蒂=* 敲聲=*

  • 23.色澤=* 根蒂=蜷縮 敲聲=*

  • 24.色澤=* 根蒂=稍蜷 敲聲=*

  • 25.色澤=* 根蒂=* 敲聲=濁響

  • 26.色澤=* 根蒂=* 敲聲=沉悶

  • 27.色澤=* 根蒂=* 敲聲=*

  • 28.空集?
    編號1的數據可以刪除(不包含數據)
    編號1的數據可以刪除 (包含了數據)
    所以版本空間為:

  • 1.色澤=青綠 根蒂=蜷縮 敲聲=濁響

  • 9.色澤=青綠 根蒂=蜷縮 敲聲=*

  • 13.色澤=青綠 根蒂=* 敲聲=濁響

  • 17.色澤=* 根蒂=蜷縮 敲聲=濁響

  • 21.色澤=青綠 根蒂=* 敲聲=*

  • 23.色澤=* 根蒂=蜷縮 敲聲=*

  • 25.色澤=* 根蒂=* 敲聲=濁響

    一般情況下版本空間是正例的泛化,但由于數據集中只有1個正例,所以在版本空間中依然包含了這個樣本的假設(假設1)。


1.2.與使用單個合取式來進行假設表示相比,使用“析合范式”將使得假設空間具有更強的表示能力。例如:

會把“(色澤=青綠)^(根蒂=蜷縮)^(敲聲=清脆”以及“(色澤=烏黑)^(根蒂=硬挺)^(敲聲=沉悶)”都分類為“好瓜”,若使用最多包含k個合取式的析合范式來表達1.1的西瓜分類問題的假設空間,試估算有多少種可能的假設。

本題解答:CSDN博主「weixin_41587767」

原文鏈接:https://blog.csdn.net/weixin_41587767/java/article/details/86290695

答:

表1.1包含4個樣例,3種屬性,假設空間中有3?4?4+1=493?4?4+1=49種假設。最多包含k個合取式來表達假設空間,顯然k的最大值是49。

不考慮空集的話,剩下48種可能:

全部不泛化 2?3?3=182?3?3=18種假設

一個屬性泛化:2?3+3?3+2?3=212?3+3?3+2?3=21種假設

兩個屬性泛化:2+3+3=82+3+3=8種假設

三屬性泛化:1種假設

用這48種假設的排列組合來組成析合范式,展開序列為(也就是楊輝三角的一排):

1, 48, 1128, 17296,...... 17296, 1128, 48, 1 共49個數, 左邊的1代表‘空’,一個都不選,右邊的1代表全部選。

如果k=48,就是說最多采用48種合取式來組成析合范式,排除一種都不選的情況,就是2^48 - 1種。(2^48是根據二項式定理得的)

如果0<k<48,那就把展開序列的前k+1(因為展開序列從0開始數)項全部加起來再減1

如果指定了k的個數,那就是展開序列的第k+1(因為展開序列從0開始數)項的數

但是,這個結果得去重才行,因為泛化是對若干種假設的包含(包容),它本身不是某種假設。把泛化的 * 展開后,

就是若干種具體的假設。如果此題采取48,那么把 * 展開后,假設集合中一定有重復,而且一種具體假設還不止重復一次。

此題應該采用18種具體假設來計算, 就是:2^18 - 1

以下python代碼沒有考慮全部為空的情況(-1),且沒有考慮去重。

#?-*-?coding:?utf-8?-*-def?strige(max):#楊輝三角S?=?[1]while?max:?N?=?S[:]N.append(0)S?=?[N[i-1]+N[i]?for?i?in?range(len(N))]max?-=?1return?S?def?cal_Permutations(total_num?=0,select_num=?0,most_num?=?0):re_total_num?=?0re_select_num?=?0re_most_num?=?0if?total_num?==?0:raise?ValueError,'pls?indicate?total?numbers'returnif?select_num>total_num?or?most_num>total_num:raise?ValueError,'select_num?or?most_num?can?not?bigger?than?total_num'returns?=?strige(total_num)for?x?in?s:re_total_num?+=?xre_select_num?=?s[select_num]for?y?in?range(0,most_num+1):re_most_num?+=?s[y]return?{'input_parameter':{'total_num':total_num,'most_num':most_num,'select_num':select_num},'output_permutations':s,'output_usual_count':{'total_num':re_total_num,'most_num':re_most_num,'select_num':re_select_num}}result?=?cal_Permutations(48,40,48) print?(result)

1.3.若數據包含噪聲,則假設空間中可能不存在與所有訓練樣本都一致的假設。在此情形下,試設計一種歸納偏好用于假設選擇。

本題解答:CSDN博主「四去六進一」

原文鏈接:https://blog.csdn.net/icefire_tyh/java/article/details/52065224

答:

通常認為兩個數據的屬性越相近,則更傾向于將他們分為同一類。若相同屬性出現了兩種不同的分類,則認為它屬于與他最臨近幾個數據的屬性。也可以考慮同時去掉所有具有相同屬性而不同分類的數據,留下的數據就是沒誤差的數據,但是可能會丟失部分信息。


4.本章1.4節在論述“沒有免費的午餐”定理時,默認使用了“分類錯誤率”作為性能度量來對分類器進行評估。若換用其他性能度量,則式(1.1)將改為:

,

試證明沒有免費的午餐”定理仍成立。

本題解答:CSDN博主「四去六進一」

原文鏈接:https://blog.csdn.net/icefire_tyh/java/article/details/52065224

答:

還是考慮二分類問題,NFL首先要保證真是目標函數均勻分布,對于有個樣本的二分類問題,顯然f共有 種情況。其中一半是與假設一致的,也就 。
此時, ,應該是個常數,隱含的條件就該是(一個比較合理的充分條件) 。如果不滿足, NFL 應該就不成立了(或者不那么容易證明)。


5.試述機器學習在互聯網搜索的哪些環節起什么作用。

本題解答:CSDN博主「四去六進一」

原文鏈接:https://blog.csdn.net/icefire_tyh/java/article/details/52065224

答:

1.最常見的,消息推送,比如某東經常說某些商品我可能會感興趣,然而并沒有。

2.網站相關度排行,通過點擊量,網頁內容進行綜合分析。

3.圖片搜索,現在大部分還是通過標簽來搜索,不過基于像素的搜索也總會有的吧。

往期精彩回顧適合初學者入門人工智能的路線及資料下載機器學習及深度學習筆記等資料打印機器學習在線手冊深度學習筆記專輯AI基礎下載(pdf更新到25集)機器學習的數學基礎專輯獲取一折本站知識星球優惠券,復制鏈接直接打開:https://t.zsxq.com/yFQV7am本站qq群1003271085,加入微信群請掃碼喜歡文章,點個在看

總結

以上是生活随笔為你收集整理的周志华《机器学习》课后习题解析(第一章)绪论的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。