日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

hot编码 字符one_One Hot编码是什么?为什么要用它,什么时候用它?

發布時間:2023/12/2 编程问答 39 豆豆
生活随笔 收集整理的這篇文章主要介紹了 hot编码 字符one_One Hot编码是什么?为什么要用它,什么时候用它? 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
作者:Rakshith Vasudev
編譯:ronghuaiyang

導讀

當你在玩ML模型的時候,你會在任何地方遇到這個“One hot encoding”的術語。

當你在玩ML模型的時候,你會在任何地方遇到這個“One hot encoding”術語。你可以看到一個one hot編碼器的sklearn文檔,其中說“使用one-hot也就是one-of- k模式編碼分類整數特征”。不是很清楚,對吧?或者至少不適合我。讓我們看看one hot編碼到底是什么。

One hot編碼方法是將分類變量轉換成一種形式,這種形式可以提供給ML算法,以便更好地進行預測。

假設數據集如下:

╔════════════╦═════════════════╦════════╗ ║ CompanyName Categoricalvalue ║ Price ║ ╠════════════╬═════════════════╣════════║ ║ VW ╬ 1 ║ 20000 ║ ║ Acura ╬ 2 ║ 10011 ║ ║ Honda ╬ 3 ║ 50000 ║ ║ Honda ╬ 3 ║ 10000 ║ ╚════════════╩═════════════════╩════════╝

分類值表示數據集中條目的數值。例如:如果數據集中有另一家公司,它的分類值應該是4。隨著惟一條目數量的增加,分類值也相應地增加。

上表只是一種表示。實際上,分類值從0開始一直到N-1個類別。

你可能已經知道,可以使用sklearn的LabelEncoder完成分類值分配。

現在讓我們回到one hot編碼:假設我們按照sklearn文檔中給出的說明來進行one hot編碼,然后進行一些清理,最后得到以下結果:

╔════╦══════╦══════╦════════╦ ║ VW ║ Acura║ Honda║ Price ║ ╠════╬══════╬══════╬════════╬ ║ 1 ╬ 0 ╬ 0 ║ 20000 ║ ║ 0 ╬ 1 ╬ 0 ║ 10011 ║ ║ 0 ╬ 0 ╬ 1 ║ 50000 ║ ║ 0 ╬ 0 ╬ 1 ║ 10000 ║ ╚════╩══════╩══════╩════════╝

0表示不存在,1表示存在。

在我們進一步討論之前,你能想到一個原因嗎?為什么僅僅使用標簽編碼給模型訓練是不夠的?為什么需要one hot編碼?

標簽編碼的問題是,它假定類別值越高,類別越好。“等等,什么! ?”

讓我解釋一下:這種組織形式的前提是基于類比的值,VW > Acura > Honda。假設你的模型內部計算平均值,那么我們得到,1+3 = 4/2 =2。這意味著:VW 和Honda的平均水平是 Acura。這絕對是個災難。這個模型的預測會有很多誤差。

這就是為什么我們使用one hot編碼器來執行類別的“二值化”,并將其作為一個特征來訓練模型。

另一個例子:假設你有一個“flower”特征,它可以接受“daffodil”、“lily”和“rose”的值。一個one hot編碼將“flower”特征轉換為三個特征,“is_daffodil”、“is_lily”和“is_rose”,它們都是二進制的。

見下圖:

英文原文:https://hackernoon.com/what-is-one-hot-encoding-why-and-when-do-you-have-to-use-it-e3c6186d008f

更多文章,請關注微信公眾號:AI公園

創作挑戰賽新人創作獎勵來咯,堅持創作打卡瓜分現金大獎

總結

以上是生活随笔為你收集整理的hot编码 字符one_One Hot编码是什么?为什么要用它,什么时候用它?的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。