日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

滴滴算法大赛算法解决过程 - 机器学习

發(fā)布時間:2025/4/5 编程问答 31 豆豆
生活随笔 收集整理的這篇文章主要介紹了 滴滴算法大赛算法解决过程 - 机器学习 小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

按照前面文章的方法進行數(shù)據(jù)預(yù)測,完全不使用POI,天氣,交通情況的數(shù)據(jù),可以達到0.43的成績。
不過如果想要獲得更好的成績,簡單的預(yù)測方法顯然無法滿足要求了。

GBDT

網(wǎng)友說可以使用GBDT的方法來進行數(shù)據(jù)預(yù)測。所以,我們先來聊聊GBDT算法的一些基礎(chǔ)知識。

凡是說到算法,人工智能,機器學(xué)習(xí)的文章,多半一定要說到 熵 這個概念的。什么是熵?
百度一下:

熵(entropy)指的是體系的混亂的程度,它在控制論、概率論、數(shù)論、天體物理、生命科學(xué)等領(lǐng)域都有重要應(yīng)用,在不同的學(xué)科中也有引申出的更為具體的定義,是各領(lǐng)域十分重要的參量。熵由魯?shù)婪颉た藙谛匏?#xff08;Rudolf Clausius)提出,并應(yīng)用在熱力學(xué)中。后來在,克勞德·艾爾伍德·香農(nóng)(Claude Elwood Shannon)第一次將熵的概念引入到信息論中來。

一個體系越是單調(diào),則熵越低,反之亦然。
這里我們引用數(shù)據(jù)挖掘大神的文章來接單說一下熵。

  • 如果有一個字符串,里面包含了4種字符,每種出現(xiàn)的概率都是P= 1/4。
    P(X=A) = 1/4
    P(X=B) = 1/4
    P(X=C) = 1/4
    P(X=D) = 1/4
    這樣的字符串可能是:BAACBADCDADDDA。傳送這樣的字符串,每一個字符需要用幾個bit?
    答案是2個bit
    A = 00, B = 01, C = 10, D =11

  • 如果有一個字符串,里面包含了4種字符,但是每個字符串出現(xiàn)的概率不同
    P(X=A) = 1/2
    P(X=B) = 1/4
    P(X=C) = 1/8
    P(X=D) = 1/8
    傳送這樣的字符串,每一個字符平均需要用幾個bit?注意這里說平均。
    答案是1.75個bit
    A = 0, B = 10, C = 110, D =111
    (如果使用等概率的方法, A = 00, B = 01, C = 10, D =11,則無法節(jié)省編碼量,還是2個bit)
    這里巧妙的做到了,出現(xiàn)概率高的字符,使用的bit位少,同時做到了編碼上的問題。
    (AB =〉010 和 C 110,D 111 不重復(fù)。AA =〉00 和 B 10 不重復(fù) 等)

  • 有如果有一個字符串,里面3種字符串,每種出現(xiàn)概率都是 1/3呢?
    最簡單的編碼方式是 A = 00, B = 01, C = 10, 這樣是2個bit,但是如果好好計算一下,可以做到1.6個bit。
    A=10,B= 11,C = 0(理論上是1.58496 個bit)

  • 有如果有一個字符串,里面N種字符串,每種出現(xiàn)概率是 PN呢?

  • 如果有一個字符串,里面包含了4種字符,每種出現(xiàn)的概率都是P= 1/4 = 0.25。
    log(0.25,2) = - 2
    H(X) = - (1/4) * log(0.25,2) - (1/4) * log(0.25,2) - (1/4) * log(0.25,2) - (1/4) * log(0.25,2) = 2;

  • 如果要表示下圖的H(X)和H(Y)呢?

這個很容易計算
這個很容易計算
H(X)= 1.5

P(Math) = 1/2 P(History)= 1/4 P(CS)= 1/4
log(0.25,2) = - 2 log(0.5,2) = - 1
H(X) = - (1/2) * log(0.5,2) - (1/4) * log(0.25,2) - (1/4) * log(0.25,2) = 0.5 + 0.5 + 0.5 = 1.5;

H(Y)= 1
P(Yes) = 1/2 P(No) = 1/2
H(Y) = - (1/2) * log(0.5,2) - (1/2) * log(0.5,2) = 0.5 + 0.5 = 1;

  • 如果說,我們的計算范圍只是 X = Math 的數(shù)據(jù)。那么這個時候 H(Y | X = Math) 是多少呢?是多少呢?答案是1。(一共4條記錄,但是Y有兩種可能性)
  • 如果說,我們的計算范圍只是 X = Histroy 的數(shù)據(jù)。那么這個時候 H(Y| X = Histroy)是多少呢?答案也是 0 。(一共2條記錄,但是Y只是一種可能性)
  • 如果說,我們的計算范圍只是 X = CS 的數(shù)據(jù)。那么這個時候 H(Y| X = CS)是多少呢?答案也是 0 。(一共2條記錄,但是Y只是一種可能性)

H(Y | X ): 條件熵 Conditional Entropy

現(xiàn)在我們考慮一個問題,如果我們需要將Y傳輸出去。當然,如果直接傳輸?shù)脑?#xff0c; H(Y)= 1。
如果我們在傳輸?shù)臅r候,雙方都知道X的值,則需要熵定義為H(Y | X )。

例如:大家都知道X=History,則 Y 必然是 NO, H(Y ) = 0 , Histroy的可能性是1/4 ,需要的傳輸量是 0(CS同理)
大家都知道X=Math,則 Y 可能是 Yes或者No,H(Y ) = 1 ,Math的可能性是1/2 ,需要的平均傳輸率是 1/2 * 1 = 0.5
Math的概率 P(Math) = 1/2 ; History的概率 P(Histroy)= 1/4; History的概率 P(CS)= 1/4;
則我們定義H(Y | X ) = H(Y | X = Math) * P(Math) + H(Y| X = Histroy) * P(Histroy) + H(Y| X = CS) * P(CS) = 0.5

Information Gain 信息增益 和 Relative Information Gain

從上文可知,比起直接傳輸Y,條件熵則更加劃算了。這些劃算的部分,我們稱為信息增益IG。
IG(Y|X) = H(Y) - H(Y | X)
上面的例子,IG(Y|X) = H(Y) - H(Y | X) = 1 - 0.5 = 0.5
進一步,這樣劃算的部分,占原來所需部分的比重是多少呢?
RIG= IG(Y|X) / H(Y) = 0.5 / 1 = 0.5 (節(jié)省的部分占了50%)

信息增益是什么,我們先從它的用處來了解它:
信息增益是特征選擇中的一個重要指標,它定義為一個特征能夠為分類系統(tǒng)帶來多少信息,帶來的信息越多,該特征越重要。

指標選擇

回到滴滴算法的問題,我們應(yīng)該挑選哪些指標作為GBDT的參考呢?

滴滴算法大賽算法解決過程 - 數(shù)據(jù)分析
滴滴算法大賽算法解決過程 - 擬合算法
滴滴算法大賽算法解決過程 - 方案設(shè)計
滴滴算法大賽算法解決過程 - 機器學(xué)習(xí)

總結(jié)

以上是生活随笔為你收集整理的滴滴算法大赛算法解决过程 - 机器学习的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯,歡迎將生活随笔推薦給好友。

主站蜘蛛池模板: 午夜精品一区二区三区在线视频 | 亚洲一区二区91 | 五月天综合久久 | 我和公激情中文字幕 | 伊人色播 | 茄子视频懂你更多在线观看 | 久久久午夜精品 | 无码视频一区二区三区 | 国产亚洲片 | 娇小激情hdxxxx学生 | av无码精品一区二区三区宅噜噜 | 草色网| 国内精品久久久久久久久 | 精品少妇人妻av免费久久久 | 国产免费一区二区三区网站免费 | 老版水浒传83版免费播放 | 黄色小说视频网站 | 欧美日韩在线免费 | 影音先锋二区 | 亚洲精品视频一区二区 | 中文字幕影片免费在线观看 | 国产无限资源 | 久色电影 | 亚洲福利在线观看 | 日本黄色大片免费看 | 看av在线| 国产在线观看a | 人妻巨大乳一二三区 | 男男车车的车车网站w98免费 | 人妻熟女一区二区aⅴ水野 91在线观看视频 | 日本xx视频 | 一级片免费网址 | 亚洲欧洲久久 | 韩国三级与黑人 | 欧美性第一页 | 少妇人妻偷人精品一区二区 | 嫩草影院一区二区三区 | 日韩精品在线视频观看 | 久久中文字幕电影 | 天躁夜夜躁狼狠躁 | 成人在线h | 少妇久久久久久久 | 五月激情丁香网 | 精品国产一区二区三区久久 | 免费污网站在线观看 | 日韩在线视频播放 | 久久综合影视 | 色综合天天操 | 欧美四区 | 日本黄色大片免费看 | 一级全黄裸体片 | 亚洲视频区 | 国产成人无码精品久在线观看 | 99re在线视频 | 国产,日韩,欧美 | 日韩少妇av | 91华人在线 | 夜夜撸小说 | 色一情一乱一伦一区二区三区 | 97精品国产97久久久久久免费 | 自拍第一页| 我要看免费黄色片 | 国产午夜一级 | 国产亚洲欧美日韩精品 | 欧美在线播放视频 | 精品国产免费人成在线观看 | 国产精品一二三四区 | 一区二区中文字幕在线观看 | 欧美青青草 | 91久久精品日日躁夜夜躁国产 | 主播一区二区 | 人人爱人人射 | 99国产精品久久久久久久成人 | 最近中文在线观看 | 成人在线视频一区 | 蜜臀aⅴ国产精品久久久国产老师 | 永久黄色网址 | 一区二区三区在线免费观看视频 | 亚洲一区二区三区四区av | 短篇山村男同肉耽h | 精品欧美视频 | 91成年人视频 | 女人的洗澡毛片毛多 | 久久久高潮 | 男人亚洲天堂 | 一级做a爰片毛片 | 中文字幕视频免费观看 | 在线观看日韩中文字幕 | 脱美女衣服亲摸揉视频 | 三及毛片 | 日韩高清不卡一区 | 精品亚洲aⅴ无码一区二区三区 | 久久久噜噜噜久久久 | 亚洲美女性视频 | 91久久人澡人人添人人爽欧美 | 欧美成人免费视频 | 成人无码精品1区2区3区免费看 | 无码人中文字幕 | 最新精品国产 |