深度学习核心技术精讲100篇(九)-Catboost算法原理解析及代码实现
生活随笔
收集整理的這篇文章主要介紹了
深度学习核心技术精讲100篇(九)-Catboost算法原理解析及代码实现
小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.
前言
今天博主來(lái)介紹一個(gè)超級(jí)簡(jiǎn)單并且又極其實(shí)用的boosting算法包Catboost,據(jù)開(kāi)發(fā)者所說(shuō)這一boosting算法是超越Lightgbm和XGBoost的又一個(gè)神器。
catboost 簡(jiǎn)介
在博主看來(lái)catboost有一下三個(gè)的優(yōu)點(diǎn):
- 它自動(dòng)采用特殊的方式處理類別型特征(categorical features)。首先對(duì)categorical features做一些統(tǒng)計(jì),計(jì)算某個(gè)類別特征(category)出現(xiàn)的頻率,之后加上超參數(shù),生成新的數(shù)值型特征(numerical features)。這也是我在這里介紹這個(gè)算法最大的motivtion,有了catboost,再也不用手動(dòng)處理類別型特征了。
- catboost還使用了組合類別特征,可以利用到特征之間的聯(lián)系,這極大的豐富了特征維度。
- catboost的基模型采用的是對(duì)稱樹(shù),同時(shí)計(jì)算leaf-value方式和傳統(tǒng)的boosting算法也不一樣,傳統(tǒng)的boosting算法計(jì)算的是平均數(shù),而catboost在這方面做了優(yōu)化采用了其他的算法,這些改進(jìn)都能防止模型過(guò)擬合。
catboost 實(shí)戰(zhàn)
這里博主采用的是之前參加一個(gè)CTR點(diǎn)擊率預(yù)估的數(shù)據(jù)集,首先通過(guò)pandas讀入數(shù)據(jù)。
from catboost import CatBoostClassifier import pandas as pd from sklearn.model_selection import train_test_split i
總結(jié)
以上是生活随笔為你收集整理的深度学习核心技术精讲100篇(九)-Catboost算法原理解析及代码实现的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 深度学习核心技术精讲100篇(七)-ke
- 下一篇: 深度学习核心技术精讲100篇(十四)-一