日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當(dāng)前位置: 首頁 >

俄罗斯最大搜索引擎Yandex开源了一款梯度提升机器学习库CatBoost

發(fā)布時間:2025/3/8 22 豆豆
生活随笔 收集整理的這篇文章主要介紹了 俄罗斯最大搜索引擎Yandex开源了一款梯度提升机器学习库CatBoost 小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

現(xiàn)在,人工智能正在為越來越多的計(jì)算功能提供支持,今天,俄羅斯搜索巨頭Yandex宣布,將向開源社區(qū)提交一款梯度提升機(jī)器學(xué)習(xí)庫CatBoost。它能夠在數(shù)據(jù)稀疏的情況下“教”機(jī)器學(xué)習(xí)。特別是在沒有像視頻、文本、圖像這類感官型數(shù)據(jù)的時候,CatBoost也能根據(jù)事務(wù)型數(shù)據(jù)或歷史數(shù)據(jù)進(jìn)行操作。

今天,CatBoost以兩種方式進(jìn)行了亮相。

首先,Yandex宣布,將在自有服務(wù)中使用這款新的框架替換原來的機(jī)器學(xué)習(xí)算法MatrixNet。MatrixNet一直被應(yīng)用在公司的很多業(yè)務(wù)上,比如排名、天氣預(yù)報、出租車和推薦業(yè)務(wù)。現(xiàn)在,業(yè)務(wù)正在逐步從MatrixNet切換到CatBoost上來,并將延續(xù)幾個月。

其次,Yandex將免費(fèi)提供CatBoost庫,任何希望在自己的程序中使用梯度提升技術(shù)的人員都可以在Apache許可證下使用這個庫。 Yandex機(jī)器智能研究主管Misha Bilenko在接受采訪時表示:“CatBoost是Yandex多年研究的巔峰之作。我們自己一直在使用大量的開源機(jī)器學(xué)習(xí)工具,所以是時候向社會作出回饋了。” 他提到,Google在2015年開源的Tensorflow以及Linux的建立與發(fā)展是本次開源CatBoost的原動力。

Bilenko補(bǔ)充說到,暫時還沒有計(jì)劃將CatBoost商業(yè)化,或以任何專利的形式將其閉源。 “這和競爭對手無關(guān),”他說,“我們很高興有競爭對手使用它”

長期以來,隨著Yandex的不斷發(fā)展,它一直在尋求提升俄語世界之外的國際地位。本次開源舉動不僅僅是Yandex對開源社區(qū)的承諾,而且也展示了Yandex希望成為大型科技公司與開發(fā)者社區(qū)發(fā)展中心的決心。

就像Google持續(xù)地?cái)U(kuò)展和更新Tensorflow一樣,今天的CatBoost版本是其第一個版本,以后將持續(xù)更新迭代。目前,這個庫主要有三個特點(diǎn):

“減少過度擬合”:這可以幫助你在訓(xùn)練計(jì)劃中取得更好的成果。它基于一種構(gòu)建模型的專有算法,這種算法與標(biāo)準(zhǔn)的梯度提升方案不同。

“類別特征支持”:這將改善你的訓(xùn)練結(jié)果,同時允許你使用非數(shù)字因素,“而不必預(yù)先處理數(shù)據(jù),或花費(fèi)時間和精力將其轉(zhuǎn)化為數(shù)字。”

“API??接口支持”:可以通過命令行或者基于Python或R的API接口來使用CatBoost,包括公式分析和訓(xùn)練可視化工具。

雖然目前有大量的庫可以利用梯度提升或其他解決方案來訓(xùn)練機(jī)器學(xué)習(xí)系統(tǒng),但Bilenko認(rèn)為,CatBoost相較其他大型公司使用的框架(如Yandex)的最大優(yōu)點(diǎn)是測試精準(zhǔn)度高。

“有很多機(jī)器學(xué)習(xí)庫的代碼質(zhì)量比較差,需要做大量的調(diào)優(yōu)工作,”他說,“而CatBoost只需少量調(diào)試,就可以實(shí)現(xiàn)良好的性能。這是一個關(guān)鍵性的區(qū)別。”

附CatBoost開源代碼地址: https://catboost.yandex/

文章原標(biāo)題《Yandex open sources CatBoost, a gradient boosting machine learning library》,作者:Ingrid Lunden,譯者:夏天,審校:主題曲。

文章為簡譯,更為詳細(xì)的內(nèi)容,請查看原文

總結(jié)

以上是生活随笔為你收集整理的俄罗斯最大搜索引擎Yandex开源了一款梯度提升机器学习库CatBoost的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯,歡迎將生活随笔推薦給好友。