文献记录(part67)--基于决策树模型重用的分布变化流数据学习
學(xué)習(xí)筆記,僅供參考,有錯必糾
關(guān)鍵詞:機器學(xué)習(xí) , 分布變化 , 流數(shù)據(jù) , 模型重用 , 集成學(xué)習(xí) , 動態(tài)環(huán)境
基于決策樹模型重用的分布變化流數(shù)據(jù)學(xué)習(xí)
摘要
在很多真實應(yīng)用中 , 數(shù)據(jù)以流的形式不斷被收集得到 . 由于數(shù)據(jù)收集環(huán)境往往發(fā)生動態(tài)變化 ,流數(shù)據(jù)的分布也會隨時間不斷變化 . 傳統(tǒng)的機器學(xué)習(xí)技術(shù)依賴于數(shù)據(jù)獨立同分布假設(shè) , 因而在這類分布變化的流數(shù)據(jù)學(xué)習(xí)問題上難以奏效 .
本文提出一種基于決策樹模型重用的算法進行分布變化的流數(shù)據(jù)學(xué)習(xí) . 該算法是一種在線集成學(xué)習(xí)方法 : 算法將維護一個模型庫 , 并通過決策樹模型重用機制更新模型庫 . 其核心思想是希望從歷史數(shù)據(jù)中挖掘與當(dāng)前學(xué)習(xí)相關(guān)的知識 , 從而抵御分布變化造成的影響 . 通過在合成數(shù)據(jù)集和真實數(shù)據(jù)集上進行實驗 , 我們驗證了本文提出方法的有效性.
引言
機器學(xué)習(xí)技術(shù)在諸多領(lǐng)域得到了廣泛應(yīng)用 , 包括圖像、視頻、語音、文本處理等 [1~3] . 傳統(tǒng)的機器學(xué)習(xí)技術(shù)假定數(shù)據(jù)分布是恒定的 , 但數(shù)據(jù)收集的環(huán)境通常是開放動態(tài)的 , 因而數(shù)據(jù)分布恒定這一假設(shè)往往難以滿足 . 特別在諸如天氣預(yù)測、股票價格預(yù)測、語音識別等真實應(yīng)用場景中 , 數(shù)據(jù)以流的形式不斷被在線得到 , 隨著時間不斷累積 , 數(shù)據(jù)分布往往會隨著收集環(huán)境的動態(tài)變化而不斷變化 . 傳統(tǒng)的機器學(xué)習(xí)算法及理論依賴于數(shù)據(jù)同分布假設(shè) , 難以適用于這類分布不斷變化的流數(shù)據(jù)問題 . 因而 , 針對分布變化的流數(shù)據(jù) , 如何設(shè)計性能良好且有理論保障的學(xué)習(xí)算法是非常重要的課題.
首先需要明確的是 ,
總結(jié)
以上是生活随笔為你收集整理的文献记录(part67)--基于决策树模型重用的分布变化流数据学习的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: java中间件技术有哪些(Java技术栈
- 下一篇: 文献记录(part68)--K- 近邻分