當前位置：首頁 >

代价敏感多标签主动学习的代码开发跟踪

發布時間：2024/8/23 50 豆豆

生活随笔收集整理的這篇文章主要介紹了代价敏感多标签主动学习的代码开发跟踪小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

1 簡介

代價敏感多標簽主動學習目前是閔老師小組正在進行的一個開發項目，目的是將代價敏感和主動學習思想應用到多標簽學習中。整個Java代碼涵蓋了很多技術：并行計算、batch處理。本文就是在學習這個代碼后的一些總結。學習方法采用的至頂向下。

該類為測試的主類。

（1）Cmale：構造方法
step 1. 讀數據文件構建dataset
step 2. 計算實例的代表性
step 3. 準備輸出文件
（2）initializeMultiLabelAnn：初始化多標簽神經網絡
利用dataset，全連接層節點，并行層節點構建多標簽神經網絡
（3）boundedTrain：給定輪數的上界、下界進行訓練
（4）boundedEmphasizedTrain：給定訓練輪數的上界, 進行針對性 (增量) 訓練
（5）computeInstanceRepresentativeness：基于密度峰值來計算實例的代表性
（6）twoStageLearn：兩階段學習: 冷啟動 (僅考慮對象代表性與標簽稀少性) 與 正常訓練 (考慮標簽不確定性) 注意: 這里是算法的核心, 需要改策略
（7）randomSelectionLearn: 隨機選擇標簽的學習, 作為對比算法. 如果我們的策略不比隨機策略好, 就沒有意義

本類讀入 arff 文件, 存儲成一個數據矩陣和標簽矩陣

本類的神經網絡支持全連接層和并行連接層. 輸入端口數為條件屬性數, 輸出端口數為標簽數的 2 倍.

dataset: 數據集

train: 訓練一輪, 僅使用被查詢過的對象
emphasizedTrain: 訓練一輪, 被強調的數據多次訓練, 支持增量學習. 這是因為主動學習過程是增量學習
test: 使用所有數據測試
computeLabelUncertaintyMatrix: 計算標簽不確定性矩陣注意: 這是核心方法, 以后可能要修改策略
getMostUncertainLabelIndices: 獲得不確定性最高的幾個標簽, 包括對象下標 (一個) 與標簽下標 (多個) 注意: 以后可能修改, 以支持多個對象的批量選取, 縮短程序運行時間
getUncertainLabelBatch: 大家好, 我就是上一條說的 “以后”
forward: 神經網絡標準的前向操作
backPropagation: 神經網絡標準的回饋操作

以上是生活随笔為你收集整理的代价敏感多标签主动学习的代码开发跟踪的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。