论文笔记:基于特征选择与增量学习的非侵入式电动自行车充电辨识方法
目錄
1. 前言
2. 背景
3. 電動(dòng)自行車充電負(fù)荷特征
3.1 特征分析
3.2 排序與選擇
4. OCSVM
5. 增量式學(xué)習(xí)
6. 實(shí)驗(yàn)驗(yàn)證
6.1 樣本采集和事件監(jiān)測(cè)
6.2 特征選擇
6.3 增量學(xué)習(xí)及負(fù)荷辨識(shí)驗(yàn)證
7. 總結(jié)和思考
1. 前言
????????本文是對(duì)以下論文的解讀筆記。注意在下文中“該論文”和“本文”是指向不同的對(duì)象。文中著色高亮部分為一些有疑問的地方或者本文作者所加的解讀comment。最后一章也給出了本文作者的關(guān)于這個(gè)問題的一些思考。
????????施雨松等:基于特征選擇與增量學(xué)習(xí)的非侵入式電動(dòng)自行車充電辨識(shí)方法, 電力系統(tǒng)自動(dòng)化 Vol.45 No.7 Apr.10.2021
????????論文摘要:為實(shí)現(xiàn)從電網(wǎng)側(cè)監(jiān)測(cè)電動(dòng)自行車違規(guī)停放充電行為,減少電動(dòng)自行車充電火災(zāi)事故,在非侵入式負(fù)荷識(shí)別的基礎(chǔ)上,提出一種基于特征選擇與增量學(xué)習(xí)的電動(dòng)自行車充電辨識(shí)方法。首先,根據(jù)電動(dòng)自行車充電實(shí)測(cè)電流波形,分析負(fù)荷特性并列舉15種負(fù)荷特征。通過半監(jiān)督Fisher計(jì)分與最大信息系數(shù)(MIC: Maximal Information Coefficient)量度特征辨別度與冗余度,采用貪心搜索算法對(duì)特征重要性排序并結(jié)合排序與辨識(shí)結(jié)果選擇辨識(shí)準(zhǔn)確性最高的特征子集。然后,基于一類支持向量機(jī)增量學(xué)習(xí)方法,實(shí)現(xiàn)電動(dòng)自行車負(fù)荷辨識(shí)與分類器在線學(xué)習(xí)。最后,通過實(shí)測(cè)數(shù)據(jù)進(jìn)行試驗(yàn),結(jié)果表明文中方法可以對(duì)電動(dòng)自行車充電行為準(zhǔn)確辨識(shí),驗(yàn)證了算法的有效性。
2. 背景
????????近年來,電動(dòng)自行車成為城鎮(zhèn)居民短途出行的主要交通工具之一,同時(shí)其相關(guān)安全問題也日益突出,其中電動(dòng)自行車引發(fā)的火災(zāi)呈多發(fā)、頻發(fā)趨勢(shì)。2018 年,公安部發(fā)布《關(guān)于規(guī)范電動(dòng)車停放充電加強(qiáng)火災(zāi)防范的通告》,明確指出規(guī)范電動(dòng)自行車停放充電行為,嚴(yán)厲查處違規(guī)停放充電行為,嚴(yán)禁在建筑內(nèi)的共用走道、樓梯間、安全出口處等公共區(qū)域以及個(gè)人房間內(nèi)為電動(dòng)自行車充電[1]。嚴(yán)格監(jiān)管電動(dòng)自行車充電行為可以有效減少火災(zāi)事故,但由于電動(dòng)自行車充電行為存在隨機(jī)性、隱蔽性(用另一個(gè)專業(yè)術(shù)語來說叫做“非合作性”),僅依靠人力巡查電動(dòng)自行車違規(guī)停放充電行為,效率低并且漏檢率高。隨著智能電網(wǎng)技術(shù)的快速發(fā)展,基于非侵入式負(fù)荷監(jiān)測(cè)與分解方法實(shí)現(xiàn)電網(wǎng)側(cè)電動(dòng)自行車充電行為辨識(shí)具有良好的發(fā)展前景。
????????到目前為止的NILM的研究主要針對(duì)多類電器負(fù)荷分解,尚無針對(duì)電動(dòng)自行車或一類異常電器的辨識(shí)方法研究。
????????本文以非侵入式負(fù)荷監(jiān)測(cè)為背景,針對(duì)電動(dòng)自行車充電一類負(fù)荷,采用半監(jiān)督特征選擇方法,分析15 類負(fù)荷特征的辨別度與冗余度,基于貪心搜索與一類支持向量機(jī)(one-class support vector machine,OCSVM)進(jìn)行排序并提取分類正確率最高的特征子集。考慮電動(dòng)自行車品類繁多但每戶電動(dòng)自行車數(shù)量較少,結(jié)合增量學(xué)習(xí)與OCSVM 進(jìn)行識(shí)別過程中的在線學(xué)習(xí),在保持泛化能力的同時(shí)加強(qiáng)針對(duì)性。
????????非侵入式負(fù)荷識(shí)別的關(guān)鍵步驟為事件檢測(cè)、特征選擇和負(fù)荷識(shí)別。當(dāng)然,通常在事件檢測(cè)之前還有一個(gè)數(shù)據(jù)預(yù)處理的步驟。本文主要聚焦于特征選擇和負(fù)荷識(shí)別這兩個(gè)階段。事件檢測(cè)與常規(guī)的NILM是共通的。
????????In short, 本論文的精華就是以下三個(gè)要點(diǎn):
3. 電動(dòng)自行車充電負(fù)荷特征
3.1 特征分析
????????不同的電器擁有不同的負(fù)荷特征。居民用電電壓較為穩(wěn)定,負(fù)荷特征差異主要體現(xiàn)在電流波形不同,電動(dòng)自行車充電實(shí)測(cè)電流波形如圖1 所示。
????????與普通各類家用電器電流波形相比,電動(dòng)自行車充電電流波形非線性程度較大、畸變嚴(yán)重,瞬時(shí)功率峰值較高,啟動(dòng)時(shí)有短時(shí)的脈沖電流與延遲時(shí)間。為了具體反映負(fù)荷特性,本文選取了15 個(gè)負(fù)荷特征作為初始特征集,特征提取方法不再詳述,特征編號(hào)與名稱如表1 所示。
?
????????以上特征中C11~C13 為V-I 軌跡的3 個(gè)量化參數(shù),V-I 軌跡是以一周期的電壓與電流標(biāo)幺值分別作為橫、縱坐標(biāo)繪制的曲線。V-I 軌跡可以有效反映電力電子型負(fù)荷特性,其中C11 表征負(fù)荷非線性程度,C12 體現(xiàn)負(fù)荷內(nèi)部元件的導(dǎo)通性,C13 表示負(fù)荷電流與電壓峰值相位差。電動(dòng)自行車V-I 軌跡如圖A1 所示。?
圖A1 電動(dòng)自行車V-I軌跡圖
3.2 排序與選擇
????????負(fù)荷辨識(shí)并非特征類型越多越好,其中辨別度較低的特征會(huì)干擾判別,冗余度較高的特征集難以有效提高辨識(shí)精確性,同時(shí)又增加了計(jì)算成本。因此,需要選擇辨別度高、冗余度低的特征子集作為辨識(shí)依據(jù)。
????????本論文基于半監(jiān)督Fisher計(jì)分和最大信息系數(shù),以辨別度最大、冗余度最小作為目標(biāo)從上節(jié)所示15個(gè)候選特征中選取合適的子集,其過程如下所示:
????????第1個(gè)選擇的特征F1按如下方式選取:
????????????????
?????????其中di為第i個(gè)特征的辨別度,本論文中選用前述半監(jiān)督Fisher計(jì)分來表征特征的辨別度;ri表示第i 個(gè)特征與其余所有特征的冗余度均值,本論文中選用最大信息系數(shù)(maximal information coefficient,MIC)來衡量兩個(gè)特征之間的相關(guān)性(也即它們之間的冗余度,比如說相關(guān)性為1表示由其中一個(gè)完全可以推得另一個(gè),那么作為辨識(shí)特征來說其中有一個(gè)就是完全冗余的)。
????????第n(n>1)個(gè)選擇的特征Fn為:???????????????????????
???????????????????????
????????式中:Fs 為已入選特征子集;r(Fi∪Fs)為第i個(gè)特征與已入選特征的冗余度均值.
????????以上選擇過程得到了一個(gè)按照辨別度從高到低的有序的特征子集。然后分別基于特征子集 進(jìn)行訓(xùn)練并測(cè)試,得到在識(shí)別性能與子集大小之間取得最佳trade-off的最優(yōu)特征子集。
????????以上描述中“半監(jiān)督Fisher計(jì)分”和“最大信息系數(shù)”。。。呃。。。一知半解所以暫時(shí)略過,等補(bǔ)完課搞明白了再來報(bào)告^-^.
4. OCSVM
本論文把電動(dòng)自動(dòng)車充電識(shí)別看作是一分類問題,即判斷“是”還是“不是”。把沒有電動(dòng)自行車充電時(shí)的日常家用電器工作的狀態(tài)定義為“negative”狀態(tài),而電動(dòng)自行車充電疊加在日常家用電器工作的狀態(tài)定義為“positive”狀態(tài)(當(dāng)然,反過來定義也可以)。OCSVM算法的目標(biāo)就是要在發(fā)生電器投入事件(注意,在本問題中其實(shí)不太需要關(guān)心切出事件。畢竟檢測(cè)的目的在于及時(shí)提出警告并中止充電行為)時(shí),識(shí)別出當(dāng)前投入的電器“是電動(dòng)自行車”還是“非電動(dòng)自行車”。
????????關(guān)于OCSVM的介紹有很多參考文獻(xiàn)和網(wǎng)絡(luò)資源(比如說,我之前寫的以下兩篇博客(Ref1, Ref2),其實(shí)就是為了解讀本論文而做的準(zhǔn)備工作^-^),本文重點(diǎn)不在這里,所以這里就不再贅述了。
5. 增量式學(xué)習(xí)
????????籠統(tǒng)地說,增量學(xué)習(xí)是指算法在保留已有知識(shí)的同時(shí)不斷從新樣本中學(xué)習(xí)新的知識(shí)。
????????OCSVM本身并不具備增量學(xué)習(xí)能力,基于協(xié)同訓(xùn)練思想,結(jié)合OCSVM和增量學(xué)習(xí)的電動(dòng)自行車充電辨識(shí)的學(xué)習(xí)過程如下:
????????假設(shè)電動(dòng)自行車初始訓(xùn)練樣本集為L,x 為此刻從用戶總線提取到的未知標(biāo)簽的負(fù)荷樣本。
????????從訓(xùn)練樣本集L 中可重復(fù)取樣得到3 個(gè)訓(xùn)練樣本集L1、L2 和L3,分別通過核函數(shù)不同的OCSVM1、OCSVM2 和OCSVM3 訓(xùn)練得到3 個(gè)不同的分類器Model1、Model2 和Model3。
????????3 個(gè)分類器對(duì)樣本x 進(jìn)行辨識(shí)分類,采用集成學(xué)習(xí)中的多數(shù)投票(任意2 個(gè)分類器分類結(jié)果相同)判斷是否為電動(dòng)自行車負(fù)荷樣本。
????????若樣本x 被確認(rèn)為電動(dòng)自行車負(fù)荷樣本,則只保留3 個(gè)訓(xùn)練樣本集的支持向量,并增加樣本x 構(gòu)成新的訓(xùn)練樣本集L′1 、L′2 和L′3,然后利用更新后的訓(xùn)練樣本集重新訓(xùn)練,從而更新3 個(gè)分類器。
????????若樣本x 被確認(rèn)為不是電動(dòng)自行車負(fù)荷樣本,則等待下一樣本。
????????如此每次獲得新的負(fù)荷樣本時(shí)重復(fù)迭代更新3 個(gè)分類器,實(shí)現(xiàn)增量學(xué)習(xí)。更新訓(xùn)練樣本集時(shí),只保留支持向量,可避免新增樣本積累導(dǎo)致訓(xùn)練計(jì)算量劇增,同時(shí)保留泛化能力。
?????? 【問】為什么要采取增量學(xué)習(xí)過程呢?
初始訓(xùn)練是離線式訓(xùn)練,訓(xùn)練集只包含有限種類的電動(dòng)自行車的有限樣本數(shù)據(jù),而實(shí)際上各家各戶的電動(dòng)自行車(如果有的話)型號(hào)可能千差萬別。所以不太可能基于初始樣本集訓(xùn)練出來的模型能夠取得較好的識(shí)別效果。利用增量學(xué)習(xí)可以在監(jiān)測(cè)終端安裝以后根據(jù)新的數(shù)據(jù)樣本再對(duì)當(dāng)前家庭進(jìn)行針對(duì)性的在線學(xué)習(xí)。
6. 實(shí)驗(yàn)驗(yàn)證
6.1 樣本采集和事件監(jiān)測(cè)
????????為驗(yàn)證本文方法的有效性,在實(shí)際家庭入戶總線處同步采集電壓、電流數(shù)據(jù)(采樣率是多少?只采集電流和電壓的話,功率類信息就根據(jù)瞬時(shí)電流、電壓進(jìn)行計(jì)算?)。測(cè)試過程中記錄電動(dòng)自行車負(fù)荷接入時(shí)間(有標(biāo)記)。其他家用電器在測(cè)試過程中隨機(jī)開關(guān)且不記錄接入時(shí)間(無標(biāo)記)。同時(shí),本文算法是對(duì)電動(dòng)自行車充電負(fù)荷接入事件的監(jiān)測(cè),只需要用到其開啟1 s 內(nèi)的電壓、電流數(shù)據(jù)。實(shí)驗(yàn)時(shí)經(jīng)觀察發(fā)現(xiàn),同一電池在其電量不足和滿電狀態(tài)下充電,開啟瞬間的電流波形是相近的,經(jīng)過幾秒后才進(jìn)入穩(wěn)定狀態(tài),因此可以不用考慮電池在充電過程的不同階段充電電流均存在不同的問題。
????????本文通過滑動(dòng)窗雙邊累積和算法(參見Ref)進(jìn)行事件檢測(cè),采用有功功率作為檢測(cè)信號(hào)(如上所述,有功功率應(yīng)該是根據(jù)所采的電流、電壓數(shù)據(jù)進(jìn)行計(jì)算而得)。某次實(shí)驗(yàn)中,用戶入戶線處測(cè)得的有功功率信號(hào),即事件檢測(cè)算法的檢測(cè)信號(hào)如附錄B 圖B2 所示,可見居民用戶有功功率波動(dòng)較小,電動(dòng)自行車充電負(fù)荷接入時(shí)功率有明顯的階躍(但是,從下圖怎么能看出這點(diǎn)來呢?存疑)。根據(jù)實(shí)際調(diào)試情況設(shè)置相關(guān)參數(shù)如下:平均值計(jì)算窗口長度Nm=6,暫態(tài)過程檢測(cè)窗口長度Nd=4,噪音β=10,閾值h=120,可有效減少其他負(fù)荷噪音干擾。本文僅關(guān)注電動(dòng)自行車負(fù)荷接入事件檢測(cè)的準(zhǔn)確性,根據(jù)檢測(cè)統(tǒng)計(jì)結(jié)果,事件檢測(cè)算法的電動(dòng)自行車負(fù)荷接入事件漏檢率低于0.5%,且得到的事件發(fā)生時(shí)刻準(zhǔn)確,時(shí)間偏差不大于0.1s(所以,推測(cè)采樣率應(yīng)該至少為數(shù)十Hz吧)。利用事件發(fā)生時(shí)刻前后采樣數(shù)據(jù)提取負(fù)荷特征并形成負(fù)荷樣本,分為有標(biāo)記樣本(電動(dòng)自行車)與無標(biāo)記樣本(其他家電)。
圖B2-有功功率信號(hào)
6.2 特征選擇
????????基于前面第三章所述方法進(jìn)行特征排序和特征子集選擇。樣本數(shù)量100,包括30個(gè)有標(biāo)簽樣本(對(duì)應(yīng)電動(dòng)自行車充電投入事件)和70個(gè)無標(biāo)簽樣本(對(duì)應(yīng)其它事件),劃分為訓(xùn)練集和測(cè)試集(其中有標(biāo)簽樣本比例均與原樣本集相同),測(cè)試集中各類型號(hào)的電動(dòng)自行車和家電樣本所占比例與原始采樣樣本集分布基本一致。標(biāo)準(zhǔn)Fisher 計(jì)分與半監(jiān)督Fisher 計(jì)分的15 個(gè)特征的辨別度計(jì)算結(jié)果對(duì)比如圖2 所示。
????????由上圖可知,半監(jiān)督Fisher積分的分辨度遠(yuǎn)遠(yuǎn)好于標(biāo)準(zhǔn)Fisher計(jì)分,其中C12的辨識(shí)度最高(疑上圖顏色標(biāo)識(shí)錯(cuò)誤,是不是恰好相反啊?從圖中來看難道不是標(biāo)準(zhǔn)Fisher計(jì)分的特征辨識(shí)度要遠(yuǎn)遠(yuǎn)好于半監(jiān)督Fisher積分嘛?)
????????基于MIC 進(jìn)行特征集冗余度量度,測(cè)試樣本集與上文相同,計(jì)算結(jié)果為15 階矩陣,表示15 類特征之間的相關(guān)程度。根據(jù)特征辨別度與冗余度計(jì)算結(jié)果,基于貪心搜索算法進(jìn)行特征排序,其中參數(shù)α 為0.5。然后基于OCSVM訓(xùn)練結(jié)果可以得到如下圖所示結(jié)果:
圖3 特征排序及辨識(shí)結(jié)果
????????由上圖可知,最優(yōu)特征子集的大小為9,即取特征辨識(shí)度從高到底的9個(gè)特征作為特征子集時(shí)的辨識(shí)性能最好,此時(shí)辨識(shí)正確率達(dá)到96.15%。作為對(duì)比,論文還將以上方法與傳統(tǒng)的SVM模型以及BP神經(jīng)網(wǎng)絡(luò)模型進(jìn)行了對(duì)比,結(jié)果表明本論文所推薦的方法綜合表現(xiàn)最優(yōu)(雖然僅比BP神經(jīng)網(wǎng)絡(luò)模型只是稍好一丟丟^-^,所以是否適合于實(shí)際工程應(yīng)用還要看實(shí)現(xiàn)復(fù)雜度等其它方面的因素)。?
?
6.3 增量學(xué)習(xí)及負(fù)荷辨識(shí)驗(yàn)證
????????根據(jù)第5章所述方法實(shí)施實(shí)際環(huán)境下的實(shí)驗(yàn)。
????????初始訓(xùn)練樣本集包括70 個(gè)有標(biāo)簽樣本(是前文提到的訓(xùn)練樣本集嗎?前面說的只有30個(gè)有標(biāo)簽樣本,從下文來看應(yīng)該不是),通過可重復(fù)采樣得到的3 個(gè)訓(xùn)練樣本集樣本數(shù)為30。增量學(xué)習(xí)樣本集(其實(shí)就是對(duì)應(yīng)以下的三十輪的學(xué)習(xí),每得到一個(gè)新的樣本數(shù)據(jù)且判定為電動(dòng)自行車充電事件就學(xué)習(xí)一次。因此30次學(xué)習(xí)就對(duì)應(yīng)著30個(gè)有標(biāo)簽樣本)包括30個(gè)有標(biāo)簽樣本,測(cè)試樣本集包括30 個(gè)有標(biāo)簽樣本和100 個(gè)無標(biāo)簽樣本。模擬某戶家庭僅擁有一輛電動(dòng)自行車的情況,增量學(xué)習(xí)樣本集與測(cè)試樣本集中的有標(biāo)簽樣本為同一輛電動(dòng)自行車多次采集所得樣本。為驗(yàn)證本文方法的有效性,分類器每學(xué)習(xí)一次就對(duì)測(cè)試樣本集進(jìn)行一次辨識(shí),測(cè)試結(jié)果如圖4 所示。
????????由上圖可知,
7. 總結(jié)和思考
????????本文以非侵入式負(fù)荷監(jiān)測(cè)為基礎(chǔ),提出了一種基于特征選擇與OCSVM 增量學(xué)習(xí)的電動(dòng)自行車充電辨識(shí)方法。低辨識(shí)度特征與高冗余度特征集會(huì)干擾算法辨識(shí),通過半監(jiān)督特征選擇方法量度辨識(shí)度與冗余度,充分挖掘無標(biāo)簽樣本信息,采用貪心搜索算法對(duì)特征重要性排序,并選擇辨識(shí)效果最佳的特征子集。另外,賦予OCSVM 算法增量學(xué)習(xí)能力,解決初始分類器對(duì)于陌生型號(hào)電動(dòng)自行車負(fù)荷樣本辨識(shí)正確率較低的問題。通過實(shí)測(cè)數(shù)據(jù),驗(yàn)證了本文所提方法的有效性。半監(jiān)督特征選擇方法不僅降低了算法的計(jì)算成本,而且提高了辨識(shí)正確率。增量學(xué)習(xí)OCSVM 算法有效降低了電動(dòng)自行車錯(cuò)誤拒絕率,提高了算法整體性能。下一步,將針對(duì)算法辨識(shí)與學(xué)習(xí)速度進(jìn)行研究,進(jìn)一步提高算法實(shí)用性。同時(shí),本文方法也可推廣應(yīng)用于其他特殊或異常負(fù)荷監(jiān)測(cè)中。
????????My comment:
????????基于非侵入式負(fù)荷監(jiān)測(cè)與分解方法實(shí)現(xiàn)電網(wǎng)側(cè)電動(dòng)自行車充電行為辨識(shí)有兩種路線,第一是基于傳統(tǒng)的NILM的思路,把電動(dòng)自行車當(dāng)作另外一種“家用”電器進(jìn)行識(shí)別;第二是把電動(dòng)自行車充電當(dāng)作是一種異常事件來處理。兩種思路導(dǎo)致的具體策略迥然不同。本論文討論的是第二種路線。
????????按照第一種路線的話,因?yàn)閮H僅是家用電器的種類增加了一種而已,因此對(duì)傳統(tǒng)的NILM算法處理管道不需要做什么改變,僅僅是用于識(shí)別的特征庫等追加對(duì)應(yīng)于電動(dòng)自行車的識(shí)別特征即可。這種路線的好處在于是不需要重新進(jìn)行算法開發(fā),只要對(duì)原有的NILM系統(tǒng)進(jìn)行適當(dāng)升級(jí)即可。甚至升級(jí)后的系統(tǒng)將來可以直接移植到專用電動(dòng)自行車集中充電站的監(jiān)測(cè)管理。
????????按照第二種路線,只需要區(qū)分“是”還是“否”,不需要識(shí)別出具有什么時(shí)候有哪些電器在使用,可以與傳統(tǒng)的NILM相對(duì)獨(dú)立地進(jìn)行處理。但是需要重新開發(fā)算法,只有事件檢測(cè)這一部分是可以和原NILM系統(tǒng)共用。
????????電動(dòng)自行車充電檢測(cè)與常規(guī)的NILM在實(shí)時(shí)性的要求方面有所區(qū)別(需要在路線選擇和算法設(shè)計(jì)中考慮)。電動(dòng)自行車違規(guī)充電是非法事件,檢測(cè)的目的是及時(shí)制止以防患于未然,所以對(duì)于實(shí)時(shí)性要求比較高。而常規(guī)的NILM只是要確切地辨識(shí)出在什么時(shí)候有什么電器有多大功耗,對(duì)于實(shí)時(shí)性的要求相對(duì)較低(取決于具體的業(yè)務(wù)要求)。
??? 當(dāng)前的研究的重點(diǎn)在于違規(guī)充電檢測(cè),以后如果基礎(chǔ)設(shè)施建設(shè)跟上了,違規(guī)充電可能自然而然地就消失了,重點(diǎn)可能需要轉(zhuǎn)向正常的集中充電站的充電監(jiān)測(cè)。。。
Ref1:?論文筆記:Support vector domain description(Tax,Duin1999)_chenxy_bwave的專欄-CSDN博客https://blog.csdn.net/chenxy_bwave/article/details/120906276Ref2:?
論文筆記:Support Vector Method For Novelty Detection(Sch?lkopf)https://blog.csdn.net/chenxy_bwave/article/details/120885445https://blog.csdn.net/chenxy_bwave/article/details/120885445
總結(jié)
以上是生活随笔為你收集整理的论文笔记:基于特征选择与增量学习的非侵入式电动自行车充电辨识方法的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 百度通用文字识别离线SDK部署(c#)
- 下一篇: idea启动慢