當(dāng)前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

LIME：算法讲解

發(fā)布時間：2023/12/18 编程问答 74 豆豆

生活随笔收集整理的這篇文章主要介紹了 LIME：算法讲解小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

一、簡介

?1. 主要用途

2. 樣例分析

二、基礎(chǔ)理論

1. 對解釋器算法的要求

2. 算法原理

3. 算法實(shí)現(xiàn)

4. 算法流程

三、優(yōu)缺點(diǎn)分析

優(yōu)點(diǎn)

缺點(diǎn)

一、簡介

????????LIME算法是Marco Tulio Ribeiro2016年發(fā)表的論文《“Why Should I Trust You?” Explaining the Predictions of Any Classi?er》中介紹的局部可解釋性模型算法。該算法可以用在文本類與圖像類的模型中，以分析模型提取到的特征是否符合直觀理解。

?1. 主要用途

? ? ? ? 在實(shí)際建模過程中，我們不僅需要使客戶能夠信服，同時也需要使自己信服。如果僅僅以數(shù)字，描述一個系統(tǒng)的性能，則顯得略有偏頗，比如神經(jīng)網(wǎng)絡(luò)普遍可以達(dá)到高性能的效果，但可解釋性低，因此如果能夠從模型本身的底層邏輯出發(fā)，以它的視角觀察事物，分析事物，解釋事物，便可以明確模型的性能為什么好，為什么不好。這種時候，就可以利用本文要介紹的LIME算法，全稱Local Interpretable Model-agnostic Explanations，可以理解為模型的解釋器。

2. 樣例分析

? ? ? ? ?一瓶葡萄酒的品質(zhì)將對售賣價格產(chǎn)生直接影響，通過分析其化學(xué)成分，即可明確某一瓶葡萄酒的品質(zhì)。通過LIME，從葡萄酒的可解釋特征中分析得出，當(dāng)alchol>11.4時將對其品質(zhì)產(chǎn)生正向影響，真正做到搞清楚模型為什么認(rèn)為好還是不好。

? ? ? ?根據(jù)一封郵件的文本內(nèi)容，判斷發(fā)信者是與“基督教“有關(guān)還是與”無神論教“有關(guān)，分類器本身達(dá)到了90%的準(zhǔn)確率。但是利用LIME解釋器，發(fā)現(xiàn)”無神論教“的重要特征，是”Posting“(郵件標(biāo)頭的一部分)，這個詞與無神論本身并沒有太多的聯(lián)系。這意味著盡管模型準(zhǔn)確率很高，但所學(xué)習(xí)到的特征是錯誤的。

二、基礎(chǔ)理論

1. 對解釋器算法的要求

可解釋性
????????解釋器的模型與特征都必須是可解釋的，像決策樹、線性模型因其嚴(yán)格的數(shù)學(xué)推導(dǎo)都是很適合拿來解釋的模型；而可解釋的模型必須搭配可解釋的特征，才是真正的可解釋性，讓不了解機(jī)器學(xué)習(xí)的人也能通過解釋器理解模型。

局部保真度
? ? ? ? 在實(shí)際情況中，解釋器不需要在全局上達(dá)到復(fù)雜模型的效果，但至少在局部上效果要很接近，而此處的局部代表我們想觀察的那個樣本的周圍。

泛化性強(qiáng)
????????這里所指的是與復(fù)雜模型無關(guān)，換句話說無論多復(fù)雜的模型，像是SVM或神經(jīng)網(wǎng)絡(luò)，該解釋器都可以工作，都能進(jìn)行可解釋性分析。

2. 算法原理

????????對于一個分類器（復(fù)雜模型），想用一個可解釋的模型（簡單模型如線性規(guī)劃），搭配可解釋的特征在全局上進(jìn)行分析是極其困難的，相反，如果我們能在某一局部的決策邊緣上驗(yàn)證其可解釋性，即可說明該分類器的優(yōu)越性能。

????????具體來說，我們從加粗的紅色十字樣本（待解釋樣本）周圍采樣，所謂采樣就是對原始樣本的特征做一些擾動，將采樣出的樣本用分類模型分類并得到結(jié)果（紅十字和藍(lán)色點(diǎn)），同時根據(jù)采樣樣本與加粗紅十字的距離賦予權(quán)重（權(quán)重以標(biāo)志的大小表示）。虛線表示通過這些采樣樣本學(xué)到的局部可解釋模型，在這個例子中就是一個簡單的線性分類器。在此基礎(chǔ)上，我們就可以依據(jù)這個局部的可解釋模型對這個分類結(jié)果進(jìn)行解釋了。

3. 算法實(shí)現(xiàn)

（1）目標(biāo)函數(shù)

????????解釋模型定義為模型g∈G，我們進(jìn)一步使用作為實(shí)例z與x之間的接近度，以定義x周圍的局部性。定義一個目標(biāo)函數(shù)ξ，這里的L函數(shù)作為一個度量，描述如何通過在局部定義中，g如何逼近f（復(fù)雜模型），在當(dāng)Ω(g)(解釋模型復(fù)雜度)足夠低可以被人類理解時，我們最小化L函數(shù)得到目標(biāo)函數(shù)的最優(yōu)解。LIME產(chǎn)生的解釋如下：

?(2)引入自適應(yīng)相似度后的目標(biāo)函數(shù)

? ? ? ? 考慮到離待解釋樣本距離不同的擾動樣本附加權(quán)重理應(yīng)不同，引入自適應(yīng)相似度，即optim-LIME的目標(biāo)函數(shù)如下：

?（3）最終函數(shù)

????????其中f(z)是擾動樣本在d維空間（原始特征）上的預(yù)測值，g(z’)則是在d’維空間（可解釋特征）上的預(yù)測值，然后以相似度作為權(quán)重，因此上述的目標(biāo)函數(shù)便可以通過線性回歸的方式進(jìn)行優(yōu)化。

4. 算法流程

宏觀來看：

? ? ? ? 首先，在待解釋的模型中取一個待解釋樣本，之后隨機(jī)生成擾動樣本，并以與待解釋樣本的距離作為標(biāo)準(zhǔn)附加權(quán)重，再將得到的結(jié)果作為輸入投入待解釋模型中，同時選擇在局部考察的待訓(xùn)練可解釋模型（如決策樹、邏輯回歸等等），最終即可訓(xùn)練出在可解釋特征維度上的可解釋性模型。?

微觀來看：

? ? ? ? ?選取待解釋樣本X，并轉(zhuǎn)換為可解釋特征維度上的樣本X’。

? ? ? ? 通過隨機(jī)擾動，得到其余在可解釋特征維度上的樣本Z’。

? ? ? ? ?將Z’恢復(fù)至原始維度，計算f（z）與相似度。

? ? ? ? ?利用自適應(yīng)相似度對各個樣本點(diǎn)進(jìn)行加權(quán)。

?????????以X’作為特征，f（z）作為標(biāo)準(zhǔn)訓(xùn)練局部可解釋模型（如圖虛線）。

三、優(yōu)缺點(diǎn)分析

優(yōu)點(diǎn)

? ? ? ? 1. 具有很強(qiáng)的通用性，性能優(yōu)越

????????LIME能夠兼容任何一種機(jī)器學(xué)習(xí)算法，具有廣泛的適用性。LIME除了能夠?qū)D像的分類結(jié)果進(jìn)行解釋外，還可以應(yīng)用到自然語言處理的相關(guān)任務(wù)中，如主題分類、詞性標(biāo)注等。

? ? ? ? 2. 針對性強(qiáng)，可塑性好

? ? ? ? LIME可以選取代表性樣本進(jìn)行訓(xùn)練，降低了工作量和難度，也能夠依照客戶靈活的需求進(jìn)行特殊場景的分析，如調(diào)節(jié)某一特征的權(quán)重，分析其變化對最終結(jié)果的影響程度。

缺點(diǎn)

? ? ? ? ?1. 局部性不可代表全局性

? ? ? ? LIME從局部出發(fā)訓(xùn)練可解釋性模型，當(dāng)全局決策范圍具有極其復(fù)雜的非線性時，局部線性區(qū)域范圍小，僅能對極少的樣本進(jìn)行可解釋分析。

? ? ? ? 2. 時間成本高

? ? ? ? 對每一個待測樣本進(jìn)行可解釋分析時，需重新訓(xùn)練對應(yīng)的可解釋模型，訓(xùn)練時間長。

總結(jié)

以上是生活随笔為你收集整理的LIME：算法讲解的全部內(nèi)容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯，歡迎將生活随笔推薦給好友。

算法
LIME

上一篇： PLM与ERP的区别
下一篇：企鹅牵条狗以为就能飞合体新生潜力如何

日韩av黄I国产麻豆传媒I国产91av视频在线观看I日韩一区二区三区在线看I美女国产在线I麻豆视频国产在线观看I成人黄色短片

编程问答

LIME：算法讲解

一、簡介

?1. 主要用途

2. 樣例分析

二、基礎(chǔ)理論

1. 對解釋器算法的要求

2. 算法原理

3. 算法實(shí)現(xiàn)

4. 算法流程

三、 優(yōu)缺點(diǎn)分析

優(yōu)點(diǎn)

缺點(diǎn)

總結(jié)

三、優(yōu)缺點(diǎn)分析