日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

从点到线:逻辑回归到条件随机场

發布時間:2024/7/5 编程问答 33 豆豆
生活随笔 收集整理的這篇文章主要介紹了 从点到线:逻辑回归到条件随机场 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

開篇高能預警!本文前置知識:

1、理解特征函數/能量函數配分函數的概念及其無向圖表示,見《邏輯回歸到受限玻爾茲曼機》和《解開玻爾茲曼機的封印》;

2、理解特征函數形式的邏輯回歸模型,見《邏輯回歸到最大熵模型》。

?

從邏輯回歸出發,我們已經經過了樸素貝葉斯、淺層神經網絡、最大熵等分類模型。顯然,分類模型是不考慮時間的,僅僅計算當前的一堆特征對應的類別。因此,分類模型是“點狀”的模型。

?

想一下,如果我們有一個詞性標注(POS)的任務,在這個任務中,類別有動詞、名詞、形容詞、副詞、介詞、連詞等有限個類別。樣本呢,當然就是自然語言序列啦,例如“夕小瑤喜歡 狗狗”這個序列就對應著“名詞 動詞 名詞”這三個對應類別。

?

這時我們如果用“點狀”模型,也就是分類模型來做這個任務,會產生什么現象呢?

假如我們選取的特征就是當前位置詞,那么我們將分類器訓練完成后,分類器遇到“夕小瑤”就會輸出“名詞”這個類別,也就是說它是不考慮上下文的,預測每個詞的詞性的時候才不會考慮整個句子的情況呢。在這里簡單例子中看似沒有什么影響,然而實際上非常多的詞在不同的句子中會表現出不同的詞性。比如“谷歌”一詞,在“我今天參觀了谷歌”中就是名詞,在“你谷歌一下”中就是動詞。可以看出,詞性不僅取決于它自己,還取決于它的上下文(它兩邊的詞)!

?

那么,有沒有可能讓邏輯回歸、樸素貝葉斯這類點狀模型利用好上下文信息呢?最容易想到的做法就是將上下文信息編碼成特征啦!

?

比如加入當前詞的2-gram上下文作為特征,這時在“你谷歌一下”中去預測“谷歌”的詞性的時候,特征就是三維的:1、“谷歌”2、“你 谷歌”3、“谷歌 一下”。而在“我今天參觀了谷歌”中,特征是1、“谷歌”2、“了 谷歌”3、“谷歌 <EOS>”這樣就能根據不同的特征值在不同的句子中更精確的分類“谷歌”的詞性啦~

在《邏輯回歸到最大熵模型》中,小夕詳細講了如何將邏輯回歸的傳統形式轉換成特征函數/能量函數描述的形式,而如《解開玻爾茲曼機的封印》所示,這種形式很容易畫成有向圖或無向圖的形式:

?

(上面白色圈圈是類別,下面灰色圈圈是各個特征,小黑框表示這一類別-特征對的能量函數/特征函數)

?

問題來了。對于一些更復雜的句子,可能決定某個詞的詞性的關鍵詞距離該詞有好長的距離,那怎么辦呢?難道要擴展到10gram?

我們知道,ngram越長,訓練數據就越稀疏,導致模型容易過擬合,泛化能力明顯變差。顯然點狀的機器學習模型是很難在當前分類點利用到長距離信息的,也就是說,其最多能通過加入短距離上下文特征來做到局部最優分類,而無法做到整個序列的最優分類

?

顯然吶,自然語言文本的詞性標注任務本來就是個“線狀”的任務,你非要用“點狀”的模型去做,肯定很差勁啦~那么我們能不能基于邏輯回歸這個經典的判別式點狀分類器來改良成“線狀”,或者說“鏈狀”模型呢?如果讓你去改造,你會怎么改呢?

?

最簡單的做法當然就是將序列前一時刻/位置的輸出連到當前時刻到輸出阿,也就是同時用當前時刻的輸入前一時刻的輸出來決定當前時刻的輸出(類別),畫出圖來就是:

?

(當然啦,這里白色圈圈依然代表類別,灰色圈圈代表特征。為了畫圖簡單,這里只畫出了一個灰色圈圈(三個特征的時候應該在每個時刻畫出三個灰色圈圈哦))

?

看,是不是超級簡單的就改完了呢?這樣在判斷每一時刻的類別的時候就會不得不去參考前一時刻的類別,而參考前一時刻的類別的時候就隱含的包含了更早時刻的類別,這樣就把整個句子串起來啦。

畫起來容易,但是這個模型該如何用數學語言描述呢?

?

回顧一下可以直接畫出上面邏輯回歸的無向圖的邏輯回歸假設函數:

擴展到多個類別的話,就是:

?

?

從假設函數也可以看出,邏輯回歸是個點狀模型,當前時刻的類別預測不依賴任何其他時刻。

?

那么根據上面我們畫的判別式鏈狀模型圖,我們唯一需要做的就是加入前一時刻y與當前時刻y的特征函數就可以啦~所以假設函數就很簡單的變為了:

?

?

只是看起來有點長而已,而本質上還不是用特征函數描述了我們畫的線狀圖嘛~

仔細觀察,可以發現相比較點狀模型,鏈狀模型考慮了全部時間點,對全部時間點下的每個舊y與當前y,以及每個當前x與當前y做了求和,進而通過配分函數Z算出了整個序列的條件概率!注意對比邏輯回歸的假設函數,邏輯回歸的各個時間點是相互獨立的,而這個鏈狀模型則是統一考慮所有時間點,因此是基于整個序列去做每個單詞的詞性預測

?

這個看似復雜,實則至簡的鏈狀模型就是“線性鏈條件隨機場(CRF)”。實際上,線性鏈的條件隨機場也是使用最廣泛的條件隨機場,幾乎成了條件隨機場的代名詞。

?

這個模型的訓練方法與隱馬爾可夫模型是一樣的,都是基于最大化似然函數的方法,方法已經在《HMM(下)》中講解啦,在此不再贅述。當然啦,小夕只講了最理想的情況,也就是訓練集中既有X(觀測序列),也有Y(隱狀態序列)的情況。對于無法得到隱狀態序列的情況,可以使用《EM算法》來迭代訓練,在這里叫做BaumWelch算法,有興趣的同學自行了解,這里不再展開啦。

?

誒?還有一個問題!雖然CRF的假設函數可以直接得到當前序列的每種可能的詞性標注序列的概率,但是如果要枚舉出所有可能的詞性序列再找最大概率的那個詞性序列的話,顯然是指數爆炸的。對此有維特比算法進行優化,也已在《HMM(下)》中詳細講解過啦。在此不再贅述。值得一提,維特比算法的本質即動態規劃

?

看,是不是感覺一切都是一通百通了呢?這么看來條件隨機場真的是沒有新奇的東西,僅僅是用特征函數的老辦法來將人人都能想到的前后兩個時刻的y連起來,就結束了,結束了,束了,了。。

?

總結

以上是生活随笔為你收集整理的从点到线:逻辑回归到条件随机场的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。

主站蜘蛛池模板: 老子影院午夜伦不卡大全 | 欧美日本黄色 | 久操精品视频 | 蜜桃色999 | www.国产精品| 日韩av手机在线免费观看 | 重囗另类bbwseⅹhd | 99精品乱码国产在线观看 | 狠狠综合 | 亚洲精品网站在线观看 | 日本久久久久 | 成人片黄网站色大片免费毛片 | 胸网站 | 男女羞羞无遮挡 | 日韩欧美亚洲 | 成人黄色视屏 | 亚洲成熟丰满熟妇高潮xxxxx | 久久国产精品免费视频 | 都市激情 自拍偷拍 | 日韩电影在线一区 | 国产精品jizz在线观看无码 | 中文字幕区 | аⅴ资源新版在线天堂 | 九九久久网 | 久久久久人妻精品色欧美 | 日韩精彩视频 | 秋霞影院午夜伦 | 国产资源av| 欧美在线一区二区 | 三上悠亚中文字幕在线播放 | 国产三区精品 | 欧美yyy | 免费看麻豆| 亚洲精品久久久久久久久久久 | 五月天婷婷综合 | 91超碰免费在线 | 国产中文字幕免费 | 精品国产99一区二区乱码综合 | 娇妻被老王脔到高潮失禁视频 | 色激情五月 | 国产香蕉尹人视频在线 | 国产乱淫av一区二区三区 | 亚洲精品在线视频免费观看 | 日本熟妇一区二区三区四区 | a视频在线观看 | 成人黄色av网址 | 天堂久久精品忘忧草 | 好爽…又高潮了毛片免费看 | 成年人www| av免费网站在线观看 | 激情一区二区三区 | 欧美综合亚洲图片综合区 | 毛片大全在线观看 | 五月婷婷一区二区 | 黑人一区| 波多野结衣一本 | 欧美精品亚洲精品日韩精品 | 亚洲一区二区三区四区 | 不卡中文字幕在线 | 国产精品海角社区 | 999av视频 | 麻豆国产一区二区三区四区 | 天天久| 波多野结衣电影在线播放 | 美女被男生免费视频 | 视频一区二区在线播放 | 麻豆视频在线观看免费 | 俄罗斯黄色大片 | 国产伦精品一区二区三区高清版禁 | 好姑娘在线观看高清完整版电影 | 台湾佬美性中文 | 天堂在线视频网站 | 韩国三级中文字幕hd浴缸戏 | 四虎精品视频 | 一区二区三区视频网站 | 在线观看特色大片免费网站 | 国产鲁鲁视频在线观看免费 | 免费在线视频你懂的 | 中文字幕日韩一区 | 亚洲裸体视频 | 污网站在线观看免费 | 哺乳援交吃奶在线播放 | 在线视频麻豆 | 天天干天天草 | 国产91视频播放 | 久久高清免费 | 日韩成人在线视频 | 日本视频在线免费 | 精品无码人妻一区二区三区品 | 久久尹人| 国产一区二区不卡在线 | 性欧美精品 | 欧美一区二区三区在线 | 久久福利视频导航 | 华丽的外出在线观看 | 中文字幕久久网 | 日本一区二区免费在线观看 | 蜜桃视频在线观看一区 | 男人插女人的网站 |