日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 综合教程 >内容正文

综合教程

stanford NLP学习笔记3:最小编辑距离(Minimum Edit Distance)

發布時間:2023/12/24 综合教程 33 生活家
生活随笔 收集整理的這篇文章主要介紹了 stanford NLP学习笔记3:最小编辑距离(Minimum Edit Distance) 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

I. 最小編輯距離的定義

最小編輯距離旨在定義兩個字符串之間的相似度(word similarity)。定義相似度可以用于拼寫糾錯,計算生物學上的序列比對,機器翻譯,信息提取,語音識別等。

編輯距離就是指將一個字符串通過的包括插入(insertion),刪除(deletion),替換(substitution)的編輯操作轉變為另一個字符串所需的最少編輯次數。比如:

如果將編輯操作從字符放大到詞,那就可以用于評估集齊翻譯和語音識別的效果。比如:

還可以用于實體名稱識別(named entity recognition)和實體共指(entity corefernce)

如何尋找最短的編輯路徑(所有尋找所有編輯結果的可能星代價太大也沒必要):動態編程法
若字符串X長度為n,字符串Y長度為m,定義X和Y之間的編輯距離為D(n,m)。計算原理很簡單:利用從底向頂的方式,計算D(n,m)可以建立在D(n-1,m-1)的基礎上,并一次類推向上直至D(0,0)。初始和迭代條件入下:D(i, 0)就是將X中所有i個字符刪除即可,因此其值就是i。同理D(0, j)為插入j個字符。

計算Intention和execution之間距離的距離矩陣如下:

PS:關于編輯距離的實現代碼可以看碼農場大神的這篇博客

II. 回溯比對(backtrace)

很多情況下只是記錄編輯距離是不夠的,需要將兩列字符串的進行一一對應的具體位置信息(比如拼寫糾錯)。因此會用一個指針來記錄位置信息用于回溯。由于需要求的是最短編輯距離,在每一次編輯操作的格子將其指向前一次操作時的最小的編輯距離的格子即可,最終變可以獲得比對的具體對應信息。


該算法的復雜度:很明顯時間和空間復雜度為O(nm);而做多需要(m+n)個backtrace指針來記錄。

III. 加權編輯距離(weighted edit distance)

加入加權的原因是是由于不同情況的插入,替換,刪除的可能性是不同的。比如在拼寫糾錯的時候有些位置的字母打錯成某個字母的可能性比其他字母要高;在DNA序列中,有些堿基的缺失和替換可能性也要比其他的高。如下就是各字母間打錯的次數:

具體計算而言,在上述原理的基礎上加入每一步編輯操作具體的權值即可。

IV. 計算生物學中的最短編輯距離

由于當代計算生物學主要數據就是各種DNA和RNA序列的堿基信息,且比對是大部分分析的基礎,因此最短編輯距離對計算生物學而言意義十分重要。
計算生物學在比對的時候通常用相似度(similarity)來代替距離來作為評估標準,因此對之前的算法稍做調整使之最大化相似度:Needleman-wunsch algorithm

變體. 由于測序特性,對序列頭和尾的gap序列的比對不做懲罰是相當合理的,即在初始狀態,for all i,j; F(i, 0)=0; F(0, j)=0。 終止狀態,Fopt = MAX(MAXi F(i,N), MAXj F(M,j))。

局部比對
尋找X,Y的相似度最高的子序列,因此可以不光是開頭結尾的gap,序列前后部的差異很大的序列也可以不用管。這個算法叫做Smith-Waterman algorithm,目標就是舍棄那些比對相似度很差的區域,關注于高度相似的區域。

如果當前位置之前的序列比對得分低于0了,說明前面的序列比對情況很糟糕,那么就從這個位置開始重新開始比對,前面的序列就放棄不管了。
終止情況:

局部比對實例
X=ATCAT, Y=ATTATC, m=1(匹配得分),d=-1(發生替換/刪除/插入的得分)

傳送門:https://www.youtube.com/watch?v=Q0TGn4wkuoE

總結

以上是生活随笔為你收集整理的stanford NLP学习笔记3:最小编辑距离(Minimum Edit Distance)的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。

主站蜘蛛池模板: 国产网红无码精品视频 | 久久人妻少妇嫩草av无码专区 | 国产一卡二卡三卡 | 久久888| 一级淫片a | 日本超碰 | 91成人动漫 | 97久久精品人人澡人人爽 | 久久9966 | 欧美一区中文字幕 | 日韩高清不卡 | 精品国产乱码久久久久夜深人妻 | 国产福利免费观看 | 黄色免费成人 | www 在线观看视频 | 天天做日日干 | 妻色成人网 | 国产精品综合 | 久久亚洲AV无码专区成人国产 | 人妻精品无码一区二区 | 欧美一区二区三区电影 | 日韩第一页在线观看 | 999免费视频 | 天天色天天 | 国产精品xxx在线 | 女人下面流白浆的视频 | 97久久久 | 免费观看一区二区三区视频 | 欧美亚洲综合久久 | 黄页嫩草| 亚洲av少妇一区二区在线观看 | 67194少妇在线观看 | 看免费黄色片 | 麻豆视频免费版 | 久射网| 黄色一级片黄色一级片 | 精品中文字幕在线 | 久久三级精品 | 精品www久久久久久奶水 | 亚洲黄片一区二区三区 | 成片在线观看 | 成人免费毛片男人用品 | 今天高清视频在线观看视频 | 亚洲一区欧美 | 91精选 | 春闺艳妇(h)高h产乳 | 日韩精品一卡 | 午夜寂寞剧场 | 在线v | 国产成人av一区二区三区在线观看 | 99精品久久久久久中文字幕 | 波多野结衣国产在线 | 日韩午夜激情视频 | 成人久久久精品乱码一区二区三区 | 91麻豆一区二区三区 | 国产高清无遮挡 | 国产高清av在线 | 精品久久久久久无码人妻 | 丰满白嫩尤物一区二区 | 欧美又粗又长又爽做受 | av55 | 免费高清av在线看 | 国产人与zoxxxx另类 | 草草影院地址 | www.欧美 | 日韩不卡在线视频 | 伊人动漫| 强迫凌虐淫辱の牝奴在线观看 | 久久青青草视频 | x88av在线| 国产成人无码一二三区视频 | 毛片毛片毛片毛片毛片毛片毛片毛片毛片毛片 | 欧美操女人 | 亚洲爱爱爱| 神马午夜888 | 日韩电影一区二区三区 | 亚洲永久无码精品 | 国产午夜精品在线 | 亚洲大胆视频 | 亚洲国产永久 | 无码国产伦一区二区三区视频 | 国产中文在线播放 | wwwwyoujizzcom| 中文字幕人妻熟女人妻a片 麻豆91视频 | 国产欧美日韩中文字幕 | 久久国产一区 | 欧美精品久久久久久久自慰 | 欧洲女同同性吃奶 | 岛国精品在线播放 | 欧美一级淫片007 | 日韩一二三级 | 日韩三级在线观看 | 黄色香港三级三级三级 | 丰满人妻熟妇乱偷人无码 | 三级三级久久三级久久18 | 成年人性生活免费视频 | 丁香花高清在线观看完整动漫 | 精品无码久久久久 | 天堂а√在线中文在线鲁大师 | 亚洲开心网 |