Lattice的构建过程
我有一張地圖,叫Lattice。
它有多個成員叫LNode,數量是nn,成員之間有各種聯系叫LArc,有很多個na。
它們分別被放在Lattice對象lat的列表中,lnodes和larcs。顯然,這兩個列表的長度分別是nn和na。
這地圖,還包含小地圖。
為了看到比例更大的地圖,需要把LNode進行放大,因為里面包含更多細節信息。要進行擴展,必須依賴的幾個條件是,發音字典(每個word可以劃分為那幾個更小的phone),HMMSet對象(每個phone對應的HMM模型又可以劃分為更小的state)以及Mixture,這是hmm對象提供的信息。
ReadLattice函數,返回一個Lattice對象。
它讀取一個描述Lattice網絡文件wdNet,它里面用Lattice語言描寫了Lattice對象如何組織起來。例如,如何表示節點、如何表示邊,然后函數ReadOneLattice函數為每個節點、邊構建相應的對象。它們共同構成Lattice對象——詞格圖。
流程如下:
1)讀取wdNet文件頭,知道Lattice里包含nn個LNode和na個LArc,然后給lattice的lnodes和larcs分配空間。
2)循環讀取wdNet文件的每一行,根據標簽符號為“I”還是“L”分別建節點和邊的實體,且按照“I”和“L”后面接的序號在lnodes和larcs后面添加。
3)根據“L”行的描述,在LArc對象的相關信息中建立連接,start和end節點對應“I”指示的LNode。
4)每個Lattice詞格的LNode節點都含有一個Word數據項,它對應voc->wtab中的一項,表示該節點上面詞更詳細的信息。
5)Lattice的LNode節點除了這個Word外,還有一個比較重要的數據,就是SubLatDef* sublat。在進行lattice擴展時(由函數ExpandWordNet完成),將會給這個指針附著一個對象PronHolder,它包含了語音HMM模型序列(由發音字典查到該詞包含多少個以及什么phone序列,把它們chain起來,并starts和ends分別指向首尾兩個phone)。
到此一個完整的由Lattice到phone Netword構建完成。
需要說明的是,還只是完成了Lattice節點LNode內部的phone chain連接。詞之間,以及如何構建一個完整的network網絡,還有些重要的細節需要處理,例如重排序。
?
?
?
?
?
?
?
總結
以上是生活随笔為你收集整理的Lattice的构建过程的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: React中实现防抖功能的两种方式
- 下一篇: 招商银行笔试题之解码方法