CRF++ 特征工程
生活随笔
收集整理的這篇文章主要介紹了
CRF++ 特征工程
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
Name Entity Recognition(命名實體識別) - 知乎
特征除了人工的方式還可以用深度學習的方式提取
可嘗試的特征:
1.Bag of word features
--當前詞:Colin
--前后詞:prefessor,proposed
--bigram: Prefessor Colin,Colin proposed
2.詞性相關的
--當前詞:名詞
--前后詞:名詞,動詞
3.前綴 or 后綴
當前詞:Co,in
前后詞:pr,ed,or
4.單詞特點
--詞長
--是否包含大寫?
--統計多少個大寫?
--是否包含"-"
--是否包含數字
5.stemming(可以先用統計的算法得到) + 單詞特征
6.句法特征
--語法(句法分析 ,Parsing)
通過cky(動態規劃)算法獲取語法樹
--依賴關系(Dependency Parsing)
總結
以上是生活随笔為你收集整理的CRF++ 特征工程的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: jieba分词实现原理(C++版 + p
- 下一篇: 自然语言理解难在哪儿?