日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

百度NLP工具LAC初体验:分词,词性标注,命名实体识别

發布時間:2024/3/7 编程问答 49 豆豆
生活随笔 收集整理的這篇文章主要介紹了 百度NLP工具LAC初体验:分词,词性标注,命名实体识别 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

LAC全稱Lexical Analysis of Chinese,是百度自然語言處理部研發的一款聯合的詞法分析工具,實現中文分詞、詞性標注、專名識別等功能。

輸入:

from LAC import LAC# 裝載LAC模型 lac = LAC(mode='lac')# 單個樣本輸入,輸入為Unicode編碼的字符串 text = u"LAC是個優秀的分詞工具" lac_result = lac.run(text) print(lac_result)# 批量樣本輸入, 輸入為多個句子組成的list,平均速率更快 texts = [u"LAC是個優秀的分詞工具", u"百度是一家高科技公司"] lac_result = lac.run(texts) print(lac_result)

輸出:

[['LAC', '是', '個', '優秀', '的', '分詞', '工具'], ['nz', 'v', 'q', 'a', 'u', 'n', 'n']] [[['LAC', '是', '個', '優秀', '的', '分詞', '工具'], ['nz', 'v', 'q', 'a', 'u', 'n', 'n']], [['百度', '是', '一家', '高科技', '公司'], ['ORG', 'v', 'm', 'n', 'n']]]

詞性和專名類別標簽集合如下表,其中我們將最常用的4個專名類別標記為大寫的形式:

標簽含義標簽含義標簽含義標簽含義
n普通名詞f方位名詞s處所名詞nw作品名
nz其他專名v普通動詞vd動副詞vn名動詞
a形容詞ad副形詞an名形詞d副詞
m數量詞q量詞r代詞p介詞
c連詞u助詞xc其他虛詞w標點符號
PER人名LOC地名ORG機構名TIME時間

?

注意事項:

  • 輸入:格式為utf-8
  • 輸出:

    每個句子的輸出其切詞結果word_list,以及對每個單詞的標注tags_list,其格式為(word_list, tags_list)

  • 總結

    以上是生活随笔為你收集整理的百度NLP工具LAC初体验:分词,词性标注,命名实体识别的全部內容,希望文章能夠幫你解決所遇到的問題。

    如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。