當前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

第06课：动手实战基于 ML 的中文短文本分类

發布時間：2024/1/23 编程问答 36 豆豆

生活随笔收集整理的這篇文章主要介紹了第06课：动手实战基于 ML 的中文短文本分类小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

文本分類，屬于有監督學習中的一部分，在很多場景下都有應用，下面通過小數據的實例，一步步完成中文短文本的分類實現，整個過程盡量做到少理論重實戰。

開發環境，我們選擇：

Windows 系統

Python 3.6

Jupyter Notebook

本文使用的數據是我曾經做過的一份司法數據，需求是對每一條輸入數據，判斷事情的主體是誰，比如報警人被老公打，報警人被老婆打，報警人被兒子打，報警人被女兒打等來進行文本有監督的分類操作。

整個過程分為以下幾個步驟：

基本流程如下圖所示：

下面開始項目實戰。

1. 首先進行語料加載，在這之前，引入所需要的 Python 依賴包，并將全部語料和停用詞字典讀入內存中。

第一步，引入依賴庫，有隨機數庫、jieba 分詞、pandas 庫等?

以上是生活随笔為你收集整理的第06课：动手实战基于 ML 的中文短文本分类的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。