日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

文本分类模型_文本分类模型之TextCNN

發布時間:2025/3/19 编程问答 20 豆豆
生活随笔 收集整理的這篇文章主要介紹了 文本分类模型_文本分类模型之TextCNN 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

六年的大學生涯結束了,目前在搜索推薦崗位上繼續進階,近期正好在做類目預測多標簽分類的項目,因此把相關的模型記錄總結一下,便于后續查閱總結。

一、理論篇:
在我們的場景中,文本數據量比較大,因此直接采用深度學習模型來預測文本類目的多標簽,而TextCNN向來以速度快,準確率高著稱。TextCNN的核心思想是抓取文本的局部特征:通過不同的卷積核尺寸(確切的說是卷積核高度)來提取文本的N-gram信息,然后通過最大池化操作來突出各個卷積操作提取的最關鍵信息(頗有一番Attention的味道),拼接后通過全連接層對特征進行組合,最后通過交叉熵損失函數來訓練模型。

模型的第一層就是Embedding層,預訓練的詞嵌入可以利用其它語料庫得到更多的先驗知識,經過模型訓練后能夠抓住與當前任務最相關的文本特征。在我們的應用場景中,使用預訓練的Embedding比隨機初始化帶來的效果不是特別顯著。第二層為卷積層,CV中常見的卷積尺寸通常是正方形,而本文的卷積尺寸與之不同,本文的卷積寬度等于文本Embedding后的維度,保持不變,因為每個詞或字相當于一個最小的單元,不可進一步分割。而卷積核的高度可以自定義,在向下滑動的過程中,通過定義不同的窗口來提取不同的特征向量,有點類似于N-gram過程。這樣不同的kernel可以獲取不同范圍內詞的關系,獲得的是縱向的差異信息,也就是在一個句子中不同范圍的詞出現會帶來什么信息。比如可以使用3,4,5個詞數分別作為卷積核的大小),每個卷積尺寸下又有多個相同的卷積核(原因是卷積神經網絡學習的是卷積核中的參數,每個filter都有自己的關注點,它們可以從同一個窗口學習相互之間互補的特征,這樣多個卷積核就能學習到不同的信息,比如可以設置size為3的filter有4個卷積核)。

第三層是最大池化層,即為從每個滑動窗口產生的特征向量中篩選出一個最大的特征,然后將這些特征拼接起來構成向量表示。也可以選用K-Max池化(選出每個特征向量中最大的K個特征),或者平均池化(將特征向量中的每一維取平均)等,達到的效果都是將不同長度的句子通過池化得到一個定長的向量表示。在短文本分類場景中,每條文本中都會有一些對分類無用的信息,而最大池化可以突出最重要的關鍵詞以幫助模型更容易找到對應的類目。

接下來的幾層就跟具體的任務相關了,一般都會拼接特征,在通過全連接層自由組合提取出來的特征實現分類。在損失函數上,二分類和多標簽分類可以采用基于Sigmoid函數的交叉熵損失函數binary_crossentropy,多分類任務可以采用基于Softmax的多類別交叉熵損失函數(categorical_crossentropy)。

二、代碼部分:

def textcnn(hyper_parameters):input = Input(shape=(hyper_parameters.max_len,))if hyper_parameters.embedding_matrix is None:embedding = Embedding(input_dim=hyper_parameters.vocab + 1,output_dim=hyper_parameters.emd_dim,input_length=hyper_parameters.MAX_LEN,trainable=True)(input)else: # 使用預訓練矩陣初始化Embeddingembedding = Embedding(input_dim=hyper_parameters.vocab + 1,output_dim=hyper_parameters.emd_dim,weights=[hyper_parameters.embedding_matrix],input_length=hyper_parameters.MAX_LEN,trainable=False)(input)convs = []for kernel_size in hyper_parameters.kernel_size:conv = Conv1D(hyper_parameters.conv_code, kernel_size,activation=hyper_parameters.relu)(embedding)pool = MaxPooling1D()(conv)convs.append(pool)concat = Concatenate()(convs)flattern = Flatten()(concat)dropout = Dropout(hyper_parameters.dropout)(flattern)output = Dense(hyper_parameters.classes, activation=hyper_parameters.sigmoid)(dropout)model = Model(input, output)model.compile(loss='binary_crossentropy',optimizer='adam',metrics=['accuracy'])return model

在Embedding部分,如果有條件可以使用自己預訓練的文本信息來初始化Embedding矩陣,效果可能會比隨機初始化Embedding提升一點。

三、幾點思考:

1.TextCNN能用于文本分類的主要原因是什么?

除了預訓練文本外,TextCNN通過利用不同的卷積核尺寸并行提取文本的信息(類似N-gram),并通過最大池化來突出最重要的關鍵詞來實現分類。

2.TextCNN的缺點:

2.1. TextCNN的卷積和池化操作會丟失文本序列中的詞匯順序和位置信息等內容,但也可利用這一點來增強文本,例如白色旅游鞋,可以添加旅游鞋白色數據等,分詞后白色和旅游鞋位置就可以互換來豐富語料 。

2.2. 在長文本使用TextCNN效果可能沒有在短文本中效果好(具體還需要實踐確認),原因同上,因此可以嘗試使用Top k池化替代最大池化提取更多的文本信息。

https://arxiv.org/pdf/1408.5882.pdf?arxiv.org小占同學:深入TextCNN(一)詳述CNN及TextCNN原理?zhuanlan.zhihu.com

總結

以上是生活随笔為你收集整理的文本分类模型_文本分类模型之TextCNN的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。

主站蜘蛛池模板: 日本精品久久久久久 | 好吊操视频这里只有精品 | 久久亚洲精品国产精品黑人v | 国产激情视频一区 | 免费在线黄网站 | 日韩欧美亚洲视频 | 人妻一区二区在线 | av在线天堂网 | 欧美成人三级精品 | 亚洲美女在线播放 | 色狠狠一区二区三区香蕉 | 亚色图| 精品欧美久久久 | 亚洲一级片免费 | 欧美丰满老妇熟乱xxxxyyy | 草草福利影院 | 久久狠 | 51久久久 | 麻豆亚洲一区 | 亚洲美女视频 | 欧美日韩一区二区精品 | 奇米影视在线播放 | 探花视频在线版播放免费观看 | 一级黄色免费视频 | 91porn九色| 不用播放器av| 亚洲一区在线不卡 | 色狠狠久久av大岛优香 | 黄色aaaa | www毛片com | 国产区小视频 | 饥渴少妇伦色诱公 | av手机在线观看 | 亚洲一区和二区 | 亚洲美女视频在线观看 | 麻豆av一区二区三区 | 五月激情片 | 国产视频第一页 | 伊人影院在线视频 | 亚洲www啪成人一区二区麻豆 | 男人的天堂99 | 最近中文字幕在线观看视频 | 精品一区二区在线观看视频 | 成人熟女一区二区 | 亚洲高清视频在线观看 | 女生的胸无遮挡 | 黄色大片网站 | 午夜黄色福利视频 | 美女网站在线 | 天天艹夜夜艹 | 久久艹艹| 国产欧美a | 黄瓜视频色 | 亚洲熟女乱色一区二区三区久久久 | 另类一区二区 | 免费午夜视频在线观看 | 黄色avv| 欧美色图网站 | 伊人久操 | 性一交一乱一精一晶 | 欧美精品网站 | 特高潮videossexhd| 日本亚洲欧美在线 | 国产伦精品一区二区三区免费视频 | 亚洲熟妇一区二区三区 | av在线资源观看 | 亚洲毛片在线播放 | 九色九一 | 午夜嘿嘿| 密臀av一区二区 | 浮妇高潮喷白浆视频 | 蜜桃av成人永久免费 | 日韩插插插| 婷婷综合在线视频 | 一级片毛片 | 娇妻玩4p被三个男人伺候电影 | 日韩精品在线观看中文字幕 | 欧美一级片一区二区 | www.久草.com| 性色欲网站人妻丰满中文久久不卡 | 肉性天堂 | 九九碰| 一区二区三区黄色 | 碧蓝之海动漫在线观看免费高清 | 欧美色图小说 | 91黄色在线观看 | 制服丝袜成人动漫 | 草碰在线视频 | 亚洲电影一区二区三区 | 色婷婷国产| 在线观看视频免费 | 自拍偷自拍亚洲精品播放 | 欧美黄网站在线观看 | 干b视频在线观看 | 五月天综合激情网 | 亚洲第一黄色 | 国产视频综合在线 | 深夜网站在线观看 | 一本到在线|