日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

潜在狄利克雷分配(Latent Dirichlet Allocation,LDA)

發布時間:2024/7/5 编程问答 46 豆豆
生活随笔 收集整理的這篇文章主要介紹了 潜在狄利克雷分配(Latent Dirichlet Allocation,LDA) 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

文章目錄

    • 1. 狄利克雷分布
    • 2. 潛在狄利克雷分配模型
    • 3. 學習推理
    • 4. sklearn.decomposition.LatentDirichletAllocation

潛在狄利克雷分配(latent Dirichlet allocation,LDA),作為基于 貝葉斯學習的話題模型,是潛在語義分析、概率潛在語義分析的擴展,于2002年由Blei等提出。LDA在文本數據挖掘、圖像處理、生物信息處理等領域被廣泛使用。

LDA模型是文本集合的生成概率模型

  • 假設每個文本由話題的一個多項分布表示

  • 每個話題由單詞的一個多項分布表示

  • 特別假設文本的話題分布的先驗分布是狄利克雷分布

  • 話題的單詞分布的先驗分布也是狄利克雷分布

  • 先驗分布的導入使LDA能夠更好地應對話題模型學習中的過擬合現象

LDA的文本集合的生成過程如下:

  • 首先隨機生成一個文本的話題分布
  • 之后在該文本的每個位置,依據該文本的話題分布隨機生成一個話題
  • 然后在該位置依據該話題的單詞分布隨機生成一個單詞
  • 直至文本的最后一個位置,生成整個文本。重復以上過程生成所有文本

LDA模型是含有隱變量的概率圖模型

  • 模型中,每個話題的單詞分布,每個文本的話題分布,文本的每個位置的話題是隱變量
  • 文本的每個位置的單詞是觀測變量
  • LDA模型的學習與推理無法直接求解,通常使用吉布斯抽樣(Gibbs sampling)和變分EM算法(variational EM algorithm),前者是蒙特卡羅法,而后者是近似算法

1. 狄利克雷分布

狄利克雷分布(Dirichlet distribution)是一種多元連續隨機變量的概率分布,是貝塔分布(beta distribution)的擴展。在貝葉斯學習中,狄利克雷分布常作為多項分布的先驗分布使用。

定義:

多元連續隨機變量 θ=(θ1,θ2,...,θk)\theta = (\theta_1,\theta_2,...,\theta_k)θ=(θ1?,θ2?,...,θk?) 的概率密度函數為:
p(θ∣α)=Γ(∑i=1kαi)∏i=1kΓ(αi)∏i=1kθiαi?1∑i=1kθi=1,θi≥0,αi>0,記作θ~Dir(α)p(\theta|\alpha) = \frac{\Gamma \bigg(\sum\limits_{i=1}^k \alpha_i\bigg)}{\prod\limits_{i=1}^k \Gamma(\alpha_i)} \prod\limits_{i=1}^k \theta_i^{\alpha_i-1}\quad \sum\limits_{i=1}^k \theta_i = 1, \theta_i\ge 0,\alpha_i >0,記作\theta \sim Dir(\alpha)p(θα)=i=1k?Γ(αi?)Γ(i=1k?αi?)?i=1k?θiαi??1?i=1k?θi?=1,θi?0,αi?>0,θDir(α)
伽馬函數,Γ(s)=∫0∞xs?1e?xdx,s>0伽馬函數,\Gamma(s) = \int_0^{\infty} x^{s-1}e^{-x}dx, \quad s>0Γ(s)=0?xs?1e?xdx,s>0
伽馬函數性質:
Γ(s+1)=sΓ(s)\Gamma(s+1) = s\Gamma(s)Γ(s+1)=sΓ(s)
sss 是自然數時,有 Γ(s+1)=s!\Gamma(s+1) = s!Γ(s+1)=s!

2. 潛在狄利克雷分配模型


LDA模型是概率圖模型:

  • 特點:以狄利克雷分布為多項分布的先驗分布
  • 學習:就是給定文本集合,通過后驗概率分布的估計,推斷模型的所有參數

利用LDA進行話題分析,就是對給定文本集合,學習到每個文本的話題分布,以及每個話題的單詞分布

  • 可以認為LDA是PLSA(概率潛在語義分析)的擴展
  • 相同點:兩者都假設話題是單詞的多項分布,文本是話題的多項分布
  • 不同點:LDA使用狄利克雷分布作為先驗分布,而PLSA不使用先驗分布(或者說假設先驗分布是均勻分布),兩者對文本生成過程有不同假設
  • 學習過程:LDA基于貝葉斯學習,而PLSA基于極大似然估計
  • LDA的優點是:使用先驗概率分布,可以防止學習過程中產生的過擬合(over-fitting)

3. 學習推理

LDA模型的學習與推理不能直接求解。

  • 通常采用的方法是吉布斯抽樣算法和變分EM算法
  • 前者是蒙特卡羅法,而后者是近似算法

4. sklearn.decomposition.LatentDirichletAllocation

sklearn.decomposition.LatentDirichletAllocation官網介紹

class sklearn.decomposition.LatentDirichletAllocation(n_components=10, doc_topic_prior=None, topic_word_prior=None, learning_method='batch', learning_decay=0.7, learning_offset=10.0, max_iter=10, batch_size=128, evaluate_every=-1, total_samples=1000000.0, perp_tol=0.1, mean_change_tol=0.001, max_doc_update_iter=100, n_jobs=None, verbose=0, random_state=None)

n_components, optional (default=10),話題數量

實踐參考:https://www.cnblogs.com/pinard/p/6908150.html

總結

以上是生活随笔為你收集整理的潜在狄利克雷分配(Latent Dirichlet Allocation,LDA)的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。

主站蜘蛛池模板: 很污的网站 | 久久毛片基地 | 一级全黄裸体免费观看视频 | 日本泡妞视频 | 九色.com| 欧美电影一区 | 超碰人人干 | 亚洲欧美网址 | 国产视频一区二 | 免费在线观看污 | 精品久久久久久久久久久久 | 亚洲色图影院 | 97av视频在线 | 奇米色影视 | 久久久综合久久 | 日本精品在线观看视频 | 久久视频在线看 | 又色又爽又黄gif动态图 | 欧美日韩视频一区二区三区 | 影音先锋男人站 | 麻豆传媒一区二区三区 | 中文字幕电影一区 | 乱色专区 | 高清一二三区 | 91香蕉在线视频 | 国内精品视频 | 午夜视频网站在线观看 | 欧洲视频在线观看 | 国产aaa大片 | 欧美视频免费在线 | 青娱乐国产在线 | 欧美日韩高清一区二区三区 | 名校风暴在线观看免费高清完整 | 亚洲AV无码一区二区三区蜜桃 | 91成人在线播放 | 91碰碰| 人人草人人射 | 成年人免费视频观看 | 亚洲av永久无码精品一区二区国产 | 超碰日日夜夜 | 成人乱人乱一区二区三区一级视频 | 五月天欧美 | 色网站在线播放 | 尤物视频在线观看国产性感 | 日本午夜网站 | 国产日韩视频在线观看 | 九九色综合网 | 欧美三根一起进三p | 涩涩涩涩av | 激情婷婷六月 | 久久久免费看片 | 青青草青娱乐 | 日韩av免费在线播放 | av网在线观看 | 红桃视频一区二区三区免费 | 亚洲不卡视频在线观看 | 性感美女一区 | 天堂网www在线 | 麻豆视频免费看 | 朝桐光一区二区三区 | 免费毛片视频网站 | 一区二区三区在线视频免费观看 | 亚洲激情视频小说 | 国产美女黄色片 | 91传媒在线免费观看 | 欧美区日韩区 | 国产国语性生话播放 | 日韩三级视频在线播放 | www.日日| 国产高清在线观看视频 | 成人短视频在线播放 | 秘密基地电影免费版观看国语 | 午夜嘿嘿嘿 | 亚洲在线视频网站 | 成人精品视频 | 国产在线xxx | 国产欧美日韩一区二区三区 | 国产在线视频网址 | 欧美日韩二区三区 | 老女人性视频 | 麻豆性视频 | 日韩亚洲精品在线 | 特黄一级片| 美女爆乳18禁www久久久久久 | 亚洲网av| 黄色激情网址 | 日韩毛片中文字幕 | 九九热国产精品视频 | 亚洲综合射 | 一本色道久久综合精品婷婷 | 欧美aⅴ在线| 久久伊人国产 | 欧美日韩亚洲二区 | www成人免费 | 成人啪啪网站 | 国产精品黄网站 | 人人艹在线观看 | 久久欧洲 | 国产精品99精品 |