马尔可夫过程 与 隐马尔科夫模型
為什么是馬爾可夫過程?
馬爾科夫過程(Markov process)是一類隨機過程。
在已知目前狀態(現在)的條件下,它未來的演變(將來)不依賴于它以往的演變(過去)。主要研究一個系統的狀況及其轉移的理論。它是通過對不同狀態的初始概率以及狀態之間的轉移概率的研究,來確定狀態的變化趨勢,從而達到對預測未來的目的。
概念
實際應用場景
- 液體中的微粒子運動
- 傳染病的傳染人數
- 車站的候車人數
兩個基本特性
1. 無后效性
是指如果在某個階段上過程的狀態已知,則從此階段以后過程的發展變化僅與此階段的狀態有關,而與過程在此階段以前的階段所經歷過的狀態無關。
我的一句話總結:未來的結果,不看過去,就看現在。
2. 便利性
不管事物出現在什么狀態,較長一段時間內,馬爾可夫過程逐漸趨于穩定,與初始狀態無關。
馬爾科夫鏈Markov chain
馬爾科夫鏈(Markov chain) 是指具有馬爾科夫性質的離散事件隨機過程,即時間和狀態參數都是離散的馬爾科夫過程,是最簡單的馬爾科夫過程。
隱馬爾科夫模型(重點)
隱馬爾可夫模型(Hidden Markov Model, HMM)作為一種統計分析模型,創立于20世紀70年代。
一句話總結:隱馬爾可夫模型,是統計學的,主要做統計分析的。
隱馬爾可夫模型(Hidden Markov Model, HMM)是結構最簡單的動態貝葉斯網這是一種著名的有向圖模型,主要用于時序數據建模(語音識別、自然語言處理等)。
貝葉斯與樸素貝葉斯都是對隱馬爾可夫模型做的鋪墊。那兩個就屬于是“拋磚”了!
有向圖:有明確的開始和結束,有方向
無向圖:沒有明確的開始和結束。
任何一個時序序列里面,有開始和結束時間。一定是有向圖了!
隱馬爾可夫模型是馬爾可夫鏈的一種,它的狀態不能直接觀察到,但能通過觀測向量序列觀察到,每個觀測向量都是通過某些概率密度分布表現為各種狀態,每一個觀測向量是由一個具有相應概率密度分布的狀態序列產生。
馬爾可夫鏈,就是描述一種狀態的序列,每一個狀態值,取決于前面的有限個狀態
隱馬爾科夫模型 模型圖
箭頭:表示了變量之間的依賴關系,也就是任意一個時刻,觀測到變量的取值,僅依賴于該時刻的狀態變量。
例如:x1 由 z1來確定的,與其他變量的取值無關。
同時在T時刻,狀態 zT 時刻,僅依賴于 T-1 時刻的狀態。
說白了這僅是一個鏈式結構,當前時刻的狀態,僅取決于前一個時刻,和其他時刻無關。和過往的,以前的,是沒有任何關系的,不依賴的。
隱馬爾科夫模型 的構成
隱馬爾可夫模型由五個要素組成,其中兩個狀態集合(N、M),三個概率矩陣(A、B、π):
上圖的 x0,x1,x2……xT
理解為 輸出的個數
模型在各個狀態之間轉換的概率。例如:一個狀態“好”,下一時刻狀態“好”的概率是多少
輸出的觀測概率值。模型根據當前狀態所得出各個觀測值的概率
初始時候,模型的各個狀態都出現,出現的概率是多少
輸入: HMMs的五元組(N, M,A, B, π)。
輸出:–個觀察符號的序列,這個序列的每個元素都是M中的元素。
輸出都是 M,表示每個狀態不同的觀察符號。
根據概率求出一個輸出值,把輸出的內容會組成一個集合。輸出的集合可以定位出M,每一個符號都是M種類的元素。
應用場景
- 中文分詞:一句話中需要填空,“今天早上上語文課,我需要帶一本()書”,A.英語 B.數學 C.語文,通過這個狀態,可以一個值一個值的概率預測,找到可能是“語文書”
- 機器翻譯
- 語音識別
- 通信中的譯碼
隱馬爾科夫模型 是傳統的機器學習模型,并不屬于深度學習模型,但深度學習模型很大程度上依賴于機器學習模型。
隱馬爾科夫模型 也是非常常用的模型。
用一個小故事理解 隱馬爾科夫模型
附:下面轉引網絡文章《愛情的隱式馬爾可夫模型(Love in the Hidden Markov Model)》片斷:
首先感謝原英文作者Tom Yeh的精彩描述,生動地講述了HMM模型的原理,在此我斗膽用我自己的語言用中文修改描述一次。
男生和女生分別是來自不同星球的科學事實已經眾所周知的了。男生們總是認為,女生們都是謎一樣的生物,他們的情感狀態浮動似乎是以秒單位在變化的,難以理解,更勿論預測了! 而女生們覺得男生都是沒有感覺動物,完全不能理解什么叫感受-盡管已經告訴他們N次了!這種男女之間的根本差別,導致了他們之間的感情關系是受一種超級無敵復雜的系統所支配的。
不過,我們可以用一個叫隱式馬爾可夫(Hidden Markov Model)的數學模型來分析這個系統。
小明,作為一名計算機科學家,決定要系統地去分析他女朋友的情感不確定性,挖掘出里面的規律!于是乎,小明仔細地記錄了半年來他女朋友小麗每天的喜怒哀樂變化狀態,并作了一張圖表來表示小麗的歷史情感變化。小明想知道,有了這些數據,他能否從中得出知道,如果小麗某天的情感狀態是高興,那么第二天她更多的是保持好心情呢,還是更多地變得悲傷了,如此等等……
數據勝于雄辯。小明從這半年的數據里面發現,當小麗高興的時候,3/4的情況下第二天她仍然保持著好心情,只有1/4的情況小麗第二天心情會改變,比如變得氣憤,悲傷等等。小明繼續分析其他各種情感狀態變化情況,比如從高興到悲傷,悲傷到氣憤,高興到氣憤等所有的可能組合。很快小明就得到所有的組合變化數據,從中得知對于任意小麗的某天情感狀態下,下一個最有可能的情感狀態。
這個過程,同學們,就是有名的 “馬爾可夫過程” (Markov process)
不過需要注意的是,馬爾可夫過程有一些假設的前提。在我們的例子里面,預測下一天小麗的心情,我們只依賴當天小麗的心情,而沒有去考慮更先前她的心情。很明顯這種假設下的模型是遠不夠精確的。很多時候,隨著日子一天一天的過去,女生一般會變得越來越體諒。經常女生生氣了幾天后,氣就會慢慢消了. 比方說如果小麗已經生氣了3天了,那么她第二天變得高興起來的可能性,在多數情況下,要比她只生氣了一天而第二天變得高興的可能性要高。馬爾可夫過程并沒有考慮這個,用行話講,就是馬爾可夫模型忽略遠距離歷史效應 ( long range dependency)。
有些時候,我們無法直接觀測一個事物的狀態。比方說,有些女生是很能隱瞞自己的情感而不流露出來的!她們可能天天面帶微笑但不代表他們就天天高興。因此我們必須要有竅門,去依賴某些我們能夠直接觀察到的東西。
話說回來,我們的主人公小明,自從被小麗發現他這種近乎變態的科學分析行為后,變得非常善于隱藏自己的心情,導致某天小明錯誤估計了小麗的心情!在誤以為那天小麗會心情好的情況下,小明告訴小麗自己不小心摔壞了她心愛的iPod…,小明沒想到其實那天小麗正因為前一天錯過了商場名牌打折扣的活動而異常氣憤。一場血雨腥風過后,兩個人最終分手了。
不過,小明憑著自身的英俊高大瀟灑,很快又交上了另外一個女朋友,小玲。鑒于小明意識到,女生表面的情感流露非常不可靠,小明決定要另尋他徑,繼續預測女朋友的心情!(作為一個科學家,小明的確有著不怕碰壁的精神)小明每個月都幫小玲付信用卡的費用(真不明白,有這樣的男朋友,小玲有什么理由不高興啊),因此小明每天都可以通過Online banking知道小玲每天都買了什么東西。小明突然靈機一動: “沒準我能通過觀測她的購物規律,推導預測出小玲的心情!”
聽起來有點匪夷所思,不過這個過程,的的確確是可以使用叫作隱式馬爾可夫的數學模型來表示并分析的。
由于我們需要預測的變量 - 心情狀態是無法直接觀測的,是隱藏 (Hidden) 起來的,因此這種模型才叫隱式馬爾可夫模型。
隱馬爾可夫模型在計算機語音識別等領域取得了驚人的成功。據稱:“到目前為止,HMM(隱馬爾可夫模型)一直被認為是實現快速精確的語音系統的最成功的方法。”
總結
以上是生活随笔為你收集整理的马尔可夫过程 与 隐马尔科夫模型的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 成都KTV点歌类小程序开发公司,微信小程
- 下一篇: 5g时代计算机网络过时,5g云电脑 取代