python可以自动写文章吗_让python来告诉你神奇的操作,如何实现文章自动化
三河講python
首先來告訴大家下面的Python程序實現了通過從網頁抓取一篇文章,然后根據這篇文章來生成新的文章,這其中的原理就是基于概率統計的文本分析。
過程大概就是網頁抓取數據->統計分析->生成新文章。網頁抓取數據是通過BeautifulSoup庫來抓取網頁上的文本內容。統計分析這個首先需要使用ngram模型來把文章進行分詞并統計頻率。因為文章生成主要依據馬爾可夫模型,所以使用了2-gram,這樣可以統計出一個單詞出現在另一個單詞后的概率。生成新文章是基于分析大量隨機事件的馬爾可夫模型。隨機事件的特點是在一個離散事件發生之后,另一個離散事件將在前一個事件的條件下以一定的概率發生。
buildWordDict(text)函數接收文本內容,生成的內容如下{‘itself’: {‘,’: 1}, ‘night’: {‘sky’: 1}, ‘You’: {‘came’: 1, ‘will’: 1}, ‘railways’: {‘all’: 1}, ‘government’: {‘while’: 1, ‘,’: 1, ‘is’: 1}, ‘you’: {‘now’: 1, ‘open’: 1, ‘down’: 1, ‘with’: 1, ‘.’: 6, ‘,’: 1, ‘that’: 1},
主要就是生成一個字典,鍵是文章中所有出現的詞語,值其實也是一個字典,這個字典是所有直接出現在鍵后邊的詞語及其出現的頻率。這個函數就是ngram模型思想的運用。
retrieveRandomWord(wordList)函數的wordList代表的是出現在上一個詞語后的詞語列表及其頻率組成的字典,然后根據統計的概率隨機生成一個詞。這個函數是馬爾可夫模型的思想運用。
然后運行這個程序會生成一個長度為100的文章,如下面所示
fail . We will stir ourselves , but we will never before . Do not share one heart and pleasant it back our jobs . We are infused with the orderly and railways all of the gangs and robbed our jobs for their success will determine the civilized world . We will their success will be a great men and highways and millions to all bleed the world . It belongs to great national effort to defend our products , constantly complaining , D . We will be ignored again . It belongs to harness the expense of America .
總結
以上是生活随笔為你收集整理的python可以自动写文章吗_让python来告诉你神奇的操作,如何实现文章自动化的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 海信vidda售后标准
- 下一篇: 如何用python写html的插件,使用