python3使用newspaper快速抓取任何新闻文章正文
生活随笔
收集整理的這篇文章主要介紹了
python3使用newspaper快速抓取任何新闻文章正文
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
newspaper用于爬取各式各樣的新聞網站
1,安裝newspaper
pip install newspaper3k
2,直接上代碼
from newspaper import Article
url = '你想要爬取的網站url' news = Article(url, language='zh')
news .download() #先下載 news .parse() #再解析
print(news.text) #新聞正文 print(news.title) #新聞標題 print(news.html) #未修改的原始HTML print(news.authors) #新聞作者 print(news.top_image) #本文的“最佳圖像”的URL print(news.movies) #本文電影url print(news.keywords) #新聞關鍵詞 print(news.summary) #從文章主體txt中生成的摘要
print(news.images) #本文中的所有圖像url
總結
以上是生活随笔為你收集整理的python3使用newspaper快速抓取任何新闻文章正文的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Android分包方案multidex*
- 下一篇: 信用卡提前还款手续费还要还吗?2019提