日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

爬取所有校园新闻

發布時間:2024/9/5 编程问答 35 豆豆
生活随笔 收集整理的這篇文章主要介紹了 爬取所有校园新闻 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

1.獲取單條新聞的#標題#鏈接#時間#來源#內容 #點擊次數,并包裝成一個函數。

import requests from bs4 import BeautifulSoup network = 'http://news.gzcc.cn/html/xiaoyuanxinwen/' res = requests.get(network) res.encoding='utf-8' soup = BeautifulSoup(res.text,'html.parser')for news in soup.select('li'):if len(news.select('.news-list-title'))>0:title = news.select('.news-list-title')[0].texturl = news.select('a')[0]['href']time = news.select('.news-list-info')[0].contents[0].textmain = news.select('.news-list-description')[0].textsource = news.select('.news-list-info')[0].contents[1].textprint('鏈接:{}'.format(url))print('標題:{}'.format(title))print('正文:{}'.format(main))print('時間:{}'.format(time))print('來源:{}'.format(source))res1 = requests.get(url)res1.encoding='utf-8'soup1 = BeautifulSoup(res1.text,'html.parser')passage = soup1.select('.show-content')click = int(requests.get('http://oa.gzcc.cn/api.php?op=count&id=8307&modelid=80').text.split('.')[-1].lstrip("html('").rstrip("');"))print('點擊次數:{}'.format(click))break

?

?

2.獲取一個新聞列表頁的所有新聞的上述詳情,并包裝成一個函數。

import requests from bs4 import BeautifulSoup from datetime import datetime import renetwork = 'http://news.gzcc.cn/html/xiaoyuanxinwen/' res = requests.get(network) res.encoding='utf-8' soup = BeautifulSoup(res.text,'html.parser')def getclick(newsurl):id = re.match('http://news.gzcc.cn/html/2017/xiaoyuanxinwen_(.*).html',newsurl).groups()[0].split('/')[1]clickurl = 'http://oa.gzcc.cn/api.php?op=count&id=8307&modelid=80'.format(id)click = int(requests.get(clickurl).text.split('.')[-1].lstrip("html('").rstrip("');"))return(click)for news in soup.select('li'):if len(news.select('.news-list-title'))>0:title = news.select('.news-list-title')[0].texturl = news.select('a')[0]['href']time = news.select('.news-list-info')[0].contents[0].texttimed = datetime.strptime(time,'%Y-%m-%d')main = news.select('.news-list-description')[0].textsource = news.select('.news-list-info')[0].contents[1].textprint('鏈接:{}'.format(url))print('標題:{}'.format(title))print('正文:{}'.format(main))print('時間:{}'.format(timed))print('來源:{}'.format(source))res1 = requests.get(url)res1.encoding='utf-8'soup1 = BeautifulSoup(res1.text,'html.parser')passage = soup1.select('.show-content')click = getclick(url)print('點擊次數:{}'.format(click))

?

3.獲取所有新聞列表頁的網址,調用上述函數。?

import requests from bs4 import BeautifulSoup import reurl_main="http://news.gzcc.cn/html/xiaoyuanxinwen/" res = requests.get(url_main) res.encoding = 'utf-8'soup = BeautifulSoup(res.text,'html.parser') li = soup.select('li')def gethits(url_1):li_id =re.search('_.*/(.*).html',url_1).groups(0)[0]hits = requests.get('http://oa.gzcc.cn/api.php?op=count&id={}&modelid=80'.format(li_id)).text.split('.')[-1].rstrip('''');''').lstrip(''''html(''')return hitsdef getpageinfo(label):for title_list in label:if len(title_list.select('.news-list-title'))>0:href = title_list.select('a')[0]['href']title = title_list.select('.news-list-title')[0].texttime = title_list.select('span')[0].textinfo = title_list.select('span')[1].textres_list = requests.get(href)res_list.encoding = 'utf-8'soup_list = BeautifulSoup(res_list.text,'html.parser')text_list = soup_list.select('.show-content')[0].texthits_list = gethits(href)getpageinfo(li)pages = int(soup.select('.a1')[0].text.rstrip('條'))//10+1for i in range(2,pages+1):url_page = "http://news.gzcc.cn/html/xiaoyuanxinwen/{}.html".format(i)res_page = requests.get(url_page)res_page.encoding = 'utf-8'soup_page = BeautifulSoup(res_page.text,'html.parser')list_page = soup.select('li')getpageinfo(list_page)print(url_page)

4.完后所有校園新聞爬取工作

import requests from bs4 import BeautifulSoup from datetime import datetime import redef getclick(newsurl):id = re.match('http://news.gzcc.cn/html/2017/xiaoyuanxinwen_(.*).html',newsurl).groups()[0].split('/')[1]clickurl = 'http://oa.gzcc.cn/api.php?op=count&id=8307&modelid=80'.format(id)click = int(requests.get(clickurl).text.split('.')[-1].lstrip("html('").rstrip("');"))return(click)def getonepage(listurl):res = requests.get(listurl)res.encoding='utf-8'soup = BeautifulSoup(res.text,'html.parser')for news in soup.select('li'):if len(news.select('.news-list-title'))>0:title = news.select('.news-list-title')[0].texturl = news.select('a')[0]['href']time = news.select('.news-list-info')[0].contents[0].texttimed = datetime.strptime(time,'%Y-%m-%d')main = news.select('.news-list-description')[0].textsource = news.select('.news-list-info')[0].contents[1].textprint('鏈接:{}'.format(url))print('標題:{}'.format(title))print('正文:{}'.format(main))print('時間:{}'.format(timed))print('來源:{}'.format(source))res1 = requests.get(url)res1.encoding='utf-8'soup1 = BeautifulSoup(res1.text,'html.parser')click = getclick(url)print('點擊次數:{}'.format(click))getonepage('http://news.gzcc.cn/html/xiaoyuanxinwen/index.html')res = requests.get('http://news.gzcc.cn/html/xiaoyuanxinwen/') res.encoding='utf-8' soup = BeautifulSoup(res.text,'html.parser')page = int(soup.select('.a1')[0].text.rstrip('條'))//10+1 for i in range(2,page+1):listurl='http://news.gzcc.cn/html/xiaoyuanxinwen/{}.html'.format(i)getonepage(listurl)

?

轉載于:https://www.cnblogs.com/sisters/p/7655268.html

總結

以上是生活随笔為你收集整理的爬取所有校园新闻的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。

主站蜘蛛池模板: 男女啪啪十八 | 毛片国产| 国产精品66 | 久久久久久久久久久电影 | 成人久久久精品乱码一区二区三区 | av一级二级| 91精品啪在线观看国产 | 久久精品在这里 | 国产女人高潮时对白 | 日本一本在线观看 | 欧美与黑人午夜性猛交久久久 | 成人区人妻精品一区二区网站 | 国产日韩中文 | 曰本无码人妻丰满熟妇啪啪 | 午夜小福利 | 又黄又爽的视频 | 久久2019 | 国产一区二区女内射 | 老熟女毛茸茸浓毛 | 中文字幕一区二区三区四区欧美 | 成人午夜电影网站 | 日韩欧美在线免费 | 日本伦理片在线看 | 伊人久久久久噜噜噜亚洲熟女综合 | 日本一区二区在线免费观看 | 人妻一区在线 | 后入内射无码人妻一区 | 综合视频一区二区 | 国产精品一级二级 | 精品国产一区一区二区三亚瑟 | 大肉大捧一进一出好爽视频 | 黄色av免费播放 | 亚洲综合日韩 | 免费一级欧美 | 亚洲精品a | 男人爽女人下面动态图 | 欧美熟妇7777一区二区 | 亚洲欧美综合网 | 黄色国产免费 | 精品国产18久久久久久二百 | 国产成人精品无码免费看81 | 米奇7777狠狠狠狠视频 | 精品福利影院 | 欧美一区三区二区在线观看 | 亚洲在线观看免费 | 爱爱视频在线免费观看 | 亚洲高清视频在线 | jzz国产| 欧美三级在线 | 五月天婷婷社区 | 欧美日韩亚洲不卡 | 操丰满女人 | 蜜桃臀aⅴ精品一区二区三区 | 青青视频在线免费观看 | 97超碰伊人 | 国产精品男同 | 五月激情五月婷婷 | 成人一级生活片 | 久久国产一级 | 国产精品-区区久久久狼 | 桃花色综合影院 | 尤物视频在线免费观看 | 精品人妻一区二区三区在线视频 | 国产理论影院 | 国产在线超碰 | 中文字幕日韩在线视频 | 亚洲欧洲中文 | 精品无码在线观看 | 成年人在线观看视频免费 | 午夜在线免费观看视频 | 人人妻人人澡人人爽精品欧美一区 | 91精品国产综合久久久蜜臀图片 | 国产人妻aⅴ色偷 | 日日操夜夜撸 | 97久久人人超碰caoprom欧美 | 日韩免费在线视频 | 91精品一区二区三区四区 | 狠狠操亚洲 | 日韩中文字幕综合 | 嘿咻视频在线观看 | 国产黄色片免费在线观看 | 亚洲大片免费 | 日本韩国欧美一区 | 欧美黄色大片网站 | 嫩草嫩草嫩草嫩草嫩草 | 美女污软件 | 欧亚一区二区三区 | av美国| 国产在线中文字幕 | 久九九| 日本一区二区免费在线观看 | 免费国产黄色 | 国产成人一区 | 岛国片免费在线观看 | 欧美日韩国产中文字幕 | 极品少妇一区 | 亚欧精品视频一区二区三区 | 国产一区二区小说 | av狠狠 |