python爬取中国最好大学排名(实例)
生活随笔
收集整理的這篇文章主要介紹了
python爬取中国最好大学排名(实例)
小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.
要求
爬取2018年最好大學(xué)網(wǎng)上排名前20的學(xué)校,以表格形式輸出,包括(排名,學(xué)校名稱,總分)
代碼
根據(jù)基本要求可以編寫出初始代碼A
#CrawUnivRankingA.py import requests from bs4 import BeautifulSoup import bs4 def getHTMLText(url):try:r=requests.get(url,timeout=30)r.raise_for_status()r.encoding=r.apparent_encodingreturn r.textexcept:return""def fillUnivList(ulist,html):soup=BeautifulSoup(html,"html.parser")for tr in soup.find('tbody').children:if isinstance(tr,bs4.element.Tag):tds=tr('td')ulist.append([tds[0].string,tds[1].string,tds[3].string])def printUnivList(ulist,num):print("{:^10}\t{:^6}\t{:^10}".format("排名","學(xué)校名稱","總分"))for i in range(num):u=ulist[i]print("{:^10}\t{:^6}\t{:^10}".format(u[0],u[1],u[2]))def main():uinfo=[]url='http://www.zuihaodaxue.cn/zuihaodaxuepaiming2018.html'html=getHTMLText(url)fillUnivList(uinfo,html)printUnivList(uinfo,20) #排名前二十 main()但是輸出效果如下:
學(xué)校名稱居中對(duì)齊并未對(duì)齊,是因?yàn)樽詣?dòng)填充的是英文的空格,要想使得中文獲得居中應(yīng)填充中文的空格,所以進(jìn)行代碼優(yōu)化,得到代碼B:
主要優(yōu)化部分為:
def printUnivList(ulist,num):tplt="{0:^10}\t{1:{3}^10}\t{2:^10}"print(tplt.format("排名","學(xué)校名稱","總分",chr(12288)))for i in range(num):u=ulist[i]print(tplt.format(u[0],u[1],u[2],chr(12288)))利用chr(12288)進(jìn)行優(yōu)化,以后很多項(xiàng)目中對(duì)中文居中對(duì)齊格式優(yōu)化都會(huì)運(yùn)用它
優(yōu)化后輸出:
總結(jié)
以上是生活随笔為你收集整理的python爬取中国最好大学排名(实例)的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: ZEMAX实例学习5:施密特—卡塞格林系
- 下一篇: MYSQL数据库ANY的用法_列子查询中