Python爬虫编程思想(48):项目实战:抓取起点中文网的小说信息
生活随笔
收集整理的這篇文章主要介紹了
Python爬虫编程思想(48):项目实战:抓取起点中文网的小说信息
小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.
本文會(huì)利用requests庫(kù)抓取起點(diǎn)中文網(wǎng)上的小說(shuō)信息,并通過(guò)XPath提取相關(guān)的內(nèi)容,最后將經(jīng)過(guò)提取的內(nèi)容保存到Excel文件中。本例需要使用第三方的xlwt庫(kù),該庫(kù)用來(lái)通過(guò)Python操作Excel文件,需要使用下面的命令安裝xlwt庫(kù)。
pip install xlwt
使用xlwt庫(kù)非常簡(jiǎn)單,首先需要?jiǎng)?chuàng)建一個(gè)workbook,相當(dāng)于一個(gè)Excel文件,然后在workbook中添加若干個(gè)Sheet,接下來(lái)在每一個(gè)Sheet中的指定單元格(Cell)添加文本,最后使用workbook的save方法保存Excel文件。完整的實(shí)現(xiàn)代碼如下:
import xlwt # 創(chuàng)建Workbook對(duì)象,并指定編碼為utf-8 book = xlwt.Workbook(encoding='utf-8') # 添加第1個(gè)Sheet,名稱為Sheet1 sheet1 = book.add_sheet('Sheet1') # 添加第2個(gè)Sheet,名稱為Sheet2 sheet2 = book.add_sheet('Sheet2') # 向第1個(gè)Sheet的Cell(1,1)位置添加文本 sheet1.write(1,1,'世界,你好') # 向第1個(gè)Sheet總結(jié)
以上是生活随笔為你收集整理的Python爬虫编程思想(48):项目实战:抓取起点中文网的小说信息的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 一些常用外围电路的设计/硬件电路设计参考
- 下一篇: websocket python爬虫_p