python BeautifulSoup 爬虫运行出现 exited with code -1073741571
首先,exited with code -1073741571意思是棧溢出。具體可以看https://blog.csdn.net/vblittleboy/article/details/6613815
它的前一個錯誤是程序遞歸深度過深。
但我沒有在函數(shù)里用遞歸?
python認為你進入一個函數(shù)就進入更深一層的遞歸。
import sys#出現(xiàn)遞歸深度太深的問題? sys.setrecursionlimit(100000000)#把遞歸深度設深點。可以解決,
但又出現(xiàn)棧溢出。在隔行輸出調(diào)試法下我發(fā)現(xiàn)是<class 'bs4.element.Tag'>類型強制轉(zhuǎn)換str處退出的程序。也就是說,它導致了棧溢出。
soup = BeautifulSoup(html, 'html.parser') pbiaoqian = soup.find('p') print(str(pbiaoqian))#有問題?在這個錯誤之前,有一個問題,就是一個htm頁面有很多<p>標簽,但BeautifulSoup只要找一個就全在里面了。
之前用
for pbiaoqian in soup.find_all('p'):#prind(pbiaoqian.get_text())#調(diào)用方法#print(str(pbiaoqian))#或者直接轉(zhuǎn)換打印print(pbiaoqian)#這樣也能顯示它輸出的結(jié)果是find到的第一個<p>標簽,從頭輸出到尾。第二個輸出,find到的第二個<p>標簽開始,到尾。......最后一個<p>標簽。
言歸正傳。
我推測,棧溢出是因為調(diào)用強制類型轉(zhuǎn)換程序次數(shù)過多導致的,或者pbiaoqian里內(nèi)容過多類型轉(zhuǎn)換處理不了。
那么,解決方法就是:
1.報什么錯從哪里解決。
但windows修改棧空間大小要在編譯器里修改,因為它是由編譯器自動管理的。但F:\PyCharm Community Edition 2018.2.4\bin\pycharm.exe.vmoptions里盡是看不懂的參數(shù),前2個好像還是系統(tǒng)給編譯器分配的內(nèi)存設置。
File->settings瞎點了半天,也沒有找到Stack有關(guān)的單詞。
2.讓str的強制類型轉(zhuǎn)換能一次轉(zhuǎn)更多。
如果能像設置遞歸深度一樣設置棧空間大小就好了,
threading.stack_size(200000000)不過用起來好像沒什么效果,還是老樣子。
3.或者讓BeautifulSoup一次不find那么多,或者把find到的拆分成許多塊。
str拆分還能百度到方法,BeautifulSoup文檔里給它4個變量的介紹少得可憐,也沒有百度到。
思考一天未果。
也許你有同樣困擾,也許你能給我答案,可以在下面評論。
轉(zhuǎn)載于:https://www.cnblogs.com/Zf451452043/p/10129943.html
創(chuàng)作挑戰(zhàn)賽新人創(chuàng)作獎勵來咯,堅持創(chuàng)作打卡瓜分現(xiàn)金大獎總結(jié)
以上是生活随笔為你收集整理的python BeautifulSoup 爬虫运行出现 exited with code -1073741571的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 网易云音乐下载|网易云音乐电脑版下载
- 下一篇: python库--pandas--Ser