Python问题记录:如何处理中文网页中的多余空格
生活随笔
收集整理的這篇文章主要介紹了
Python问题记录:如何处理中文网页中的多余空格
小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.
在制作Epub電子書的時(shí)候,因?yàn)橛袕木W(wǎng)絡(luò)上下載的格式比較混亂的電子書,現(xiàn)在打算自己用Pythonc處理一下。
1、如何刪除掉網(wǎng)頁(yè)(html)中的多余空額。尤其是包含在tag(標(biāo)簽:span、p)當(dāng)中的。
下面我們一步一步的來(lái)摸索下如何去做。因?yàn)榫W(wǎng)頁(yè)呢都是由許多的字符串組成的,那么假如一個(gè)字符串里有空格如何處理呢?
?(1)對(duì)于一個(gè)字符串如何刪除其中的空格呢?
# -*- coding: utf-8 -*- a = '美國(guó)數(shù)學(xué)家,對(duì) 策論的創(chuàng)始人?!U?/span>';a = a.replace(" ","");print a;這樣可以刪除字符串中的空格,注意這里沒有測(cè)試這種方法的效率問題,先解決這樣問題,下面再去處理這個(gè)東西。
?
轉(zhuǎn)載于:https://www.cnblogs.com/xuanyuanchen/p/4555392.html
總結(jié)
以上是生活随笔為你收集整理的Python问题记录:如何处理中文网页中的多余空格的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: jstl fmt:formatNumbe
- 下一篇: Python 爬虫: 抓取花瓣网图片