日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當(dāng)前位置: 首頁 > 编程语言 > python >内容正文

python

python删除txt指定内容_使用Python删除文本文件中的部分内容 | 学步园

發(fā)布時間:2024/7/23 python 31 豆豆
生活随笔 收集整理的這篇文章主要介紹了 python删除txt指定内容_使用Python删除文本文件中的部分内容 | 学步园 小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

為了學(xué)習(xí)英語,我把從網(wǎng)上下載下來的電影轉(zhuǎn)換成純MP3文件,放到iTouch里去了,這樣就可以直接練習(xí)聽力了,另外把下載下來的字幕也放進(jìn)去,聽不懂的時候可以看,但有一個問題,網(wǎng)上載下來的字幕格式都如下所示:

7

00:01:44,789 --> 00:01:51,019

片名:當(dāng)幸福來敲門 / 追求幸福

8

00:02:49,469 --> 00:02:52,839

馬上來了

Should be here soon.

9

00:03:38,819 --> 00:03:41,189

- 我想我該列個表 - 干嘛?

-I think I should make a list. -What do mean?

10

00:03:41,189 --> 00:03:43,789

- 想要的生日禮物? - 對呀

-For your birthday gifts? -Yeah.

如上,但存在兩個問題:1、每一句前面都帶有數(shù)字編號;2、帶有時間戳;

我只想要里面的中英文文本,數(shù)字編號和時間戳都不需要。由于最近正在學(xué)習(xí)Python當(dāng)然首先就想到了做個Python腳本來把時間戳和編號刪掉。實(shí)現(xiàn)很簡單,基本思路就是使用正則表達(dá)式匹配,把空行、純數(shù)字行及帶有“-->”的行刪掉,然后再先回文本文件。

完成后的代碼如下:

# -*- coding: utf-8 -*-

# code=cp936

import string, re

title_txt = open('I://pursuit_for_happiness(ch).txt', 'r+')

try:

full_txt = title_txt.readlines()

regex1 = "/A/d*[/n]/Z"

regex2 = "/d --> /d"

#print full_txt

new_txt = []

for line in full_txt:

#print line

if re.match(regex1, line) or re.search(regex2, line):

#print "match", line

continue

else:

new_txt.append(line)

title_txt.seek(0)

title_txt.truncate(0)

#for line in full_txt:

# title_txt.writelines(line)

title_txt.writelines(new_txt)

finally:

title_txt.close()

print "Over"

過程中遇到一個問題:

1、Python中沒辦法清空一個文件,亂看了一通,發(fā)現(xiàn)使用truncate()方法,傳入?yún)?shù)為0時可以搞定。

2、開始的時候直接使用for遍歷list中的元素,匹配到就刪除,發(fā)現(xiàn)需要執(zhí)行多次腳本才能刪完,且有些還始終刪不掉,最后終于搞明白了:使用for i in list:時,如果一匹配到就刪除,則此時list中的元素會改變,進(jìn)入循環(huán)的下一輪時不出問題才怪。造孽,花了近一個小時才把這個問題搞定了。于是重新定義了一個空鏈表new_txt,使用它來存儲我要的字幕,循環(huán)完成后把new_txt寫回文件。大功告成!

爽,拷到我的iTouch里,開始學(xué)習(xí)英語了!

總結(jié)

以上是生活随笔為你收集整理的python删除txt指定内容_使用Python删除文本文件中的部分内容 | 学步园的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯,歡迎將生活随笔推薦給好友。