Python自动解压各种压缩文件
壓縮文件是我們在使用電腦時經常會遇到的。壓縮文件并不只有一種壓縮模式。平常我們都是通過安裝一些解壓縮軟件來打開這些不同的壓縮文件。今天我們來談一談,如何用Python解壓幾種常見類型的壓縮文件。
??一、需求描述
編寫一個Python程序,每次下載壓縮包形式的文件后,自動將內部文件解壓到當前文件夾后將壓縮包刪除,通過本案例可以學到的知識點:
-
os?模塊綜合應用
-
glob?模塊綜合應用
-
利用?gzip?zipfile?rarfile?tarfile?模塊解壓文件
?
??二、步驟分析和前置知識
碼代碼之前需要將復雜問題解釋成多個明確的要求,即這個程序實現的邏輯為:
定時檢測某個文件夾(如 download 文件夾)是否存在壓縮文件
如果有新出現的壓縮文件則將其解壓到當前文件夾內的新文件夾中 刪除壓縮文件
提到壓縮文件就要分不同壓縮格式進行討論,主要有以下4種:
“.gz: 即gzip,通常只能壓縮一個文件
.tar: 本質上不是壓縮工具而是打包工具,可以跟.gz配合形成.tar.gz的打包壓縮格式
.zip: 和.tar.gz很類似但可以打包壓縮多個文件
.rar: 打包壓縮文件,最初用于DOS
”因此,文件是否為壓縮文件的判斷邏輯可以如下:
建立一個含壓縮包后綴的列表?compressed_lst = ['gz', 'tar', 'zip', 'rar']
目標文件夾下的所有文件名運行filename.split(.)[-1]獲取后綴名
判斷后綴名是否在compressed_lst中,如果存在則運行后續的解壓代碼
如果是以gz結尾的文件,解壓后需要再次判斷是否是以.tar結尾,并進行相應處理
不同壓縮文件的解壓代碼各不相同,在后續代碼操作中具體展開。
??三、代碼實現
首先是獲取?download?文件夾下所有文件的文件名
import?glob import?ospath?=?r'C:\xxxx\download' file_lst?=?glob.glob(path?+?'/*') #?列表推導式 filename_lst?=?[os.path.basename(i)?for?i?in?file_lst]print(filename_lst)接下來根據文件的后綴名判斷是否需要壓縮,先看一下代碼框架
for?i?in?filename_lst:if?'.'?in?i:#?獲取后綴名suffix?=?i.split('.')[-1]#?逐個將后綴名和各格式的壓縮后綴匹配if?suffix?==?'gz':passif?...:?#?再次判斷新產生的文件名是否以?.tar?結尾passif?suffix?==?'tar':passif?suffix?==?'zip':passif?suffix?==?'rar':pass這里有2個注意點:
有些文件沒有后綴名,因此可能不存在?.,這時用?filename.split('.')[-1]會報錯,因此需要先判斷
以.gz?結尾的文件,解壓后需要再次判斷是否是以?.tar?結尾,然后我們就可以分別將四種壓縮文件的解壓代碼寫成函數,符合時候單獨調用即可
處理.gz 文件
import?gzipdef?ungz(filename):filename?=?filename[:-3]?#?gz文件的單文件解壓就是去掉?filename?后面的?.gzgz_file?=?gzip.GzipFile(filename)with?open(filename,?"w+")?as?file:file.write(gz_file.read())return?filename??#?這個gzip的函數需要返回值以進一步配合untar函數前面反復提及的gz文件有可能跟tar文件配合,因此解壓gz文件后需要再判斷是否有必要解開tar文件
這里就可以先把tar文件的函數寫出來👇
處理.tar文件
import?tarfiledef?untar(filename):tar?=?tarfile.open(filename)names?=?tar.getnames()#?tar本身是將文件打包,解除打包會產生很多文件,因此需要建立文件夾存放if?not?os.path.isdir(filename?+?"_dir"):os.mkdir(filename?+?"_dir")for?name?in?names:tar.extract(name,?filename?+?"_dir/")tar.close()處理.zip文件
import?zipfiledef?unzip(filename):zip_file?=?zipfile.ZipFile(filename)#?類似tar解除打包,建立文件夾存放解壓的多個文件if?not?os.path.isdir(filename?+?"_dir"):os.mkdir(filename?+?"_dir")for?names?in?zip_file.namelist():zip_file.extract(names,?filename?+?"_dir/")zip_file.close()處理.rar文件
import?rarfiledef?unrar(filename):rar?=?rarfile.RarFile(filename)if?not?os.path.isdir(filename?+?"_dir"):os.mkdir(filename?+?"_dir")os.chdir(filename?+?"_dir")rar.extractall()rar.close()可以看到,四種解壓代碼略有不同,推薦大家實際演示中自己體會一下差別,解壓后配合?os.remove()?就可以刪除壓縮包,現在看看邏輯框架補上解壓函數后的內容:
for?filename?in?filename_lst:if?'.'?in?filename:suffix?=?filename.split('.')[-1]if?suffix?==?'gz':new_filename?=?ungz(filename)os.remove(filename)if?new_filename.split('.')[-1]?==?'tar':untar(new_filename)os.remove(new_filename)??if?suffix?==?'tar':untar(filename)os.remove(filename)if?suffix?==?'zip':unzip(filename)os.remove(filename)if?suffix?==?'rar':unrar(filename)os.remove(filename)實現實時檢測
比較簡單的方法就是建立?while True?死循環配合?time.sleep()睡眠,框架如下:
import?timewhile?True:func()time.sleep(5)?#?睡眠秒數可以設置大一點避免過度占用資源最后將第二步的實現代碼改為函數并放在循環框架中就可以完成本次需求,完整代碼如下:
import?glob import?os import?gzip import?tarfile import?zipfile import?rarfile import?timepath?=?r'C:\xxxx\download' file_lst?=?glob.glob(path?+?'/*') filename_lst?=?[os.path.basename(i)?for?i?in?file_lst]def?ungz(filename):filename?=?filename[:-3]gz_file?=?gzip.GzipFile(filename)with?open(filename,?"w+")?as?file:file.write(gz_file.read())return?filenamedef?untar(filename):tar?=?tarfile.open(filename)names?=?tar.getnames()if?not?os.path.isdir(filename?+?"_dir"):os.mkdir(filename?+?"_dir")for?name?in?names:tar.extract(name,?filename?+?"_dir/")tar.close()def?unzip(filename):zip_file?=?zipfile.ZipFile(filename)if?not?os.path.isdir(filename?+?"_dir"):os.mkdir(filename?+?"_dir")for?names?in?zip_file.namelist():zip_file.extract(names,?filename?+?"_dir/")zip_file.close()def?unrar(filename):rar?=?rarfile.RarFile(filename)if?not?os.path.isdir(filename?+?"_dir"):os.mkdir(filename?+?"_dir")os.chdir(filename?+?"_dir")rar.extractall()rar.close()def?unzip_files():for?filename?in?filename_lst:if?'.'?in?filename:suffix?=?filename.split('.')[-1]if?suffix?==?'gz':new_filename?=?ungz(filename)os.remove(filename)if?new_filename.split('.')[-1]?==?'tar':untar(new_filename)os.remove(new_filename)if?suffix?==?'tar':untar(filename)os.remove(filename)if?suffix?==?'zip':unzip(filename)os.remove(filename)if?suffix?==?'rar':unrar(filename)os.remove(filename)while?True:unzip_files()time.sleep(5)以上便是用Python實現的一個自動后臺解壓的小工具,不是很復雜,但卻可以在某些場合提升你的工作效率。類似的小工具你也可以自己嘗試實現。
總結
以上是生活随笔為你收集整理的Python自动解压各种压缩文件的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 让Python pip下载速度加速
- 下一篇: 从中间件到分布式数据库生态,Shardi