日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程语言 > python >内容正文

python

pythondifflib详解_用python标准库difflib比较两份文件的异同详解

發布時間:2024/10/12 python 39 豆豆
生活随笔 收集整理的這篇文章主要介紹了 pythondifflib详解_用python标准库difflib比较两份文件的异同详解 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

【需求背景】

有時候我們要對比兩份配置文件是不是一樣,或者比較兩個文本是否異樣,可以使用linux命令行工具diff a_file b_file,但是輸出的結果讀起來不是很友好。這時候使用python的標準庫difflib就能滿足我們的需求。

下面這個腳本使用了difflib和argparse,argparse用于解析我們給此腳本傳入的兩個參數(即兩份待比較的文件),由difflib執行比較,比較的結果放到了一個html里面,只要找個瀏覽器打開此html文件,就能直觀地看到比較結果,兩份文件有差異的地方會高亮顯示出來。

【程序正文】

以python2.7為例,compare_two_files.py程序正文:

#!/bin/env python

# -*- coding: utf-8 -*-

# 20180430

import difflib

import sys

import argparse

# 讀取建表語句或配置文件

def read_file(file_name):

try:

file_desc = open(file_name, 'r')

# 讀取后按行分割

text = file_desc.read().splitlines()

file_desc.close()

return text

except IOError as error:

print 'Read input file Error: {0}'.format(error)

sys.exit()

# 比較兩個文件并把結果生成一份html文本

def compare_file(file1, file2):

if file1 == "" or file2 == "":

print '文件路徑不能為空:第一個文件的路徑:{0}, 第二個文件的路徑:{1} .'.format(file1, file2)

sys.exit()

else:

print "正在比較文件{0} 和 {1}".format(file1, file2)

text1_lines = read_file(file1)

text2_lines = read_file(file2)

diff = difflib.HtmlDiff() # 創建HtmlDiff 對象

result = diff.make_file(text1_lines, text2_lines) # 通過make_file 方法輸出 html 格式的對比結果

# 將結果寫入到result_comparation.html文件中

try:

with open('result_comparation.html', 'w') as result_file:

result_file.write(result)

print "0==}==========> Successfully Finished\n"

except IOError as error:

print '寫入html文件錯誤:{0}'.format(error)

if __name__ == "__main__":

# To define two arguments should be passed in, and usage: -f1 fname1 -f2 fname2

my_parser = argparse.ArgumentParser(description="傳入兩個文件參數")

my_parser.add_argument('-f1', action='store', dest='fname1', required=True)

my_parser.add_argument('-f2', action='store', dest='fname2', required=True)

# retrieve all input arguments

given_args = my_parser.parse_args()

file1 = given_args.fname1

file2 = given_args.fname2

compare_file(file1, file2)

【待比較的文件】

兩份文件分別是old_ddl_file和new_ddl_file,內容分別是——

old_ddl_file文件內容

CREATE EXTERNAL TABLE raw_tags(

p0 string COMMENT ‘uid',

p3 string COMMENT ‘tag name, e.g. news, games, fairs, shoopingURL',

p4 string COMMENT ‘e.g. 0, Games',

p11 int COMMENT ‘gender',

dt string COMMENT ‘date, like 26/6/2017',

action string COMMENT ‘clickmodule, click_taghead_link, clicklink')

CLUSTERED BY (

dt)

INTO 4 BUCKETS

ROW FORMAT DELIMITED

FIELDS TERMINATED BY ‘,'

STORED AS INPUTFORMAT

‘org.apache.hadoop.mapred.TextInputFormat'

OUTPUTFORMAT

‘org.apache.hadoop.hive.ql.io.HiveIgnoreKeyTextOutputFormat'

LOCATION

‘hdfs://hdfs-ha/apps/hive/warehouse/ksai.db/raw_tags'

TBLPROPERTIES (

‘numFiles'='1',

‘numRows'='0',

‘rawDataSize'='0',

‘totalSize'='70575510',

‘transient_lastDdlTime'='1500469448')

new_ddl_file文件內容

CREATE EXTERNAL TABLE raw_tags(

p0 string COMMENT ‘uid',

p3 string COMMENT ‘tag name, e.g. news, games, fairs, shoopingURL',

p4 string COMMENT ‘e.g. 0, Games',

p11 int COMMENT ‘gender',

dt string COMMENT ‘date, like 26/6/2017',

action string COMMENT ‘clickmodule, click_taghead_link, clicklink')

ROW FORMAT DELIMITED

FIELDS TERMINATED BY ‘,'

STORED AS INPUTFORMAT

‘org.apache.hadoop.mapred.TextInputFormat'

OUTPUTFORMAT

‘org.apache.hadoop.hive.ql.io.HiveIgnoreKeyTextOutputFormat'

LOCATION

‘hdfs://hdfs-ha/apps/hive/warehouse/ksai.db/raw_tags'

TBLPROPERTIES (

‘COLUMN_STATS_ACCURATE'='{\”BASIC_STATS\”:\”true\”}',

‘numFiles'='0',

‘numRows'='0',

‘rawDataSize'='0',

‘totalSize'='0',

‘transient_lastDdlTime'='1521546069')

肉眼很難看出來區別吧?

【執行結果】

那么就使用上面的腳本來比較,在linux命令行的使用方法 python -f1 file1 -f2 file2 也就是:

python compare_two_files.py -f1 old_ddl_file -f2 new_ddl_file

再把運行結果產生的html文件下載到本地,用任一種瀏覽器打開即可,如截圖:

運行結果:

使用瀏覽器查看html文件,可以看到,里面給出了各種顏色標注的圖例說明,一目了然。

以上這篇用python標準庫difflib比較兩份文件的異同詳解就是小編分享給大家的全部內容了,希望能給大家一個參考,也希望大家多多支持腳本之家。

總結

以上是生活随笔為你收集整理的pythondifflib详解_用python标准库difflib比较两份文件的异同详解的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。