當前位置：首頁 > 编程语言 > python >内容正文

python

perl python文本处理_awk, python, perl文本处理效率对比(zz)

發布時間：2024/9/19 python 42 豆豆

生活随笔收集整理的這篇文章主要介紹了 perl python文本处理_awk, python, perl文本处理效率对比(zz) 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

轉載，比較結果不一定正確，比較設計不一定科學.

以下3個文件依次是用python、awk和perl寫的腳本，做同一件事情：

diff.sh f1 f2

f1和f2每一行的第一個字段(以空格分割)為key，如果f2某一行的key在f1中不存在，則輸出f2該行。

比如：

a.dat的內容是

1 a

2 a

b.dat的內容是

1 b

3 b

那么diff.sh a.dat b.dat則輸出

3 b

代碼：

#!/usr/bin/python

import sys

if len(sys.argv) != 3:

print "Usage: " + sys.argv[0] + "file1 file2";

sys.exit(-1);

file1 = sys.argv[1]

file2 = sys.argv[2]

list1 = {};

for line in open(file1):

list1[line.split()[0]] = 1;

for line in open(file2):

key = line.split()[0];

if key not in list1:

sys.stdout.write(line)

#!/bin/sh

if [[ $# < 2 ]];then

echo "Usage: $0 file1 file2"

exit

function do_diff()

{

if [[ $# < 2 ]];then

echo "Usage: $0 file1 file2"

return 1

if [[ ! -f $1 ]];then

echo "$1 is not file"

return 2

if [[ ! -f $2 ]];then

echo "$2 is not file"

return 3

awk '

BEGIN{FS=OFS=" "}

ARGIND == 1 {

arr[$1] = 1;

}

ARGIND == 2 {

if (!($1 in arr)) {

print $0;

}

' $1 $2

}

do_diff $1 $2

#!/usr/bin/perl -w

exit if (1 > $#ARGV);

my %map_orig;

my $file_orig = shift @ARGV;

open FH, "

while () {

chomp;

#$map_orig{$_} = 1;

my ($filed) = split /\s+/;

$map_orig{$filed} = 1;

}

close (FH);

my $file_diff = shift @ARGV;

open FH, "

while () {

chomp;

my ($filed) = split /\s+/;

print "$_\n" if (!defined$map_orig{$filed});

}

close (FH)

測試方法：time diff.xx f1 f2 > out

測試文件f1有107375330行，每一行格式為：

key value(兩個字段)

文件大小為2.2G

f2有473951行，每一行的格式也是：

key value(兩字段)

文件大小為5.9M

測試結果：

diff.py的時間為3m24.687s = 205s

diff.sh的時間為3m39.762s = 220s

diff.pl的時間為5m49.478s = 349s

結果顯示awk和python的性能差不多，perl則要明顯差些。看來python的dict優化得很好，居然能趕上awk的性能，很出乎我的意料。

總結

以上是生活随笔為你收集整理的perl python文本处理_awk, python, perl文本处理效率对比(zz)的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

上一篇：矩阵迹的性质_矩阵（含逆）的迹、行列式关
下一篇： python列表解析式如何使用_pyth

日韩av黄I国产麻豆传媒I国产91av视频在线观看I日韩一区二区三区在线看I美女国产在线I麻豆视频国产在线观看I成人黄色短片

python

perl python文本处理_awk, python, perl文本处理效率对比(zz)

總結