當(dāng)前位置：首頁 > 运维知识 > linux >内容正文

linux

第二十五期:搞定Linux Shell文本处理工具，看完这篇集锦就够了

發(fā)布時間：2023/12/10 linux 44 豆豆

生活随笔收集整理的這篇文章主要介紹了第二十五期:搞定Linux Shell文本处理工具，看完这篇集锦就够了小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

Linux Shell是一種基本功，由于怪異的語法加之較差的可讀性，通常被Python等腳本代替。既然是基本功，那就需要掌握，畢竟學(xué)習(xí)Shell腳本的過程中，還是能了解到很多Linux系統(tǒng)的內(nèi)容。

Linux腳本大師不是人人都可以達到的，但是用一些簡單的Shell實現(xiàn)一些常見的基本功能還是很有必要的。

下面我介紹Linux下使用Shell處理文本時最常用的工具：

find、grep、xargs、sort、uniq、tr、cut、paste、wc、sed、awk；

提供的例子和參數(shù)都是最常用和最為實用的；

我對shell腳本使用的原則是命令單行書寫，盡量不要超過2行；

如果有更為復(fù)雜的任務(wù)需求，還是考慮python吧；

1、find 文件查找

查找txt和pdf文件

find?.?(?-name?"*.txt"?-o?-name?"*.pdf"?)?-print?

正則方式查找.txt和pdf

find?.?-regex??".*(.txt|.pdf)$"?

-iregex：忽略大小寫的正則

否定參數(shù)

查找所有非txt文本

find?.?!?-name?"*.txt"?-print?

指定搜索深度

打印出當(dāng)前目錄的文件（深度為1）

find?.?-maxdepth?1?-type?f???

定制搜索

按類型搜索：

find?.?-type?d?-print??//只列出所有目錄?

-type f 文件 / l 符號鏈接

按時間搜索：

-atime 訪問時間 (單位是天，分鐘單位則是-amin，以下類似）

-mtime 修改時間（內(nèi)容被修改）

-ctime 變化時間（元數(shù)據(jù)或權(quán)限變化）

最近7天被訪問過的所有文件：

find?.?-atime?7?-type?f?-print?

按大小搜索：

w字 k M G

尋找大于2k的文件

find?.?-type?f?-size?+2k?

按權(quán)限查找：

find?.?-type?f?-perm?644?-print?//找具有可執(zhí)行權(quán)限的所有文件?

按用戶查找：

find?.?-type?f?-user?weber?-print//?找用戶weber所擁有的文件?

找到后的后續(xù)動作

刪除：

刪除當(dāng)前目錄下所有的swp文件：

find?.?-type?f?-name?"*.swp"?-delete?

執(zhí)行動作（強大的exec）

find?.?-type?f?-user?root?-exec?chown?weber?{}?;?//將當(dāng)前目錄下的所有權(quán)變更為weber?

注：{}是一個特殊的字符串，對于每一個匹配的文件，{}會被替換成相應(yīng)的文件名；

eg：將找到的文件全都copy到另一個目錄：

find?.?-type?f?-mtime?+10?-name?"*.txt"?-exec?cp?{}?OLD?;?

結(jié)合多個命令

tips: 如果需要后續(xù)執(zhí)行多個命令，可以將多個命令寫成一個腳本。然后 -exec 調(diào)用時執(zhí)行腳本即可；

-exec?./commands.sh?{}?;?

-print的定界符

默認使用' '作為文件的定界符；

-print0 使用''作為文件的定界符，這樣就可以搜索包含空格的文件；

2、grep 文本搜索

grep?match_patten?file?//?默認訪問匹配行?

常用參數(shù)

-o 只輸出匹配的文本行?VS?-v 只輸出沒有匹配的文本行

-c 統(tǒng)計文件中包含文本的次數(shù)

grep?-c?"text"?filename?

-n 打印匹配的行號

-i 搜索時忽略大小寫

-l 只打印文件名

在多級目錄中對文本遞歸搜索(程序員搜代碼的最愛）：

grep?"class"?.?-R?-n?

匹配多個模式

grep?-e?"class"?-e?"vitural"?file?

grep輸出以作為結(jié)尾符的文件名：（-z）

grep?"test"?file*?-lZ|?xargs?-0?rm?

?3、xargs 命令行參數(shù)轉(zhuǎn)換

xargs 能夠?qū)⑤斎霐?shù)據(jù)轉(zhuǎn)化為特定命令的命令行參數(shù)；這樣，可以配合很多命令來組合使用。比如grep，比如find；

將多行輸出轉(zhuǎn)化為單行輸出

cat?file.txt|?xargs?

是多行文本間的定界符

將單行轉(zhuǎn)化為多行輸出

cat?single.txt?|?xargs?-n?3?

-n：指定每行顯示的字段數(shù)

xargs參數(shù)說明

-d 定義定界符（默認為空格多行的定界符為）

-n 指定輸出為多行

-I {} 指定替換字符串，這個字符串在xargs擴展時會被替換掉,用于待執(zhí)行的命令需要多個參數(shù)時

eg：

cat?file.txt?|?xargs?-I?{}?./command.sh?-p?{}?-1?

-0：指定為輸入定界符

eg：統(tǒng)計程序行數(shù)

find?source_dir/?-type?f?-name?"*.cpp"?-print0?|xargs?-0?wc?-l?

?4、sort 排序

字段說明：

-n 按數(shù)字進行排序 VS -d 按字典序進行排序

-r 逆序排序

-k N 指定按第N列排序

eg：

sort?-nrk?1?data.txtsort?-bd?data?//?忽略像空格之類的前導(dǎo)空白字符?

5、uniq 消除重復(fù)行

消除重復(fù)行

sort?unsort.txt?|?uniq?

統(tǒng)計各行在文件中出現(xiàn)的次數(shù)

sort?unsort.txt?|?uniq?-c?

找出重復(fù)行

sort?unsort.txt?|?uniq?-d?

可指定每行中需要比較的重復(fù)內(nèi)容：-s 開始位置 -w 比較字符數(shù)

?6、用tr進行轉(zhuǎn)換

通用用法

echo?12345?|?tr?'0-9'?'9876543210'?//加解密轉(zhuǎn)換，替換對應(yīng)字符??cat?text|?tr?'???'?'?'??//制表符轉(zhuǎn)空格?

tr刪除字符

cat?file?|?tr?-d?'0-9'?//?刪除所有數(shù)字?

-c 求補集

cat?file?|?tr?-c?'0-9'?//獲取文件中所有數(shù)字??cat?file?|?tr?-d?-c?'0-9?

' ?//刪除非數(shù)字數(shù)據(jù)

tr壓縮字符

tr -s 壓縮文本中出現(xiàn)的重復(fù)字符；最常用于壓縮多余的空格

cat?file?|?tr?-s?'?'?

字符類

tr中可用各種字符類：

alnum：字母和數(shù)字

alpha：字母

digit：數(shù)字

space：空白字符

lower：小寫

upper：大寫

cntrl：控制（非可打印）字符

print：可打印字符

使用方法：tr [:class:] [:class:]

eg:?tr?'[:lower:]'?'[:upper:]'?

?7、cut 按列切分文本

截取文件的第2列和第4列：

cut?-f2,4?filename?

去文件除第3列的所有列：

cut?-f3?--complement?filename?

-d 指定定界符：

cat?-f2?-d";"?filename?

cut 取的范圍

N- 第N個字段到結(jié)尾

-M 第1個字段為M

N-M N到M個字段

cut 取的單位

-b 以字節(jié)為單位

-c 以字符為單位

-f 以字段為單位（使用定界符）

eg:

cut?-c1-5?file?//打印第一到5個字符??cut?-c-2?file??//打印前2個字符?

?8、paste 按列拼接文本

將兩個文本按列拼接到一起;

cat?file112cat?file2colinbookpaste?file1?file21?colin2?book?

默認的定界符是制表符，可以用-d指明定界符

paste file1 file2 -d ","

1,colin

2,book

?9、wc 統(tǒng)計行和字符的工具

wc -l file // 統(tǒng)計行數(shù)

wc -w file // 統(tǒng)計單詞數(shù)

wc -c file // 統(tǒng)計字符數(shù)

?10、sed 文本替換利器

首處替換

seg?'s/text/replace_text/'?file???//替換每一行的第一處匹配的text?

全局替換

seg?'s/text/replace_text/g'?file?

默認替換后，輸出替換后的內(nèi)容，如果需要直接替換原文件,使用-i：

seg?-i?'s/text/repalce_text/g'?file?

移除空白行：

sed?'/^$/d'?file?

變量轉(zhuǎn)換

已匹配的字符串通過標記&來引用.

echo?this?is?en?example?|?seg?'s/w+/[&]/g'$>[this]??[is]?[en]?[example]?

子串匹配標記

第一個匹配的括號內(nèi)容使用標記 ?來引用

sed?'s/hello([0-9])//'?

雙引號求值

sed通常用單引號來引用；也可使用雙引號，使用雙引號后，雙引號會對表達式求值：

sed?'s/$var/HLLOE/'?

當(dāng)使用雙引號時，我們可以在sed樣式和替換字符串中指定變量；

eg:p=pattenr=replacedecho?"line?con?a?patten"?|?sed?"s/$p/$r/g"$>line?con?a?replaced?

其它示例

字符串插入字符：將文本中每行內(nèi)容（PEKSHA）轉(zhuǎn)換為 PEK/SHA

sed 's/^.{3}/&//g' file

?11、awk 數(shù)據(jù)流處理工具

awk腳本結(jié)構(gòu)

awk?'?BEGIN{?statements?}?statements2?END{?statements?}?'?

工作方式

1.執(zhí)行begin中語句塊；

2.從文件或stdin中讀入一行，然后執(zhí)行statements2，重復(fù)這個過程，直到文件全部被讀取完畢；

3.執(zhí)行end語句塊；

print 打印當(dāng)前行

使用不帶參數(shù)的print時，會打印當(dāng)前行;

echo?-e?"line1?

ine2"?|?awk?'BEGIN{print?"start"}?{print?}?END{?print?"End"?}'?

print 以逗號分割時，參數(shù)以空格定界;

echo?|?awk?'?{var1?=?"v1"?;?var2?=?"V2";?var3="v3";?print?var1,?var2?,?var3;?}'$>v1?V2?v3?

使用-拼接符的方式（""作為拼接符）;

echo?|?awk?'?{var1?=?"v1"?;?var2?=?"V2";?var3="v3";?print?var1"-"var2"-"var3;?}'$>v1-V2-v3?

特殊變量：NR NF $0 $1 $2

NR:表示記錄數(shù)量，在執(zhí)行過程中對應(yīng)當(dāng)前行號；

NF:表示字段數(shù)量，在執(zhí)行過程總對應(yīng)當(dāng)前行的字段數(shù)；

$0:這個變量包含執(zhí)行過程中當(dāng)前行的文本內(nèi)容；

$1:第一個字段的文本內(nèi)容；

$2:第二個字段的文本內(nèi)容；

echo?-e?"line1?f2?f3?

line2?

line?3"?|?awk?'{print?NR":"$0"-"$1"-"$2}'?

打印每一行的第二和第三個字段：

awk?'{print?$2,?$3}'?file?

統(tǒng)計文件的行數(shù)：

awk?'?END?{print?NR}'?file?

累加每一行的第一個字段：

?echo?-e?"1?

"?|?awk?'BEGIN{num?=?0?;??print?"begin";}?{sum?+=?$1;}?END?{print?"==";?print?sum?}'?

傳遞外部變量

var=1000echo?|?awk?'{print?vara}'?vara=$var?#??輸入來自stdinawk?'{print?vara}'?vara=$var?file?#?輸入來自文件?

用樣式對awk處理的行進行過濾

awk 'NR < 5' #行號小于5

awk 'NR==1,NR==4 {print}' file #行號等于1和4的打印出來

awk '/linux/' #包含linux文本的行（可以用正則表達式來指定，超級強大）

awk '!/linux/' #不包含linux文本的行

設(shè)置定界符

使用-F來設(shè)置定界符（默認為空格）

awk?-F:?'{print?$NF}'?/etc/passwd?

讀取命令輸出

使用getline，將外部shell命令的輸出讀入到變量cmdout中；

echo?|?awk?'{"grep?root?/etc/passwd"?|?getline?cmdout;?print?cmdout?}'?

在awk中使用循環(huán)

for(i=0;i<10;i++){print?$i;}?

for(i?in?array){print?array[i];}?

eg:

以逆序的形式打印行：(tac命令的實現(xiàn)）

seq?9|?awk?'{lifo[NR]?=?$0;?lno=NR}?END{?for(;lno>-1;lno--){print?lifo[lno];}}?'?

awk實現(xiàn)head、tail命令

head:

awk?'NR<=10{print}'?filename?

tail:

awk?'{buffer[NR%10]?=?$0;}?END{for(i=0;i<11;i++){??print?buffer[i?%10]}?}?'?filename?

打印指定列

awk方式實現(xiàn)：

ls?-lrt?|?awk?'{print?$6}'?

cut方式實現(xiàn)

ls?-lrt?|?cut?-f6?

打印指定文本區(qū)域

確定行號

seq?100|?awk?'NR==4,NR==6{print}'?

確定文本

打印處于start_pattern 和end_pattern之間的文本；

awk?'/start_pattern/,?/end_pattern/'?filename?

eg:

seq?100?|?awk?'/13/,/15/'cat?/etc/passwd|?awk?'/mai.*mail/,/news.*news/'?

awk常用內(nèi)建函數(shù)

index(string,search_string):返回search_string在string中出現(xiàn)的位置

sub(regex,replacement_str,string):將正則匹配到的第一處內(nèi)容替換為replacement_str;

match(regex,string):檢查正則表達式是否能夠匹配字符串；

length(string)：返回字符串長度

echo?|?awk?'{"grep?root?/etc/passwd"?|?getline?cmdout;?print?length(cmdout)?}'?

printf 類似c語言中的printf，對輸出進行格式化

eg：

seq?10?|?awk?'{printf?"->%4s?

",?$1}'?

12、迭代文件中的行、單詞和字符

（1）迭代文件中的每一行

while 循環(huán)法

while?read?line;doecho?$line;done?<?file.txt改成子shell:cat?file.txt?|?(while?read?line;do?echo?$line;done)?

awk法：

cat?file.txt|?awk?'{print}'?

（2）迭代一行中的每一個單詞

for?word?in?$line;do?echo?$word;done?

（3）迭代每一個字符

${string:start_pos:num_of_chars}：從字符串中提取一個字符；(bash文本切片）

${#word}:返回變量word的長度

for((i=0;i<${#word};i++))doecho?${word:i:1);done??

閱讀目錄（置頂)(長期更新計算機領(lǐng)域知識）https://blog.csdn.net/weixin_43392489/article/details/102380691

閱讀目錄（置頂)(長期更新計算機領(lǐng)域知識）https://blog.csdn.net/weixin_43392489/article/details/102380882

閱讀目錄（置頂)(長期科技領(lǐng)域知識）https://blog.csdn.net/weixin_43392489/article/details/102600114

總結(jié)

以上是生活随笔為你收集整理的第二十五期:搞定Linux Shell文本处理工具，看完这篇集锦就够了的全部內(nèi)容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯，歡迎將生活随笔推薦給好友。

上一篇： c++编写托管dll_教程：如何编写简单
下一篇：在Linux下禁用键盘、鼠标、触摸板（笔

日韩av黄I国产麻豆传媒I国产91av视频在线观看I日韩一区二区三区在线看I美女国产在线I麻豆视频国产在线观看I成人黄色短片

linux

第二十五期:搞定Linux Shell文本处理工具，看完这篇集锦就够了

總結(jié)