日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 综合教程 >内容正文

综合教程

Linux中awk后面的RS, ORS, FS, OFS 含义

發布時間:2023/12/13 综合教程 27 生活家
生活随笔 收集整理的這篇文章主要介紹了 Linux中awk后面的RS, ORS, FS, OFS 含义 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

轉載自http://blog.csdn.net/qq416647781/article/details/40649419

一、RS 與 ORS 差在哪
我們經常會說,awk是基于行列操作文本的,但如何定義“行”呢?這就是RS的作用。
默認情況下,RS的值是
。下面通過實例來理解下RS。
echo '1a2a3a4a5' | awk '{print $1}'
1a2a3a4a5
echo '1a2a3a4a5' | awk 'BEGIN{RS="a"}{print $1}'
1
2
3
4
5
我們可以看到,在更改了RS的值后,awk定義的行已經不是我們實際意義中的行了。
上面RS固定的字符串,RS也可以定義為正則表達式。
echo '1ab2bc3cd4de5' | awk 'BEGIN{RS="[a-z]+"}{print $1,RS,RT}'
1 [a-z]+ ab
2 [a-z]+ bc
3 [a-z]+ cd
4 [a-z]+ de
5 [a-z]+
當我們將RS設置為正則表達式的時候,RT這個變量就有作用了,RS的值始終為我們設定的正則,RT的值則是這個正則實際匹配到的內容。
如果RS被設置為空,那么awk會將連續的空行作為行分隔符,與RS設置成"

+"有什么區別???
1、忽略文件開頭和結尾的空行。且文件不以記錄分隔符結束,即最后不是空行,會將最后一個記錄的尾
去掉
2、不設置RT變量(測試未發現規律,暫時認為RT變量不可用)
3、影響FS變量
總結下RS的3種情況:
1) 非空字符串
以固定字符串作為行分隔符,同時設置變量RT為固定字符串
2) 正則表達式
以正則表達式作為行分隔符,同時設置變量RT為正則表達式實際匹配到的字符串
3) 空字符
以連續的空行作為行分隔符,如果FS為單個字符,會將
強制加入到FS變量中


理解了RS,再來理解ORS就簡單了。RS是awk讀取文件時的行分隔符,ORS則是awk輸出時的行結束符。
更簡單的講,就是awk在輸出時,會在每行記錄后面增加一個ORS變量所設定的值。
ORS的值只能設定為字符串,默認情況下,ORS的值是

seq 5 | awk '{print $0}'
1
2
3
4
5
seq 5 | awk 'BEGIN{ORS="a"}{print $0}'
1a2a3a4a5a
我們平常用的 print $0 等價于 printf $0 ORS


二、FS 與 OFS 差在哪
RS是awk用來定義“行”的,那么FS就是awk用來定義“列”的。
設置變量 FS 與使用 -F 參數是一樣的。
echo '1,2' | awk -F , '{print $1}'
1
echo '1,2' | awk 'BEGIN{FS=","}{print $1}'
1
與 RS 類似,FS 同樣可以設置為正則表達式
echo '1ab2bc3cd4de5' | awk 'BEGIN{FS="[a-z]+"}{print $1,$2,$5}'
1 2 5
FS 有1個特例,就是將FS設置為一個空格,FS=" " ,這也是FS的默認值
1.In the special case that FS is a single space, fields are separated by runs of spaces and/or tabs and/or newlines.
此時,awk會將連續的 空格 或 制表符( ) 或 換行符(
) 作為列的分隔符
那么,FS=" " 與 FS="[
]+" 有區別么???
答案是肯定的
echo ' 1 2' | awk 'BEGIN{FS=" "}{print $1}'
1
echo ' 1 2' | awk 'BEGIN{FS="[
]+"}{print $1}'

當FS=" "時,awk會自動去掉行首和行尾的 空格 或 制表符( ) 或 換行符(
),但FS="[
]+"是不會的
同樣,FS也可以設置為空
echo '123' | awk 'BEGIN{FS=""}{print $1,$2}'
1 2
當FS被設置為空字符串的時候,awk會將一行記錄的每個字符做為單獨的一列
類似的,當我們想以固定的長度來分隔列的時候,可以使用 FIELDWIDTHS 來代替 FS
例如,一行記錄的前3個字符作為第一列,接下來的2個字符作為第二列,接下來的4個字符作為第三列
echo '123456789' | awk 'BEGIN{FIELDWIDTHS="3 2 4"}{print $1,$2,$3}'
123 45 6789
echo '123456789' | awk 'BEGIN{FIELDWIDTHS="3 2 3"}{print $1,$2,$3}'
123 45 678
echo '123456789' | awk 'BEGIN{FIELDWIDTHS="3 2 5"}{print $1,$2,$3}'
123 45 6789
如果定義的長度小于實際的長度,awk會截斷,如果大于實際長度,則以實際長度為準。
總結下FS的4種情況:
1) 非空字符串
以固定字符串作為列分隔符
2) 正則表達式
以正則表達式作為列分隔符
3) 單個空格
以連續的 空格 或 制表符( ) 或 換行符(
)作為列分隔符
4) 空字符
以每個字符做為單獨的一列
接下來我們來看看上節提到的問題:
當 RS="" 時,會將
強制加入到FS變量中
cat urfile
1
a

2
a


3
awk -v RS="" '{print "#" $0 "#"}' urfile
#1
a#
#2
a#
#3#
awk -F "b" -v RS="" '{print $1}' urfile
1
2
3
awk -F "c" -v RS="" '{print $1}' urfile
1
2
3
awk -F "c" -v RS="

+" '{print "#" $1 "#"}' urfile
#1
a#
#2
a#
#3
#
如果FS為單個字符,
始終存在在 FS 中,而 RS="

+" 則不會。
了解的 FS ,我們來看看 OFS ,FS是awk讀入記錄時的列分隔符,OFS則是awk輸出時的列分隔符。
我們平時使用的 print $1,$2 等價于 print $1 OFS $2
echo '1 2' | awk -v OFS="|" '{print $1,$2}'
1|2
echo '1 2' | awk -v OFS="|" '{print $1 OFS $2}'
1|2
如果一行記錄有很多列,同時想改變輸出的分隔符,print $1,$2,$3 ... 啟不是很麻煩?
當然有簡單的方法:
echo '1 2 3 4 5' | awk -v OFS="|" '{print $0}'
1 2 3 4 5
echo '1 2 3 4 5' | awk -v OFS="|" '{$1=$1;print $0}'
1|2|3|4|5
echo '1 2 3 4 5' | awk -v OFS="|" '{NF+=0;print $0}'
1|2|3|4|5

為了使OFS的設置生效,需要改變 $0 ,這里我們是對 awk 撒了個小謊
$1=$1 或者 NF+=0, $0 本身的內容實際上沒有任何改變,只是為了使 OFS 的設置生效
在理解了 RS 和 FS 之后,我們來回顧開始的那句話:“awk是基于行列操作文本的”
這個說法實際上不是很準確,因為在改變了 RS 后,awk 中的“行”已經不是一般的“行”了
同樣,改變了 FS 后,awk 中的“列”也已經不是一般的“列”了
因此,準確的應該這樣講:“awk是基于 記錄(record) 和 域(field) 操作文本的”

三、0 與 "0" 差在哪
我們先來看一個例子:
awk 'BEGIN{if(0) print "true";else print "false"}'
false
awk 'BEGIN{if("0") print "true";else print "false"}'
true
為什么同樣是 0 ,結果卻不一樣?
其實要解釋這個問題,只需要弄清楚awk中的“真”與“假”。
以下3種情況是“假”,其他情況都為“真”
1) 數字 0
2) 空字符串
3) 未定義的值
awk 'BEGIN{a=0;if(a) print "true";else print "false"}'
false
awk 'BEGIN{a="";if(a) print "true";else print "false"}'
false
awk 'BEGIN{if(a) print "true";else print "false"}'
false

awk如何去重?
1.awk '! a[$0] ++'

在解釋之前,我們先要了解awk的一個特性:
awk 會根據語境來給未定義的變量賦初始值
awk 'BEGIN{print a "" 1}'
1
awk 'BEGIN{print a + 1}'
1

對于未定義的變量,如果要進行字符串操作,會被賦成空字符串 ""
如果要進行數學運算,會被賦成數字 0
現在我們看看上面的代碼 ! a[$0] ++ 等價于 if(! a[$0] ++) print $0
對于首次出現的記錄,a[$0]的值是未定義的,由于后面的 ++ 是數學計算,所以a[$0]會被賦值成數字0
也是由于 ++ 操作符,會先取值,再計算,所以對于第一行記錄實際上是if(! 0) print $0
! 是取反,0 是假,! 0 就是真,那么就會執行后面的 print $0
對于后面出現的重復記錄,a[$0] 經過 ++ 的計算已經變為 1、2、3 。。。
而 ! 1 ! 2 ! 3 ... 都為假,不會打印。
下面我們用黑哥的一段代碼來深刻體會一下,用awk打印奇數行:
seq 10 | awk 'i=!i'
1
3
5
7
9


總結

以上是生活随笔為你收集整理的Linux中awk后面的RS, ORS, FS, OFS 含义的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。

主站蜘蛛池模板: 日韩在线播放中文字幕 | 亚洲美女视频网站 | 黑丝av在线 | 国内自拍av | 亚洲成av人片 | 农村妇女愉情三级 | 日日草 | 三级伦理视频 | 午夜少妇久久久久久久久 | 拔插拔插海外华人永久免费 | 日韩欧美中出 | 久久96视频 | www.五月天婷婷 | 青青草视频成人 | 精品人妻一区二区三区日产 | 性少妇mdms丰满hdfilm | 午夜视频 | 天天看片天天射 | 国产码视频 | 国产精品国产一区二区 | 亚洲黄色在线视频 | 青青青在线观看视频 | 在线观看视频国产 | 色悠悠网址 | 上海毛片 | 亚洲图片自拍偷拍 | 成人精品亚洲 | 久久大综合 | 久久久久久久性 | 欧美日韩国产精品综合 | 91精品国产高清 | 欧美国产视频 | 欧美成人免费看 | 五月天婷婷丁香花 | 永久免费av在线 | 午夜精品无码一区二区三区 | 欧美第七页 | www天堂在线| 久久影视一区二区 | 久久亚洲精品小早川怜子 | 国产福利在线观看视频 | 日本精品免费视频 | 波多野结衣在线免费观看视频 | 欧美在线一二 | 日韩第一视频 | 夜夜爱夜夜操 | 成人网在线播放 | 亚洲精品1区2区3区 国产丝袜网站 | 中文字幕一二三四区 | 亚洲无码精品一区二区三区 | 欧美bbbbbbbbbbbb精品| 舌奴调教日记 | 99香蕉网 | 亚洲欧洲日韩综合 | 日日好av | 在线成人av网站 | 国产一级高清视频 | 国产精品久久久久毛片大屁完整版 | 亚洲成色网 | 一区二区三区中文字幕 | 国产在线自 | 亚洲免费在线播放 | 欧美三级久久 | 亚洲清色 | 日本黄色xxxxx| 草视频在线| 日本美女在线 | 欧美人与禽猛交乱配视频 | 国产一级片毛片 | 欧美偷拍一区二区三区 | 麻豆一区二区三区 | 谁有免费黄色网址 | 欧美日韩一级视频 | 九九视频精品在线 | 日韩不卡av在线 | 免费成年人视频在线观看 | 日本免费精品 | 你懂的网站在线 | 欧美大尺度视频 | 国产第113页 | 欧美精品久久久久a | 超碰人人爱 | a级小视频| 日日干夜夜操 | 国产男女无套免费网站 | 欧美涩色| 国产精品第一国产精品 | 国产日韩二区 | 99视频这里有精品 | 春色影视| 熟女毛毛多熟妇人妻aⅴ在线毛片 | 伊人操 | 亚洲成人av影片 | 国产精品久久久久无码av色戒 | 久久久久久www | 色综合久久88色综合天天免费 | 国产超碰精品 | av一二三四 | 亚洲精品字幕在线观看 |