shell之实战应用一(查找xml文档中的关键字段)
前幾天同事問我一個(gè)問題,說如下的文檔中,如何把name后面的字段(紅色框中的字段)單獨(dú)打印出來?
?
其實(shí)這個(gè)很簡單,先用sed過濾,然后用cut分割顯示即可實(shí)現(xiàn),如下:
sed -n '/name/p' a.xml | cut -d '"' -f 2?使用sed命令的name匹配(或者field也可以)行,然后用cut把"作為分割符取第2列即可
?
或者使用awk也可以實(shí)現(xiàn):
awk -F '"' '$0~"name"{print $2}' a.xml #或者 awk 'BEGIN{FS="\""}$0~"name"{print $2}' a.xml?上面語句是把界定符放在了外面,使用參數(shù)標(biāo)識(shí)
下面語句是把界定符放在了語句里面,因?yàn)殡p引號(hào)是特殊字符,所以使用反斜杠轉(zhuǎn)義一下
?
但我同事說,這個(gè)可不止只有一條數(shù)據(jù),如果是多條數(shù)據(jù),會(huì)重復(fù)打印字段,部分?jǐn)?shù)據(jù)如下:
這時(shí)我們需要對語句進(jìn)行稍微的加工,如果使用sed,則需要如下操作:
sed -n '/name/p' b.xml | cut -d '"' -f 2 | sort |uniq?后面多加了倆個(gè)命令sort和uniq,sort是排序,uniq是去重,只有排序了才能去重,否則不生效。這里也可以把sort和uniq直接寫成sort -u,當(dāng)然如果需要反序,可以寫成sort -ur
?
當(dāng)然使用awk也是可以的,寫成如下:
awk 'BEGIN{FS="\""}nameflag[$2]==$2{next}$0~"name"{print $2;nameflag[$2]=$2}' b.xml?我們這里加了一個(gè)數(shù)列來存儲(chǔ)第二個(gè)字段,然后來比較第二個(gè)字段是否再出現(xiàn),如果出現(xiàn)就跳過執(zhí)行后面的行,這樣就避免了重復(fù)
?
大家有什么更好的解決辦法可以留言!
?
轉(zhuǎn)載于:https://www.cnblogs.com/watertaro/p/9311449.html
總結(jié)
以上是生活随笔為你收集整理的shell之实战应用一(查找xml文档中的关键字段)的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: sublime text3 最新 lic
- 下一篇: 安装仪表盘控件Iocomp会遇到的几个常