1. 程式人生 > >awk匹配輸出正則部分

awk匹配輸出正則部分

(1)hadoop fs -ls hdfs://zhihu-tc:8020/user/hive/warehouse/ad_trigger.db/*??/|awk '{match($NF,/.*([0-9]{8}).*/,a); print $0}'

(2)awk提取"keyword":[和,"time""之間的特徵串

cat target.20180627.16 |awk -F"\t" '{match($2,/"keyword":\[(.*?),"time"/,a); gsub("]", "", a[1]); if(a[1] != "") print $1"\t"a[1]}'

注意:awk的match的貪婪匹配

(3)awk判斷字串僅含有中文和數字的方法:

echo ""杭州婚博會 2017""|awk '{gsub("[^\\u4e00-\\u9fa5]+|[0-9a-zA-Z]+","",$0); print $0 == ""}' 替換完如果為空就是僅含有中文和數字、字母的

https://blog.csdn.net/choumin/article/details/71023199