那些 Shell、Awk 中自動隱式型別轉換的“坑”
阿新 • • 發佈:2022-04-28
1、問題:
在林林總總的程式語言裡,弱型別的語言著實不少,一方面這種“動態型別”用起來很方便,而另一方面則“坑”你沒商量~ 常見的 SQL、Shell、Awk 都會遇到各種暗藏的“隱式型別轉換”,稍不留神就會“掉坑”。下面就列舉一些 shell、awk 裡的自動隱式型別轉換 case,防止掉坑。
- 注意 shell、awk 的變數為空 字串、變數為空 未定義、初始值的隱式轉換問題:
# shell 下的字典排序比較 root@localhost 10:59:23 /opt/script > [[ (( a > 0 )) ]] && echo 1 1 root@localhost 10:59:34 /opt/script > [[ (( 00 > 0 )) ]] && echo 1 1 # 雙括號不做算術比較,而是字串的字典比較,等同於 [[]] [[ (( 0 == 0 )) ]] && echo 1 1 root@localhost 13:04:27 /opt/script > [[ (( 11 > 110 )) ]] && echo 1 root@localhost 13:04:34 /opt/script > # shell 的字串比較不做轉換,嚴格按照字面量字典比較 root@localhost 11:51:41 /opt/script > [[ a == "" ]] && echo 1 root@localhost 14:00:53 /opt/script > [[ a > "" ]] && echo 1 1 root@localhost 14:00:59 /opt/script > [[ a > 0 ]] && echo 1 1 # shell 的數字型別隱式轉換:變數未定義會被轉換為 0 root@localhost 11:53:56 /opt/script > [[ a -eq 0 ]] && echo 1 1 root@localhost 11:54:11 /opt/script > [[ a1 -eq 1 ]] && echo 1 root@localhost 11:55:11 /opt/script > [[ 1a -eq 1 ]] && echo 1 -bash: [[: 1a: value too great for base (error token is "1a") # awk 隱式型別只轉換 1a,不轉換 a1 root@localhost 11:55:15 /opt/script > echo|awk '{print 1a == 1 }' 1 # awk 外接變數未定義會被置為空字串,且空字串不會隱式轉換為數字 root@localhost 14:12:57 /opt/script > echo|awk -va= '{print a == 0 }' 0 root@localhost 14:18:08 /opt/script > echo|awk '{print "" == 0 }' 0 root@localhost 14:13:01 /opt/script > echo|awk -va= '{print a == "" }' 1 # awk 內建變數未定義預設會隱式轉換為數字 0 或者空字串 root@localhost 14:13:12 /opt/script > echo|awk '{print a == 0 }' 1 root@localhost 14:13:48 /opt/script > echo|awk '{print a == "" }' 1 # awk 內建變數在比較時,一方加了雙引號,則最終結果當做字串比較(未定義的變數還是會自動隱式轉換) root@localhost 14:23:43 /opt/script > echo|awk '{print 0b == "00" }' 0 root@localhost 14:23:47 /opt/script > echo|awk '{print 0b == 00 }' 1 root@localhost 14:36:57 /opt/script > echo|awk '{print "00" == 0 }' # 明確標識字串的不再隱式轉換為數字 0 # awk 中的隱式轉換:無論最終結果是否以數字比較,未定義的變數都會自動隱式轉換 root@localhost 14:27:49 /opt/script > echo|awk '{print 0b == "0" }' 1 echo|awk '{y=0b; print y == "0" }' 1 echo|awk '{print 0b == 0 }' 1 echo|awk '{y="0b"; print y == "0" }' 0 echo|awk '{y="0b"; print +y == "0" }' 1 Jun@VAIO 23:49:55 ~ > echo|awk '{y="0b"; print +y == "00" }' 0 Jun@VAIO 23:49:59 ~ > echo|awk '{y="0b"; print (+y > "00") }' 0 Jun@VAIO 23:50:14 ~ > echo|awk '{y="0b"; print +y < "00" }' 1 root@localhost 14:41:16 /opt/script > echo|awk '{print "00"a == "00" }' 1 # awk 的外接變數參與比較時,與內建變數的隱式轉換特性不同,如果數字中含有非數字字串則直接被當做字串。 # 也就是說 awk 外接變數不具有內建變數對 非數字字元隱式轉換 的特性 root@localhost 16:16:27 /opt/script > a=0b; echo|awk -vm="$a" '{print m; print m == 0; print int(m) == 0 }' 0b 0 1 root@localhost 16:16:39 /opt/script > a=00; echo|awk -vm="$a" '{print m; print m == 0; print int(m) == 0 }' 00 1 1 root@localhost 16:16:59 /opt/script > a=00; echo|awk -vm="$a" '{print m; print m == "0"; print int(m) == "0" }' 00 0 1 root@localhost 16:20:11 /opt/script > a=00; echo|awk -vm="$a" '{print m; print m == "00"; print int(m) == 0 }' 00 1 1 Jun@VAIO 00:33:24 ~ > a=0b; echo|awk -vm="$a" '{b=0;print 0b; print 0b == 0; print int(m) == 0 }' 00 0 1 # 為避免上述 case 的各種歧義和不確定性,還是老老實實的用 +、int 強制轉換吧~ Jun@VAIO 00:43:55 ~ > echo|awk '{print int("1/*")}' 1 Jun@VAIO 00:47:31 ~ > echo|awk '{print int("*/1")}' 0 Jun@VAIO 00:47:38 ~ > echo|awk '{print +"*/1"}' 0 Jun@VAIO 00:47:47 ~ > echo|awk '{print +"1/*"}' 1 Jun@VAIO 00:47:53 ~ >
2、結論:
(1)shell 的自動隱式型別轉換相當弱,而 awk 相對而言容錯性好 (2)從 case 來看,如果單純的靠 shell、awk 的自動隱式型別轉換相當不靠譜,極其容易出錯, (3)為獲得確定的結果,還是老老實實的強制轉換吧,比如 awk 中使用 +、int 等。