1. 程式人生 > 其它 >那些 Shell、Awk 中自動隱式型別轉換的“坑”

那些 Shell、Awk 中自動隱式型別轉換的“坑”

1、問題:

在林林總總的程式語言裡,弱型別的語言著實不少,一方面這種“動態型別”用起來很方便,而另一方面則“坑”你沒商量~ 常見的 SQL、Shell、Awk 都會遇到各種暗藏的“隱式型別轉換”,稍不留神就會“掉坑”。下面就列舉一些 shell、awk 裡的自動隱式型別轉換 case,防止掉坑。

  • 注意 shell、awk 的變數為空 字串、變數為空 未定義初始值的隱式轉換問題:
# shell 下的字典排序比較
root@localhost 10:59:23 /opt/script >
[[ (( a > 0 )) ]] && echo 1  							
1									
root@localhost 10:59:34 /opt/script >
[[ (( 00 > 0 )) ]] && echo 1  
1
# 雙括號不做算術比較,而是字串的字典比較,等同於 [[]]
[[ (( 0 == 0 )) ]] && echo 1   							
1						
root@localhost 13:04:27 /opt/script >
[[ (( 11 > 110 )) ]] && echo 1   
root@localhost 13:04:34 /opt/script >
# shell 的字串比較不做轉換,嚴格按照字面量字典比較
root@localhost 11:51:41 /opt/script >
[[ a == "" ]] && echo 1		
root@localhost 14:00:53 /opt/script >
[[ a > "" ]] && echo 1 
1
root@localhost 14:00:59 /opt/script >
[[ a > 0 ]] && echo 1  
1
# shell 的數字型別隱式轉換:變數未定義會被轉換為 0
root@localhost 11:53:56 /opt/script >
[[ a -eq 0 ]] && echo 1    
1														
root@localhost 11:54:11 /opt/script >
[[ a1 -eq 1 ]] && echo 1 								
root@localhost 11:55:11 /opt/script >
[[ 1a -eq 1 ]] && echo 1 
-bash: [[: 1a: value too great for base (error token is "1a")
# awk 隱式型別只轉換 1a,不轉換 a1
root@localhost 11:55:15 /opt/script >
echo|awk '{print 1a == 1 }'			
1
# awk 外接變數未定義會被置為空字串,且空字串不會隱式轉換為數字
root@localhost 14:12:57 /opt/script >
echo|awk -va= '{print a == 0 }' 
0				
root@localhost 14:18:08 /opt/script >
echo|awk '{print "" == 0 }' 
0
root@localhost 14:13:01 /opt/script >
echo|awk -va= '{print a == "" }'
1
# awk 內建變數未定義預設會隱式轉換為數字 0 或者空字串
root@localhost 14:13:12 /opt/script >
echo|awk '{print a == 0 }'      
1
root@localhost 14:13:48 /opt/script >
echo|awk '{print a == "" }'
1
# awk 內建變數在比較時,一方加了雙引號,則最終結果當做字串比較(未定義的變數還是會自動隱式轉換)
root@localhost 14:23:43 /opt/script >
echo|awk '{print 0b == "00" }' 	
0		
root@localhost 14:23:47 /opt/script >
echo|awk '{print 0b == 00 }'   
1
root@localhost 14:36:57 /opt/script >
echo|awk '{print "00" == 0 }' 	# 明確標識字串的不再隱式轉換為數字
0
# awk 中的隱式轉換:無論最終結果是否以數字比較,未定義的變數都會自動隱式轉換
root@localhost 14:27:49 /opt/script >
echo|awk '{print 0b == "0" }' 	
1			
echo|awk '{y=0b; print y == "0" }'     
1
echo|awk '{print 0b == 0 }'  
1
echo|awk '{y="0b"; print y == "0" }' 
0
echo|awk '{y="0b"; print +y == "0" }' 
1
Jun@VAIO 23:49:55 ~ >
echo|awk '{y="0b"; print +y == "00" }'
0
Jun@VAIO 23:49:59 ~ >
echo|awk '{y="0b"; print (+y > "00") }'
0
Jun@VAIO 23:50:14 ~ >
echo|awk '{y="0b"; print +y < "00" }'
1
root@localhost 14:41:16 /opt/script >
echo|awk '{print "00"a == "00" }' 
1
# awk 的外接變數參與比較時,與內建變數的隱式轉換特性不同,如果數字中含有非數字字串則直接被當做字串。
# 也就是說 awk 外接變數不具有內建變數對 非數字字元隱式轉換 的特性
root@localhost 16:16:27 /opt/script >
a=0b; echo|awk -vm="$a" '{print m; print m == 0; print int(m) == 0 }'	
0b
0
1
root@localhost 16:16:39 /opt/script >
a=00; echo|awk -vm="$a" '{print m; print m == 0; print int(m) == 0 }'  
00
1
1
root@localhost 16:16:59 /opt/script >
a=00; echo|awk -vm="$a" '{print m; print m == "0"; print int(m) == "0" }'
00
0
1
root@localhost 16:20:11 /opt/script >
a=00; echo|awk -vm="$a" '{print m; print m == "00"; print int(m) == 0 }'  
00
1
1
Jun@VAIO 00:33:24 ~ >
a=0b; echo|awk -vm="$a" '{b=0;print 0b; print 0b == 0; print int(m) == 0 }'
00
0
1
# 為避免上述 case 的各種歧義和不確定性,還是老老實實的用 +、int 強制轉換吧~
Jun@VAIO 00:43:55 ~ >
echo|awk '{print int("1/*")}'
1
Jun@VAIO 00:47:31 ~ >
echo|awk '{print int("*/1")}'
0
Jun@VAIO 00:47:38 ~ >
echo|awk '{print +"*/1"}'
0
Jun@VAIO 00:47:47 ~ >
echo|awk '{print +"1/*"}'
1
Jun@VAIO 00:47:53 ~ >

2、結論:

(1)shell 的自動隱式型別轉換相當弱,而 awk 相對而言容錯性好 (2)從 case 來看,如果單純的靠 shell、awk 的自動隱式型別轉換相當不靠譜,極其容易出錯, (3)為獲得確定的結果,還是老老實實的強制轉換吧,比如 awk 中使用 +、int 等。