關於異或^的用法 [轉載]
轉自:https://www.lijinma.com/blog/2014/05/29/amazing-xor/
什麽是異或?
Wikipedia的解釋:
在邏輯學中,邏輯算符異或(
exclusive or
)是對兩個運算元的一種邏輯析取類型,符號為 XOR 或 EOR 或 ⊕(編程語言中常用^
)。但與一般的邏輯或不同,異或算符的值為真僅當兩個運算元中恰有一個的值為真,而另外一個的值為非真。轉化為命題,就是:“兩者的值不同。”或“有且僅有一個為真。”
定義:
1 ⊕ 1 = 0
0 ⊕ 0 = 0
1 ⊕ 0 = 1
0 ⊕ 1 = 1
真值表:
Y | B = 0 | B = 1 | |
---|---|---|---|
A = 0 | 0 | 1 | |
A = 1 | 1 | 0 |
表達式:
Y = A’ · B + A · B’
解釋:我使用
·
作為與
,我使用+
作為或
,我使用‘
作為否
(本來應該使用頭上一橫
,但是太難編輯了,就使用了‘
);
異或有什麽特性?
根據定義我們很容易獲得異或
兩個特性:
恒等律:
X ⊕ 0 = X
歸零律:X ⊕ X = 0
然後我們使用真值表
可以證明:
(1)交換律
1
2
3
|
|
因為·與
和+或
兩個操作滿足交換律,所以:
A ⊕ B = B ⊕ A
(2)結合律
1
2
3
4
5
6
7
8
9
10
11
12
13
|
|
你可以使用同樣推導方法得出(請允許我偷懶一下,數學公式敲起來不容易 +_+):
1
2
3
|
|
證明過程中使用了如下幾個方法(·與
+或
‘否
):
·與
+或
交換律:
1
2
3
|
|
·與
+或
結合律:
1
2
3
|
|
·與
+或
分配律:
1
2
3
|
|
摩爾定理:
1
2
3
|
|
結論:
交換律:
A ⊕ B = B ⊕ A
結合律:A ⊕ (B ⊕ C) = (A ⊕ B) ⊕ C
有了歸零率
和結合律
,我們就可以輕松證明:
自反:
A ⊕ B ⊕ B = A ⊕ 0 = A
可能這些特性會很順其自然的理解,但是如果你在解決問題的時候,你可能會忘記異或的這些特性,所以適當的應用可以讓我們加深對異或的理解;
1
2
3
4
|
|
異或有什麽神奇之處(應用)?
說明:以下的的
異或
全部使用符號^
可能你已經被亂七八糟的公式和演算搞的有點煩了,不就是很簡單的異或運算嗎?還解釋的那麽復雜,嘿嘿,不要著急,打好了基礎,你就站在了巨人的肩膀,讓我們開始異或的神奇之旅吧;
(1)快速比較兩個值
先讓我們來一個簡單的問題;判斷兩個int數字a,b是否相等,你肯定會想到判斷a - b == 0
,但是如果判斷a ^ b == 0
效率將會更高,但是為什麽效率高呢?就把這個給你當家庭作業吧,考慮下減法是如何實現的; 讓我們看看ipv6中的比較;
1
2
3
4
5
6
7
|
|
(2)在匯編語言中經常用於將變量置零:xor a,a
;
(3)我們可以使用異或
來使某些特定的位翻轉,因為不管是0或者是1與1做異或將得到原值的相反值;
0 ^ 1 = 1
1 ^ 1 = 0
例如:翻轉10100001
的第6位, 答案:可以將該數與00100000
進行按位異或運算;10100001 ^ 00100000 = 10000001
我們給出一段常用的代碼:
1
2
3
|
|
(4)我們使用異或
來判斷一個二進制數中1的數量是奇數還是偶數
例如:求10100001
中1的數量是奇數還是偶數; 答案:1 ^ 0 ^ 1 ^ 0 ^ 0 ^ 0 ^ 0 ^ 1 = 1
,結果為1
就是奇數個1,結果為0
就是偶數個1; 應用:這條性質可用於奇偶校驗(Parity Check),比如在串口通信過程中,每個字節的數據都計算一個校驗位,數據和校驗位一起發送出去,這樣接收方可以根據校驗位粗略地判斷接收到的數據是否有誤
(5)校驗和恢復
校驗和恢復主要利用的了異或的特性:IF a ^ b = c THEN a ^ c = b
應用:一個很好的應用實例是RAID5
,使用3塊磁盤(A、B、C)組成RAID5
陣列,當用戶寫數據時,將數據分成兩部分,分別寫到磁盤A和磁盤B,A ^ B
的結果寫到磁盤C;當讀取A的數據時,通過B ^ C
可以對A的數據做校驗,當A盤出錯時,通過B ^ C
也可以恢復A盤的數據。
RAID5的實現比上述的描述復雜多了,但是原理就是使用 異或,有興趣的同學看下RAID5
(6)經典題目:不使用其他空間,交換兩個值
1
2
3
|
|
這個題目就不用解釋了吧,太大眾題目了,哈哈,但是非常好的使用的了異或
的特性;
(7)面試題:互換二進制數的奇偶位;
題目:寫一個宏定義,實現的功能是將一個int型的數的奇偶位互換,例如6的2進制為00000110
,(從右向左)第一位與第二位互換,第三位與第四位互換,其余都是0不需要交換,得到00001001
,輸出應該為9;
思路:我們可以把我們的問題分為三步(難道這也是分治法嗎 -。-),第一步,根據原值的偶數位獲取到目標值的奇數位,並把不需要的位清零;第二步,根據原值的奇數位獲取到目標值的偶數位,並把不需要的位清零;第三步:把上述兩個殘缺的目標值合並成一個完整的目標值;
代碼為:
1
2
3
4
5
6
7
8
9
|
|
解釋: 1.為簡化說明,我們以4位二進制碼為例,0xAAAA 我們用 1010 代替;0x5555 我們用 0101 代替; 2.(n<<1)&(1010) 把n先左移1位,再與1010做與運算,只保留移位之後的偶數位的值,奇數位全為0,實際上是只保留了n的奇數位的值,並把它們交換到了偶數位上。比如 n = 0110 , n<<1 = 1100, (n<<1) & 1010 = 1000 ; 3.(n>>1)&(0101) 把n右移一位,再與 0101 做與運算,只保留移位之後的奇數位的值,偶數位全為0,實際是只保留n 的偶數位的值,並把它們交換到對應的奇數位上。n = 0110; n>>1 = 0011; (n>>1) & 0101 = 0001; 4.最後做或運算(相加),得到1001。
(7)最最常出現的面試題:一個整型數組裏除了N個數字之外,其他的數字都出現了兩次,找出這N個數字;
比如,從{1, 2, 3, 4, 5, 3, 2, 4, 5}
中找出單個的數字: 1
讓我們從最簡單的,找一個數字開始;
題目:(LeetCode 中通過率最高的一道題) Single Number: Given an array of integers, every element appears twice except for one. Find that single one. Note:Your algorithm should have a linear runtime complexity. Could you implement it without using extra memory? 思路: 拿到這個題目,本能的你會使用排序(數字文字我們常常需要排序),排序後可以來判斷是否數字成對出現,思路很明顯,但是排序的算法上限是 O(nlogn),不符合題目要求;
學習了強大的異或
,我們可以輕松的使用它的特性來完成這道題目: (1)A ^ A = 0; (2)異或滿足交換律、結合律; 所有假設有數組:A B C B C D A
使用異或:
1
2
3
4
5
|
|
是不是很神奇?時間復雜度為O(n)
,當然是線性的,空間復雜度O(1)
;
代碼:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
|
|
接下來讓我們增加一些難度:
題目:一個整型數組裏除了兩
個數字之外,其他的數字都出現了兩次。請寫程序找出這兩個只出現一次的數字?
思路: 第一步:肯定還是像我們上面的解法一樣,所有數進行異或
,不過最終得到的結果是 a 和 b(假設 a 和 b 是落單的數字)兩個值的異或結果 aXORb,沒有直接得到 a 和 b 的值;
第二步:想辦法得到 a 或者 b,假設 aXORb 為 00001001
(F肯定不為0),根君 aXORb 的值我們發現,值為1的位
(比如從右向左第一位)表示在此位上 a 和 b 的值不同;所以,根據這個特點,我們找出來所有第一位為1的數進行異或,得到的就是 a 或者 b;
第三步:aXORb = a ^ b,假設我們已經找到了 a,根據異或
特性,我們知道,b = aXORb ^ a;這樣我們就可以找出 b;所以我們只需要循環兩次;
這樣我們的時間復雜度是 O(n),空間復雜度是 O(1) 代碼:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
|
|
接下來讓我們再增加一些難度:
題目:一個整型數組裏除了三
個數字之外,其他的數字都出現了兩次。請寫程序找出這兩個只出現一次的數字?
思路:
第一步:肯定還是像我們上面的解法一樣,所有數進行異或
,不過最終得到的結果是 a、b 和 c(假設 a、b 和 c 是落單的數字)三個值的異或結果 aXORbXORc,沒有直接得到 a、b 和 c 的值;
第二步:想辦法得到 a、b 和 c 中的一個,讓偶們把問題簡化一下;
假設一個數組中有3個不同的數字 a、b 和 c,已知 aXORbXORc = a ^ b ^ c ,求 a、b 和 c 。
思路: 1. 根據題目 aXORbXORc ^ a = b ^ c; aXORbXORc ^ b = a ^ c; aXORbXORc ^ c = a ^ b; 因為:(b ^ c) ^ (a ^ c) ^ (a ^ b) = 0; 所以:(aXORbXORc ^ a) ^ (aXORbXORc ^ b) ^ (aXORbXORc ^ c) = 0;
-
下一步是關鍵: 假設 X ^ Y ^ Z = 0,則 X Y Z 三個數的低位第一位為1的位置兩個相同,一個不同; 比如 X: 00001000, Y: 00000100, Z: 00001100 Y和Z的低位第一位都是00000100, X的低位第一位是00001000; 這一步可以使用倒推法證明: 已知:三個數的低位第一位為1的位置有三種情況,一種就是全相同,一種就是兩個不同,一個不同,一種就是三個不同; (1)如果是全相同,則 X ^ Y ^ Z != 0 (1 ^ 1 ^ 1 = 1),與前提X ^ Y ^ Z = 0矛盾,不成立; (2)如果三個不同,則 X ^ Y ^ Z != 0 (1 ^ 0 ^ 0 = 1),與前提X ^ Y ^ Z = 0矛盾,不成立; 所以結果是:兩個不同,一個不同
-
(aXORbXORc ^ a) ^ (aXORbXORc ^ b) ^ (aXORbXORc ^ c) = 0; 所以三個數(aXORbXORc ^ a)、(aXORbXORc ^ b) 和 (aXORbXORc ^ c) 的低位第一位為1的位置兩個相同,一個不同;那麽我們獲取到這三個數的低位第一位為1的位置後,進行異或並取低位第一位為1的位置,就可以找到三個中“一個不同”的低位第一位為1的位置,假設這個值為 firstOneBit。
-
遍歷這三個數(aXORbXORc ^ a)、(aXORbXORc ^ b) 和 (aXORbXORc ^ c),如果發現某個數異或 aXORbXORc 等於 firstOneBit,這個數就是“一個不同”的那個數;
-
找到了一個數,剩下的兩個數,我們就可以通過上面的方法找出來;
第三步:完成了第二步的簡化題,我們回到我們的問題,我們的問題比簡化的問題多了一個成對的幹擾數據,我們可以使用異或要去除幹擾數據(記住,我們這個題目都是用異或i去除幹擾數據的);
這樣我們的時間復雜度還是 O(n),空間復雜度是 O(1)
代碼如下:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
|
|