可能是最通俗易懂的 Java 位操作運算講解

阿新 • • 發佈：2019-02-14

Java 位操作這是一項很基礎很基礎的知識內容，在所有 Android 和 Java 開發者的學習之路上，大家都接觸過，但是實際運用的場景卻很少見，很多人估計都忘記有這個知識點了。事實上，在 C/C++ 開發領域因為與硬體的聯絡更緊密，所以位操作運算應用的更普遍。Java 因為面向物件的特性很多時候不需要接觸位操作，但是在某些特定場景下，巧妙運用位操作，能夠起到非常高效的的表現。這篇博文不談應用，只詳細講解與位操作有關的知識點。

基礎大講堂

所有數值都是2進位制

軟體開發者都知道 10 進位制、16 進位制、8 進位制。
比如數字 10 的各位進位制形式表現如下。

十進位制：10
八進位制：012
十六進位制：0x0a
二進位制：1010

我們可以開啟系統的自帶的計算器(Win鍵 + R –> 輸入 CMD 開啟命令列視窗 –> calc 按回車)，看看上面的結論。
這裡寫圖片描述

雖然有很多種進位制，但是實際上計算機所認識的資料只有 0 和 1,因此所有的數值不管它是十進位制、十六進位制也好都會統統在底層被翻譯成二進位制數值。

int a = 5;
//0101 就是 a 的二進位制表示。  

int b = 520;
//1000001000 就是 b 的二進位制表示

bit、byte、world

bit (位) bit 電腦記憶體中最小的單位，在二進位電腦系統中，每一 bit 可以代表 0 或 1 的數位訊號。所以它能表示的數字範圍就是 0 ~ 1。

byte (位元組) 一個 byte 由 8 bit 組成，所以理論上一個 byte 能表示的資料範圍是 0 ~ 255。
word (字) 一個 word 由 2 byte 組成，所以理論上一個 word 能表示的資料範圍是 0 ~ 65535。

大家可以看這張圖加深下理解。
這裡寫圖片描述

32 位與 64 位作業系統。

一般計算機裝置上，CPU 主要有 32 位和 64 位（當然，微控制器有 8 位和 16 位），32 位 CPU 能夠定址的範圍是 4 GB。所以過去的電腦裝置記憶體最高一般只能到達 4 GB。後來，隨著晶片技術的發展，越來越多的機器採用了 64 位 CPU。這使得機器的最大記憶體可以為 16 GB。

那麼好，我們再來談談 32 位作業系統與 64 位作業系統。實際上它們分別是針對 CPU 型別設計的軟體系統。

32 bit 是 4 byte。通常一條 CPU 指令是 4 byte。在 32 位作業系統上，如果一條 CPU 指令是 4 byte，那麼 CPU 執行一次能夠讀取 32 bit 內容，所以一個指令週期內就能夠完成指令，如果一條 CPU 指令是 8 byte 的話，那麼 32 位作業系統就需要通過 2 個指令週期才能完成指令的讀取，而對應的 64 位作業系統因為一次能夠讀取 64 bit 內容，所以它在一個指令週期就能夠讀取指令。所以，理論上，64 位的作業系統是要比 32 位作業系統要快 1 倍。

但還有幾個需要大家注意的地方是：
1. 64 位 CPU 機器可以安裝 32 位作業系統，但效率自然跟 32 位作業系統一樣。
2. 32 位 CPU 機器也可以安裝 64 位作業系統。
3. 64 位 CPU 機器安裝 64 位作業系統才最有效率，但跟軟體優化也有關係。

不同的作業系統平臺，給 C/C++ 基本資料型別變數分配的位元組是不一樣的。

32位編譯器：

  char ：1個位元組
  char*（即指標變數）: 4個位元組（32位的定址空間是2^32, 即32個bit，也就是4個位元組。同理64位編譯器）
  short int : 2個位元組
  int：  4個位元組
  unsigned int : 4個位元組
  float:  4個位元組
  double:   8個位元組
  long:   4個位元組
  long long:  8個位元組
  unsigned long:  4個位元組

64位編譯器：

  char ：1個位元組
  char*(即指標變數): 8個位元組
  short int : 2個位元組
  int：  4個位元組
  unsigned int : 4個位元組
  float:  4個位元組
  double:   8個位元組
  long:   8個位元組
  long long:  8個位元組
  unsigned long:  8個位元組

上面講的是 C/C++ 在不同平臺上的位元組長度差別，但是對於 Java 而言，由於 Java 是跨平臺語言，所以 JVM 表現下的基礎資料位元組長度其實都是一致的。


int：4 個位元組。

short：2 個位元組。

long：8 個位元組。

byte：1 個位元組。

float：4 個位元組。

double：8 個位元組。

char：2 個位元組。

boolean：boolean屬於布林型別，在儲存的時候不使用位元組，僅僅使用 1 位來儲存，範圍僅僅為0和1，其字面量為true和false。

我們可以看到 Java 與 C/C++ 的基本資料型別位元組長度有些不一致，所以涉及到網路通訊互動或者是 JNI 開發時，資料的轉換有時需要考慮下基礎的位元組長度。

本篇文章的主要內容是 Java 中的位操作，所以基礎資料長度也是以 Java 中定義的為準。

原碼反碼補碼

我們已經知道了一個 int 型數值是 4 個位元組。每個位元組有 8 位。但對於一個 int 或者其它整數型別如（long）的數值而言還要注意的是，它的最高位是符號位。

最高位為0表示正數。
最高位為1表示負數

原碼將一個數字轉換成二進位制就是這個數值的原碼。

int a = 5; //原碼  0000 0000 0000 0101
int b = -3;  //原碼  1000 0000 0000 0011

反碼
分兩種情況：正數和負數

正數正數的反碼就是原碼。
負數負數的反碼是在原碼的基礎上，符號位不變其它位都取反。

5 的原碼：0000 0000 0000 0101

-3 的原碼：1000 0000 0000 0011
-3 的反碼：1111 1111 1111 1100

補碼
仍然分正數和負數兩種情況

正數正數的補碼就是原碼。
負數負數的補碼在反碼的基礎上加1。

5 的補碼：0000 0000 0000 0101


-3 的反碼：1111 1111 1111 1100
-3 的補碼: 1111 1111 1111 1101

計算機在進行數值運算的時候，是通過補碼錶示每個數值的。

比如

5 - 3 = 5 + ( -3 )
相當於 0000 0000 0000 0101 + 1111 1111 1111 1101
    = 1 0000 0000 0000 0010

最後的結果是1 0000 0000 0000 0010 這樣的二進位制，由於 int 型別只有 4 byte，所以最高位產生了溢位，進位 1 被丟棄。結果就變成了 0010 也就是 2，5 - 3 = 2 沒有毛病。

這裡寫圖片描述

位運算子 &、|、~、^、>>、<<

位運算子包含與運算子、或運算子、取反運算子、異或運算子、左移運算子和右移運算子。在下面的內容中，我將會一一講解。

需要注意的是，下面測試用的資料都是 int 型別，int 型別是 4 個位元組長度，但是為了方便說明示例中用的數值我都用 1 個位元組表示。希望不會給大家造成困擾。

& 與運算子

規則與運算時，進行運算的兩個數，從最低位到最高位，一一對應。如果某 bit 的兩個數值對應的值都是 1，則結果值相應的 bit 就是 1，否則為 0.

0 & 0 = 0,

0 & 1 = 0,

1 & 1 = 1

3 & 5 = 1 這是因為

按照規則，將兩個數值按照低位到高位一一對齊運算，因為只有第 0 位都為 1，所以計算結果為 1.

| 或運算子

規則與運算時，進行運算的兩個數，從最低位到最高位，一一對應。如果某 bit 的兩個數值對應的值只要 1 個為 1，則結果值相應的 bit 就是 1，否則為 0。

0 | 0 = 0,

0 | 1 = 1,

1 | 1 = 1

3 | 5 = 7 這是因為

~ 取反運算子

規則對運算元的每一位進行操作，1 變成 0，0 變成 1。

~5 =>  0000 0101   ~  => 1111 1010

^ 異或運算子

規則兩個運算元進行異或時，對於同一位上，如果數值相同則為 0，數值不同則為 1。

1 ^ 0 = 1,

1 ^ 1 = 0,

0 ^ 0 = 0;

3 ^ 5 = 6,這是因為

值得注意的是 3 ^ 5 = 6,而 6 ^ 5 = 3

針對這個特性，我們可以將異或運算作為一個簡單的資料加密的形式。比如，將一個mp4檔案所有數值與一個種子數值進行異或得到加密後的資料，解密的時候再將資料與種子數值進行異或一次就可以了。

所以說異或運算可以作為簡單的加解密運算演算法。

>> 右移運算子

規則 a >> b 將數值 a 的二進位制數值從 0 位算起到第 b - 1 位，整體向右方向移動 b 位，符號位不變，高位空出來的位補數值 0。

5 >> 1 ===>  1000 0000 0000 0101 >> 1  = 1000 0000 0000 0010 = 2
7 >> 2 ===>  1000 0000 0000 0111 >> 2  = 1000 0000 0000 0001 = 1
9 >> 3 ===>  1000 0000 0000 1001 >> 3  = 1000 0000 0000 0001 = 1
11 >> 2 ===> 1000 0000 0000 1011 >> 2 = 1000 0000 0000 0010 = 2

大家發現什麼規律沒有？a >> b = a / ( 2 ^ b ) ,所以 5 >> 1= 5 / 2 = 2,11 >> 2 = 11 / 4 = 2。

<< 左移運算子

規則 a << b 將數值 a 的二進位制數值從 0 位算起到第 b - 1 位，整體向左方向移動 b 位，符號位不變，低位空出來的位補數值 0。

5 << 1 ===>  1000 0000 0000 0101 << 1  = 1000 0000 0000 1010 = 10
7 << 2 ===>  1000 0000 0000 0111 << 2  = 1000 0000 0001 1100 = 28
9 << 3 ===>  1000 0000 0000 1001 << 3  = 1000 0000 0100 1000 = 72
11 << 2 ===> 1000 0000 0000 1011 << 2 = 1000 0000 0010 1100 = 44

很明顯就可以看出 a << b = a * (2 ^ b)

綜合上面兩個可以看到，如果某個數值右移 n 位，就相當於拿這個數值去除以 2 的 n 次冪。如果某個數值左移 n 位，就相當於這個數值乘以 2 ^ n。

總結

Java 的位運算內容就是上面講到的這些，這些東西都非常簡單。但是有時候簡單的東西卻能很大程式上提高開發效率。之所以想起寫這篇文章，是因為在閱讀 Android 相關程式碼時，正好看到了位運算的身影，只覺得非常好用和巧妙。下一篇文章我會專門來介紹 Java 位運算在 Android 原始碼中的巧妙應用。文章寫完後我會放上鍊接地址。

可能是最通俗易懂的 Java 位操作運算講解

基礎大講堂

所有數值都是2進位制

bit、byte、world

32 位與 64 位作業系統。

原碼反碼補碼

位運算子 &、|、~、^、>>、<<

& 與運算子

| 或運算子

~ 取反運算子

^ 異或運算子

>> 右移運算子

<< 左移運算子

總結

參考內容

可能是最通俗易懂的 Java 位操作運算講解

我見過最通俗易懂的快速排序過程講解，轉自《坐在馬桶上看演算法：快速排序》

深入理解Java中的回撥機制（最通俗易懂的回撥機制的部落格）

淺談Java泛型<最通俗易懂的講解>

淺談java註解<最通俗易懂的講解>

淺談java過濾器Filter<最通俗易懂的講解>

最通俗易懂的 Java 10 新特性講解

最通俗易懂的 Java 11 新特性講解

史上最通俗易懂的理解雲計算

最通俗易懂的理解什麼是資料庫

最通俗易懂的NIO原理解釋

史上最通俗易懂的IPFS入門介紹：01

最通俗易懂的樂觀鎖與悲觀鎖原理及實現

史上最通俗易懂的IPFS入門介紹：03

最通俗易懂的------------時間複雜度

最通俗易懂的Sql語法排序

最全的最通俗易懂的演算法——排序演算法【1】

最通俗易懂的組織機構樹教程(easyuiTree)，沒有之一

史上最通俗易懂的YOLOv2講解

講透大資料，我只需要一頓飯（最通俗易懂的大資料解釋）

可能是最通俗易懂的 Java 位操作運算講解

基礎大講堂

所有數值都是2進位制

bit、byte、world

32 位與 64 位作業系統。

原碼 反碼 補碼

位運算子 &、|、~、^、>>、<<

& 與運算子

| 或運算子

~ 取反運算子

^ 異或運算子

>> 右移運算子

<< 左移運算子

總結

參考內容

相關推薦

原碼反碼補碼