為什麼？為什麼？Java處理排序後的陣列比沒有排序的快？想過沒有？

阿新 • • 發佈：2020-08-17

先看再點贊，給自己一點思考的時間，微信搜尋【沉默王二】關注這個有顏值卻假裝靠才華苟且的程式設計師。
本文 GitHub github.com/itwanger 已收錄，裡面還有我精心為你準備的一線大廠面試題。

今天週日，沒什麼重要的事情要做，於是我早早的就醒來了。看了一會渡邊淳一的書，內心逐漸感到平靜——心情不佳的時候，書好像是最好的藥物。心情平靜了，就需要做一些更有意義的事情——逛技術網站，學習精進。

Stack Overflow 是我最喜歡逛的一個網站，它是我 Chrome 瀏覽器的第一個書籤。裡面有很多很多經典的問題，其中一些回答，剖析得深入我心。就比如說這個：“為什麼處理排序後的陣列比沒有排序的快？”

毫無疑問，直觀印象裡，排序後的陣列處理起來就是要比沒有排序的快，甚至不需要理由，就好像我們知道“夏天吃冰激凌就是爽，冬天穿羽絨服就是暖和”一樣。

但本著“知其然知其所以然”的態度，我們確實需要去搞清楚到底是為什麼？

來看一段 Java 程式碼：

/**
 * @author 沉默王二，一枚有趣的程式設計師
 */
public class SortArrayFasterDemo {
    public static void main(String[] args) {
        // 宣告陣列
        int arraySize = 32768;
        int data[] = new int[arraySize];

        Random rnd = new Random(0);
        for (int c = 0; c < arraySize; ++c) {
            data[c] = rnd.nextInt() % 256;
        }

        // !!! 排序後，比沒有排序要快
        Arrays.sort(data);

        // 測試
        long start = System.nanoTime();
        long sum = 0;

        for (int i = 0; i < 100000; ++i)
        {
            // 迴圈
            for (int c = 0; c < arraySize; ++c)
            {
                if (data[c] >= 128) {
                    sum += data[c];
                }
            }
        }

        System.out.println((System.nanoTime() - start) / 1000000000.0);
        System.out.println("sum = " + sum);
    }
}

這段程式碼非常簡單，我來解釋一下：

宣告一個指定長度（32768）的陣列。
宣告一個 Random 隨機數物件，種子是 0；rnd.nextInt() % 256 將會產生一個餘數，餘數的絕對值在 0 到 256 之間，包括 0，不包括 256，可能是負數；使用餘數對陣列進行填充。
使用 Arrays.sort() 進行排序。
通過 for 迴圈巢狀計算陣列累加後的結果，並通過 System.nanoTime() 計算前後的時間差，精確到納秒級。

我本機的環境是 Mac OS，記憶體 16 GB，CPU Intel Core i7，IDE 用的是 IntelliJ IDEA，排序後和未排序後的結果如下：

排序後：2.811633398
未排序：9.41434346

時間差還是很明顯的，對吧？未排序的時候，等待結果的時候讓我有一種擔心：什麼時候結束啊？不會結束不了吧？

讀者朋友們有沒有玩過火炬之光啊？一款非常經典的單機遊戲，每一個場景都有一副地圖，地圖上有很多分支，但只有一個分支可以通往下一關；在沒有刷圖之前，地圖是模糊的，玩家並不知道哪一條分支是正確的。

如果僥倖跑的是一條正確的分支，那麼很快就能到達下一關；否則就要往回跑，尋找正確的那條分支，需要花費更多的時間，但同時也會收穫更多的經驗和聲望。

作為一名玩過火炬之光很久的老玩家，幾乎每一幅地圖我都刷過很多次，刷的次數多了，地圖差不多就刻進了我的腦袋，即便是一開始地圖是模糊的，我也能憑藉經驗和直覺找到最正確的那條分支，就省了很多折返跑的時間。

讀者朋友們應該注意到了，上面的程式碼中有一個 if 分支——if (data[c] >= 128)，也就是說，如果陣列中的值大於等於 128，則對其進行累加，否則跳過。

那這個程式碼中的分支就好像火炬之光中的地圖分支，如果處理器能夠像我一樣提前預判，那累加的操作就會快很多，對吧？

處理器的內部結構我是不懂的，但它應該和我的大腦是類似的，遇到 if 分支的時候也需要停下來，猜一猜，到底要不要繼續，如果每次都猜對，那顯然就不需要折返跑，浪費時間。

這就是傳說中的分支預測！

我需要刷很多次圖才能正確地預測地圖上的路線，處理器需要排序才能提高判斷的準確率。

計算機發展了這麼多年，已經變得非常非常聰明，對於條件的預測通常能達到 90% 以上的命中率。但是，如果分支是不可預測的，那處理器也無能為力啊，對不對？

排序後花費的時間少，未排序花費的時間多，罪魁禍首就在 if 語句上。

if (data[c] >= 128) {
    sum += data[c];
}

陣列中的值是均勻分佈的（-255 到 255 之間），至於是怎麼均勻分佈的，我們暫且不管，反正由 Random 類負責。

為了方便講解，我們暫時忽略掉負數的那一部分，從 0 到 255 說起。

來看經過排序後的資料：

data[] = 0, 1, 2, 3, 4, ... 126, 127, 128, 129, 130, ... 250, 251, 252, ...
branch = N  N  N  N  N  ...   N    N    T    T    T  ...   T    T    T  ...

       = NNNNNNNNNNNN ... NNNNNNNTTTTTTTTT ... TTTTTTTTTT

N 是小於 128 的，將會被 if 條件過濾掉；T 是將要累加到 sum 中的值。

再來看未排序的資料：

data[] = 226, 185, 125, 158, 198, 144, 217, 79, 202, 118,  14, 150, 177, 182, 133, ...
branch =   T,   T,   N,   T,   T,   T,   T,  N,   T,   N,   N,   T,   T,   T,   N  ...

       = TTNTTTTNTNNTTTN ...

完全沒有辦法預測。

對比過後，就能發現，排序後的資料在遇到分支預測的時候，能夠輕鬆地過濾掉 50% 的資料，對吧？是有規律可循的。

那假如說不想排序，又想節省時間，有沒有辦法呢？

如果你直接問我的話，我肯定毫無辦法，兩手一攤，一副無奈臉。不過，Stack Overflow 以上帝視角給出了答案。

把：

if (data[c] >= 128) {
    sum += data[c];
}

更換為：

int t = (data[c] - 128) >> 31;
sum += ~t & data[c];

通過位運算消除了 if 分支（並不完全等同），但我測試了一下，計算後的 sum 結果是相同的。

/**
 * @author 沉默王二，一枚有趣的程式設計師
 */
public class SortArrayFasterDemo {
    public static void main(String[] args) {
        // 宣告陣列
        int arraySize = 32768;
        int data[] = new int[arraySize];

        Random rnd = new Random();
        for (int c = 0; c < arraySize; ++c) {
            data[c] = rnd.nextInt() % 256;
        }

        // 測試
        long start = System.nanoTime();
        long sum = 0;

        for (int i = 0; i < 100000; ++i)
        {
            // 迴圈
            for (int c = 0; c < arraySize; ++c)
            {
                if (data[c] >= 128) {
                    sum += data[c];
                }
            }
        }

        System.out.println((System.nanoTime() - start) / 1000000000.0);
        System.out.println("sum = " + sum);

        // 測試
        long start1 = System.nanoTime();
        long sum1 = 0;

        for (int i = 0; i < 100000; ++i)
        {
            // 迴圈
            for (int c = 0; c < arraySize; ++c)
            {
                int t = (data[c] - 128) >> 31;
                sum1 += ~t & data[c];
            }
        }

        System.out.println((System.nanoTime() - start1) / 1000000000.0);
        System.out.println("sum1 = " + sum1);
    }
}

輸出結果如下所示：

8.734795196
sum = 156871800000
1.596423307
sum1 = 156871800000

陣列累加後的結果是相同的，但時間上仍然差得非常多，這說明時間確實耗在分支預測上——如果陣列沒有排序的話。

最後，不得不說一句，大神級程式設計師不愧是大神級程式設計師，懂得位運算的程式設計師就是屌。

建議還在讀大學的讀者朋友多讀一讀《計算機作業系統原理》這種涉及到底層的書，對成為一名優秀的程式設計師很有幫助。畢竟大學期間，學習時間充分，社會壓力小，能夠做到心無旁騖，加油！

我是沉默王二，一枚有顏值卻假裝靠才華苟且的程式設計師。關注即可提升學習效率，別忘了三連啊，點贊、收藏、留言，我不挑，奧利給

為什麼？為什麼？Java處理排序後的陣列比沒有排序的快？想過沒有？

先看再點贊，給自己一點思考的時間，微信搜尋【沉默王二】關注這個有顏值卻假裝靠才華苟且的程式設計師。本文 GitHub github.com/itwanger 已收錄，裡面還有我精心為你準備的一線大廠面試題。今天週日，沒什麼重要的事情要做，於是我早早的就醒來了。看了一會渡邊淳一的書，內心逐漸感到平靜—

為什麼處理排序陣列比未排序陣列快

今天在群裡看到一個有意思的問題——為什麼處理排序陣列比處理沒有排序的陣列要快，這個問題來源於 StackoverFlow，雖然我看到程式碼略微知道原因，但是模模糊糊不夠清晰，搜了很多部落格也講的不夠明白，所以就自己來總結了。首先來看一下問題，下面是很簡單的一段程式碼，隨機生成一些數字，對其

Java自定義物件陣列、集合排序

//實體類： package CategoryDp2; import java.util.Comparator; public class Cat implements Comparator<Cat>,Comparable<Cat>{private

java實現將一列亂序的字元，'a','c','u','b','e','p','f','z',排序後並按照英文字母表的逆序輸出（陣列排序）

實現： package com.array.test; import java.util.Arrays; import java.util.Scanner; /** * 將一列亂序的字元，'a','c','u','b','e','p','f','z',排序後並按照英文字母表的逆

java實現將一列亂序的字元，'a','c','u','b','e','p','f','z',排序後並按照英文字母表的逆序輸出（陣列排序）

實現： package com.array.test; import java.util.Arrays; import java.util.Scanner; /** * 將一列亂序的字元，'a',

2.6使用二維陣列儲存學生的資料，包括學號、姓名、作業系統成績、Java成績、高數成績、總分；一行儲存一個學生的資料；要求輸入若干學生的資料，求出總分；然後按照總分由高到低重新排列；輸出排序後的結果

摩爾的Java學習筆記2.6 第二週作業： 1、實現將一組整數進行升序排列； 2、用二維陣列實現，5個學生4門課程的總分和平均分的統計工作； 3、列印八行八列楊輝三角，開頭

Java宣告一個10個元素的整數陣列，隨機賦值，列印輸出，排序後，列印輸出

import java.util.Random; public class Arr11{ public static void main(String[] args){ int[] aa =new int [10]; Rand

java消除整型陣列中重複的元素，排序後輸出新陣列

法一： import java.util.Arrays; import java.util.Scanner; public class Main { public static void main(String[] args) { int[] a = new in

為什麼處理排序的陣列要比非排序的快

這世上有三樣東西是別人搶不走的：一是吃進胃裡的食物，二是藏在心中的夢想，三是讀進大腦的書為什麼處理排序的陣列要比非排序的快問題以下是c++的一段非常神奇的程式碼。由於一些奇怪原因，對資料排序後奇蹟般的讓這段程式碼快了近6倍！！ #include <algorithm> #include

Java 練習：讀取該文件內容，並按照自然順序排序後輸出到另一個文件中

一個 string leo eno 順序 blog cat java output package com.swift; import java.io.FileInputStream; import java.io.FileNotFoundException; impo

（java）leetcode905 將陣列按奇偶性排序（Sort Array By Parity）

題目描述：給定一個非負整數陣列A，返回一個偶數在前，奇數在後的陣列。示例： Input: [3,1,2,4] Output: [2,4,3,1] 以下三個輸出 [4,2,3,1], [2,4,1,3], [4,2,1,3] 也是正確結果解題思路：新建一個數組newA，

JNI之c/c++返回中文給java 亂碼問題以及java陣列在c排序

c/c++返回中文給java時會亂碼，因為java和c/c++的編碼格式不一樣，java的utf-16，c/c++是utf-8，所以在返回中文字元的時候，包裝成gb2312返回。具體見如下部落格連結： jni互動中文亂問題分析 public class CodeTest {

python中將array陣列進行排序並獲取排序後的索引：argsort函式

argsort()函式是將x中的元素從小到大排列，提取其對應的index(索引) 當num>=0時，np.argsort()[num]就可以理解為y[num] 當num<0時，np.argsort()[num]就是把陣列y的元素反向輸出 import

Java基礎 String 裸暴力演算法- 五個小練習 Java陣列直接選擇排序、sort（）排序

之間的部落格,承上啟下: Java基礎 String/StringBuff 常用操作方法複習/記憶體分析 Java陣列直接選擇排序、sort（）排序 Java基礎 String 演算法 - 五個練習題目要求: /** 1.模擬一個trim方法，去除

Java集合框架17：鍵盤錄入學生資訊按照總分排序後輸出到控制檯

案例演示 package grade; importjava.util.Comparator; import java.util.Scanner; import java.util.TreeSet; public class Test7 { /**

Java中陣列的選擇排序，選擇排序優化

選擇排序：思路： int arr[]= {5,6,2,4,3,1}; //這個"[]“放在arr後面也是可以的,和C語言一樣流程: 第一輪比較 if(arr[0]>arr[1]){ //這裡 5不大於6，什麼都不做 int tem

Java中陣列的氣泡排序，氣泡排序優化

氣泡排序：思路： int[] arr={3,4,2,6,1}; 1.第一次排序，從索引[0]開始，依次兩兩比較。索引[0]與[1]比，[1]與[2]比，[2]與[3]比…… if(arr[0]<arr[1]){

jmu-Java&Python-統計一段文字中的單詞個數並按單詞的字母順序排序後輸出

現需要統計若干段文字(英文)中的不同單詞數量。如果不同的單詞數量不超過10個，則將所有單詞輸出(按字母順序)，否則輸出前10個單詞。注1：單詞之間以空格(1個或多個空格)為間隔。注2：忽略空行或者空格行。注3：單詞大小寫敏感，即'word'與'WORD'是兩個不同的單詞。輸入說明

Java實現陣列的氣泡排序

注意： 1 迴圈圈數越來越少 2 每次迴圈比較次數越來越少 3 每次比較都從索引0和索引1開始 public class BubbleSort{ public static void m

用random函式賦值產生一個整數陣列（陣列長度大於8，陣列元素取值均大於10並小於等於100），使用冒泡法進行排序，在頁面上輸出排序前和排序後的陣列。js

<!doctype html> <html> <head> <meta charset="utf-8"> <title>無標題文件</title> </head> <body>

為什麼？為什麼？Java處理排序後的陣列比沒有排序的快？想過沒有？

相關推薦