1. 程式人生 > 實用技巧 >資料流中的中位數(頂堆)

資料流中的中位數(頂堆)

1.堆

堆的性質

大頂堆:每個節點的值都大於或者等於它的左右子節點的值(arr[i] >= arr[2i + 1] && arr[i] >= arr[2i + 2])。

小頂堆:每個節點的值都小於或者等於它的左右子節點的值(arr[i] <= arr[2i + 1] && arr[i] <= arr[2i + 2])。

第一個非葉子節點的索引就是arr.length / 2 -1。

public class HeapSort {
    public static void heapSort(int[] arr) {
        if
(arr == null || arr.length == 0) { return; } int len = arr.length; // 構建大頂堆,這裡其實就是把待排序序列,變成一個大頂堆結構的陣列 buildMaxHeap(arr, len); // 交換堆頂和當前末尾的節點,重置大頂堆 for (int i = len - 1; i > 0; i--) { swap(arr, 0, i); len--; heapify(arr,
0, len); } } private static void buildMaxHeap(int[] arr, int len) { // 從最後一個非葉節點開始向前遍歷,調整節點性質,使之成為大頂堆 for (int i = (int)Math.floor(len / 2) - 1; i >= 0; i--) { heapify(arr, i, len); } } private static void heapify(int[] arr, int i, int len) {
// 先根據堆性質,找出它左右節點的索引 int left = 2 * i + 1; int right = 2 * i + 2; // 預設當前節點(父節點)是最大值。 int largestIndex = i; if (left < len && arr[left] > arr[largestIndex]) { // 如果有左節點,並且左節點的值更大,更新最大值的索引 largestIndex = left; } if (right < len && arr[right] > arr[largestIndex]) { // 如果有右節點,並且右節點的值更大,更新最大值的索引 largestIndex = right; } if (largestIndex != i) { // 如果最大值不是當前非葉子節點的值,那麼就把當前節點和最大值的子節點值互換 swap(arr, i, largestIndex); // 因為互換之後,子節點的值變了,如果該子節點也有自己的子節點,仍需要再次調整。 heapify(arr, largestIndex, len); } } private static void swap (int[] arr, int i, int j) { int temp = arr[i]; arr[i] = arr[j]; arr[j] = temp; } }

2.資料流中的中位數

傳入的資料為:[5,2,3,4,1,6,7,0,8],那麼按照要求,輸出是"5 3.5 3 3.5 3 3.5 4 3.5 4 "

    • 先用java集合PriorityQueue來設定一個小頂堆和大頂堆
    • 主要的思想是:因為要求的是中位數,那麼這兩個堆,大頂堆用來存較小的數,從大到小排列
    • 小頂堆存較大的數,從小到大的順序排序*,顯然中位數就是大頂堆的根節點與小頂堆的根節點和的平均數。

整個程式的執行流程應該是(用min表示小頂堆,max表示大頂堆):

    • 5先進入大頂堆,然後將大頂堆中最大值放入小頂堆中,此時min=[5],max=[無],avg=[5]
    • 2先進入小頂堆,然後將小頂堆中最小值放入大頂堆中,此時min=[5],max=[2],avg=[(5+2)/2]=[3.5]
    • 3先進入大頂堆,然後將大頂堆中最大值放入小頂堆中,此時min=[3,5],max=[2],avg=[3]
    • 4先進入小頂堆,然後將小頂堆中最小值放入大頂堆中,此時min=[4,5],max=[3,2],avg=[(4+3)/2]=[3.5]
    • 1先進入大頂堆,然後將大頂堆中最大值放入小頂堆中,此時min=[3,4,5],max=[2,1],avg=[3]
    • 6先進入小頂堆,然後將小頂堆中最小值放入大頂堆中,此時min=[4,5,6],max=[3,2,1],avg=[(4+3)/2]=[3.5]
    • 7先進入大頂堆,然後將大頂堆中最大值放入小頂堆中,此時min=[4,5,6,7],max=[3,2,1],avg=[4]=[4]
    • 0先進入小頂堆,然後將小頂堆中最大值放入小頂堆中,此時min=[4,5,6,7],max=[3,2,1,0],avg=[(4+3)/2]=[3.5]
    • 8先進入大頂堆,然後將大頂堆中最小值放入大頂堆中,此時min=[4,5,6,7,8],max=[3,2,1,0],avg=[4]
import java.util.Comparator;
import java.util.PriorityQueue;
public class Solution {

    private int count = 0;
    //預設升序排列,也就是預設為最小堆
    private PriorityQueue<Integer> minHeap = new PriorityQueue<>();
    //通過重寫Comparator介面的compare方法,構建一個逆序排列的最大堆
    private PriorityQueue<Integer> maxHeap = new PriorityQueue<Integer>( new Comparator<Integer>() {
        @Override
        public int compare(Integer o1, Integer o2) {
            return o2 - o1;
        }
    });

    public void Insert(Integer num) {
        if (count %2 == 0) {
            //最大堆插入一個元素之後,內部會自動重新構建一個最大堆maxheapify
            maxHeap.offer(num);
            //remove並返回第一個元素
            int temp = maxHeap.poll();
            //插入到最小堆,內部同樣進行minheapify
            minHeap.offer(temp);
        } else {
            minHeap.offer(num);
            int temp = minHeap.poll();
            maxHeap.offer(temp);
        }
        count++;
    }

    public Double GetMedian() {
        if (count %2 == 0) {
            return new Double((minHeap.peek() + maxHeap.peek())) / 2;
        } else {
            return new Double(minHeap.peek());
        }
    }

}