優先佇列（一）資料流中的中位數

阿新 • • 發佈：2022-03-01

對應 LeetCode 295 資料流中的中位數

問題描述

設計一個支援如下兩種操作的資料結構：

void addNum(int)：從資料流中獲取一個元素，新增到當前的資料結構中
double findMedian()：返回當前資料結構中儲存的資料的中位數

解決思路

由於這裡無法確切知道資料元素的規模，因此一般通過列表的方式儲存元素再求取中位數的方式不是特別可靠。

考慮使用 “堆” 資料結構來完成這個功能，維護兩個堆：最大堆和最小堆，最大堆用於儲存中位數元素以下的所有元素，最小堆儲存大於等於中位數的所有元素。

為了方便，將最小堆中的堆頂元素視為奇數大小的資料流的中位數，在新增時注意小心地調整這兩個堆中的元素以使得滿足上面的條件

實現

class MedianFinder {
    final PriorityQueue<Integer> minPq; // 維護最小堆，儲存大於等於中位數的元素
    final PriorityQueue<Integer> maxPq; // 維護最大堆，儲存小於中位數的元素

    public MedianFinder() {
        minPq = new PriorityQueue<>((x, y) -> x - y);
        maxPq = new PriorityQueue<>((x, y) -> y - x);
    }
    
    public void addNum(int num) {
        /*
            注意這裡堆中元素的調整
        */
        if (minPq.size() != maxPq.size()) {
            minPq.offer(num);
            maxPq.offer(minPq.poll());
        } else {
            maxPq.offer(num);
            minPq.offer(maxPq.poll());
        }
    }
    
    public double findMedian() {
        /*
            由於這兩個堆滿足了我們給定的條件，因此中位數的計算就變得簡單
        */
        if (minPq.size() != maxPq.size()) 
            return minPq.peek();

        return (minPq.peek() + maxPq.peek()) * 1.0 / 2;
    }
}

複雜度分析：

時間複雜度：由於每次呼叫 addNum(int) 方法時都會觸發堆的平衡操作，因此時間複雜度為 \(O(log_2n)\)，對於中位數的計算，由於只是獲取了兩個堆的堆頂元素，因此時間複雜度為 \(O(1)\)
空間複雜度：需要額外的空間來儲存輸入的資料，因此空間複雜度為 \(O(n)\)

參考：

^[1] https://leetcode-cn.com/problems/find-median-from-data-stream/

^[2] https://leetcode-cn.com/problems/shu-ju-liu-zhong-de-zhong-wei-shu-lcof/solution/mian-shi-ti-41-shu-ju-liu-zhong-de-zhong-wei-shu-y/

優先佇列（一）資料流中的中位數

對應 LeetCode 295 資料流中的中位數問題描述設計一個支援如下兩種操作的資料結構：

深入淺析MySQL從刪庫到跑路_高階（一）——資料完整性

一、資料完整性簡介 1、資料完整性簡介資料冗餘是指資料庫中存在一些重複的資料，資料完整性是指資料庫中的資料能夠正確反應實際情況。

JS進階（一）資料型別與隱式轉換

1）基本資料型別 string、 number、null、undefined、 boolean、bigInt、symbol Number型別中NaN不是有效數字但是屬於Number型別,typeof NaN//=> \'number\'

資料結構與演算法筆記（一）資料結構與演算法緒論

資料結構和演算法緒論什麼是資料結構？資料結構是計算機儲存、組織資料的方式。資料結構是指相互之間存在一種或多種特定關係的資料元素的集合。通常情況下，精心選擇的資料結構可以帶來更高的執行或者儲存效率。資

由淺入深CrosVM（一）—— 如何在Ubuntu中搭建CrosVM

什麼是CrosVM CrosVM是Chrome作業系統中，用於建立虛擬機器的應用。是一個Rust編寫的輕量級的虛擬機器。亞馬遜的Firecracker從crosvm開始。藉助於CrosVM 使用者可以很容易的在ChromeOS中執行Linux、Android以及Windo

Redis基礎（一）資料結構與資料型別

Redis資料結構 Redis一共有六種資料結構，分別是簡單動態字串、連結串列、字典、跳錶、整數集合、壓縮列表。

基於bert命名實體識別（一）資料處理

要使用官方的tensorflow版本的bert微調進行自己的命名實體識別，需要處理資料成bert相應的格式，主要是在run_classifier.py中，比如說：

Redis設計與實現（一）——資料結構與物件

Redis中的資料結構簡單動態字串連結串列字典跳躍表整數集合壓縮列表物件 1.簡單動態字串

基於ray的分散式機器學習（一）——資料並行

import numpy as np import os import scipy.optimize import tensorflow as tf from tensorflow.examples.tutorials.mnist import input_data

優先佇列（堆）函式heapq常用方法總結

技術標籤：演算法與資料結構演算法python佇列演算法題中有時會用到優先佇列來去前n大或者前n小的資料，這個時候就可以記住堆這種資料結構，python中優先佇列是使用heapq這個庫實現的，下面就將這個庫的常用方法

第 3 章：稀疏陣列和佇列（一）

稀疏陣列實際需求編寫的五子棋程式中，有存檔退出和續上盤的功能因為該二維陣列的很多值是預設值 0 ，因此記錄了很多沒有意義的資料，我們將其轉為稀疏陣列進行儲存

春招面試複習：訊息佇列（七）-資料壓縮

技術標籤：面試java演算法 1 資料壓縮意義 Kafka使用資料壓縮，最高可提升約幾十倍吞吐量。資料壓縮不僅可節省儲存空間，還可用於提升網路傳輸效能。這種使用壓縮提升系統性能的方法，不僅在MQ使用，日常開發也可

超市商品過期檢索程式（一）——資料的由來

技術標籤：筆記練習pythonpython 最近經常去超市，看到超市總有過期的商品清理出來，鄉下的超市自動化的程度並不高，商品是否過期檢查的程度並不到位，突然想要做一個超市過期商品檢索程式，這就是此程式的由來。

Python小白的報錯之路（一）資料匯入：

Python小白的報錯之路（一）資料匯入：這裡寫自定義目錄標題 #使用pandas庫匯入資料報錯Initializing from file failed 時

ALINK(十四)：資料處理（一）資料拆分 (SplitBatchOp)

Java 類名：com.alibaba.alink.operator.batch.dataproc.SplitBatchOp Python 類名：SplitBatchOp 功能介紹

python爬蟲學習（一）資料解析

re解析（執行速度最快）　　.　　匹配換行符以外的任意字元　　\\w　匹配字母或數字或下劃線

優先佇列（PriorityQueue）

> 此程式碼是在最大堆的基礎上二次封裝，請先閱讀底層程式碼MaxHeap 優先佇列

c++優先佇列（priority_queue）

首先要包含標頭檔案 #include<queue> 優先佇列具有佇列的所有特性，包括佇列的基本操作，只是在這基礎上添加了內部的一個排序，它本質是一個堆實現的。

MySQL 基礎（一）資料儲存

儲存在磁碟上的資料需要通過 IO 來讀取，這是一個比較耗時的操作，為了能夠提高訪問速度，MySQL 引入了 Page 的結構作為客戶端與資料互動的基本單元。

（一）資料結構與演算法基礎

（1）資料結構的基本概念資料結構是指相互有關聯的資料元素的集合，資料結構研究的三個方面：（也稱為：資料結構的三要素）