1. 程式人生 > >中位數和順序統計學之求解順序統計量

中位數和順序統計學之求解順序統計量

1,順序統計量介紹

順序統計量其實就是,給定一組數如何快速有效地找出這組數中第K小的元素。

如找出:4,7,2,9,0,3   中第5小的元素。因為,0<2<3<4<7<9,故可以很容易地找出第5小的元素為7。但是,由於對於排序演算法而言,最優的時間複雜度為O(nlogn),這意味著通過排序來查詢第K小的元素的時間複雜度至少為O(nlogn),由於只關注一組數中的第K小元素,而不需要關注整個陣列中的元素順序。故有一種方法只需要O(n)的時間複雜度就可以求出順序統計量。

經過一次分割之後,比樞軸元素小的元素都在樞軸的左邊,比樞軸大的元素都在樞軸的右邊。

故此時的樞軸元素就是第

pivot_index - low + 1 小的元素。其中,pivot_index表示樞軸元素的陣列下標,low表示陣列第1個元素的下標。

那麼,當求解第K小元素時,若 K== pivot_index,則一次分割求得的樞軸元素就是第K小的元素了。

若 K > pivot_index,則表明第K小元素應該在樞軸元素的右邊,遞迴在右邊查詢第K小元素

K < pivot_index, 則表明第K小元素應該在樞軸元素的左邊,遞迴在左邊查詢第K小元素

由於分割演算法的時間複雜度為O(n),平均來看,查詢陣列中的第K小元素的時間複雜度為O (n),由於用到了遞迴,中間結果需要壓棧,故空間複雜度最壞情況下為O(n)。

3,求解第K小元素的JAVA實現如下,演算法虛擬碼及詳細解釋參考《演算法導論》

import java.util.Random;

public class RandomSelect {
	/*
	 * choose the k th small element in array
	 * @return the k th small element's value
	 */
	public int randomSelect(int[] arr, int low, int high, int i){
		if(i > arr.length || arr.length == 0)
			return -1;// -1 means illegal params
		
		if(low == high)
			return arr[low];//only one element in array
		
//		int pivot_index = randomPartition(arr, low, high);
		int pivot_index = partition(arr, low, high);
		int k = pivot_index - low + 1;//k 表示陣列中 第 k 小的元素(第1小的元素為最小元素)
		
		/*
		 * i==k 意味著待求解的第i小元素就是上面求解的樞軸元素
		 * i<k 意味著第i小元素在第k小元素的左邊,那麼繼續在左邊遞迴查詢第i小元素
		 * i>k意味著第i小元素在第k小元素的右邊,繼續在右邊遞迴查詢第i-k小元素,再加上前面的排序的k個元素,即可找到第i小的元素
		 */
		if(i == k)
			return arr[pivot_index];
		else if(i < k)
			return randomSelect(arr, low, pivot_index - 1, i);
		else
			return randomSelect(arr, pivot_index + 1, high, i - k);//i-k
	}
	
	
	/*
	 * split array
	 * this method always use the last elements as pivot.
	 * when the method finished, the left elements of array smaller than pivot.
	 * and the right elements of array larger than pivot.
	 * @return  the pivot element's index in array
	 */
	public int partition(int arr[], int low, int high) {
		int pivot = arr[high];
		int i = low - 1;
		for (int j = low; j < high; j++) {
			if (arr[j] <= pivot) {
				i++;
				swap(arr, i, j);
			}
		}
		swap(arr, i + 1, high);
		return i + 1;
	}
	
	/*
	 * create a random pivot and use it to partition array
	 */
	public int randomPartition(int[] arr, int low, int high){
		int rand = getRandom(low, high);
		swap(arr, arr[rand], arr[high]);//arr[high] is a random and will be as pivot
		return partition(arr, low, high);
	}
	
	/*
	 * return a random between min and max----[min, max]
	 */
	private int getRandom(int min, int max){
		Random random = new Random();
		return  random.nextInt(max + 1) % (max-min+1) + min;
	}
	
	/*
	 * switch two elements of arry
	 * @param int[] arr an array for switch
	 * @param int i, j index of array
	 * 
	 */
	private void swap(int[] arr, int i, int j){
		int tmp = arr[i];
		arr[i] = arr[j];
		arr[j] = tmp;
	}
}