第十六週--專案6大資料集上排序演算法效能的體驗
阿新 • • 發佈:2019-02-05
* * Copyright (c++) 2015 煙臺大學計算機學院 * All right reserved. * 檔名稱:houzhui.cpp * 作 者: 商文軻 * 完成日期:2015年12月18日 * 版 本 號:v1.9 * 問題描述:設計一個函式,產生一個至少5萬條記錄的資料集合。在同一資料集上,用直接插入排序、氣泡排序、快速排序、直接選擇排序、堆排序、歸併排序、基數排序等演算法進行排序,記錄所需要的時間,經過對比,得到對複雜度不同的各種演算法在執行時間方面的感性認識。<blockquote><p>提示1:這一專案需要整合多種排序演算法,可以考慮先建設排序演算法庫,作為我們這門課演算法庫的收官之作; 提示2:本專案旨在獲得對於複雜度不同演算法的感性認識,由於資料分佈特點、計算機執行狀態等不同,其結果並不能完全代替對演算法複雜度的理論分析; 提示3:由於C語言標準提供的時間函式只精確到秒,幾種 級別的演算法,在5萬條記錄的壓力下,並不能明顯地看出優劣,可以忽略直接插入排序、氣泡排序、直接選擇排序這三種相對低效率的演算法(以節約時間。若能夠忍受他們長時間地執行,請自便。),成10倍地加大資料量,然後進行觀察。</p></blockquote>
1.測試用的主控程式——main.cpp
#include <stdio.h> #include <malloc.h> #include <stdlib.h> #include <time.h> #include "sort.h" void GetLargeData(RecType *&R, int n) { srand(time(0)); R=(RecType*)malloc(sizeof(RecType)*n); for(int i=0; i<n; i++) R[i].key= rand(); //產生0~RAND_MAX間的數 printf("生成了%d條記錄\n", n); } //呼叫某一排序演算法完成排序,返回排序用時 long Sort(RecType *&R, int n, void f(RecType*, int)) { int i; long beginTime, endTime; RecType *R1=(RecType*)malloc(sizeof(RecType)*n); for (i=0;i<n;i++) R1[i]=R[i]; beginTime = time(0); f(R1,n); endTime = time(0); free(R1); return endTime-beginTime; } //呼叫基數排序演算法完成排序,返回排序用時 long Sort1(RecType *&R, int n) { long beginTime, endTime; RadixRecType *p; CreateLink(p,R,n); beginTime = time(0); RadixSort(p); endTime = time(0); DestoryLink(p); return endTime-beginTime; } int main() { RecType *R; int n = MaxSize; //測試中, MaxSize取50W GetLargeData(R, n); printf("各種排序花費時間:\n"); printf(" 直接插入排序:%ld\n", Sort(R, n, InsertSort)); printf(" 希爾排序:%ld\n", Sort(R, n, ShellSort)); printf(" 氣泡排序:%ld\n", Sort(R, n, BubbleSort)); printf(" 快速排序:%ld\n", Sort(R, n, QuickSort)); printf(" 直接選擇排序:%ld\n", Sort(R, n, SelectSort)); printf(" 堆排序:%ld\n", Sort(R, n, HeapSort)); printf(" 歸併排序:%ld\n", Sort(R, n, MergeSort)); printf(" 基數排序:%ld\n", Sort1(R, n)); free(R); return 0; }
2.標頭檔案 —— sort.h
#ifndef SORT_H_INCLUDED #define SORT_H_INCLUDED #define MaxSize 50000 //最多的資料,取5萬,只測試快速演算法,可以往大調整 //下面的符號常量和結構體針對基數排序 #define Radix 10 //基數的取值 #define Digits 10 //關鍵字位數 typedef int KeyType; //定義關鍵字型別 typedef char InfoType[10]; typedef struct //記錄型別 { KeyType key; //關鍵字項 InfoType data; //其他資料項,型別為InfoType } RecType; //排序的記錄型別定義 typedef struct node { KeyType data; //記錄的關鍵字,同演算法講解中有差別 struct node *next; } RadixRecType; void InsertSort(RecType R[],int n); //直接插入排序 void ShellSort(RecType R[],int n); //希爾排序演算法 void BubbleSort(RecType R[],int n); //氣泡排序 void QuickSort(RecType R[],int n); //快速排序 void SelectSort(RecType R[],int n); //直接選擇排序 void HeapSort(RecType R[],int n); //堆排序 void MergeSort(RecType R[],int n); //歸併排序 //下面函式支援基數排序 void CreateLink(RadixRecType *&p,RecType R[],int n); //建立基數排序用的連結串列 void DestoryLink(RadixRecType *&p); //釋放基數排序用的連結串列 void RadixSort(RadixRecType *&p); //基數排序 #endif // SORT_H_INCLUDED
演算法的實現—— sort.cpp
#include "sort.h"
#include <malloc.h>
//1. 對R[0..n-1]按遞增有序進行直接插入排序
void InsertSort(RecType R[],int n)
{
int i,j;
RecType tmp;
for (i=1; i<n; i++)
{
tmp=R[i];
j=i-1; //從右向左在有序區R[0..i-1]中找R[i]的插入位置
while (j>=0 && tmp.key<R[j].key)
{
R[j+1]=R[j]; //將關鍵字大於R[i].key的記錄後移
j--;
}
R[j+1]=tmp; //在j+1處插入R[i]
}
}
//2. 希爾排序演算法
void ShellSort(RecType R[],int n)
{
int i,j,gap;
RecType tmp;
gap=n/2; //增量置初值
while (gap>0)
{
for (i=gap; i<n; i++) //對所有相隔gap位置的所有元素組進行排序
{
tmp=R[i];
j=i-gap;
while (j>=0 && tmp.key<R[j].key)//對相隔gap位置的元素組進行排序
{
R[j+gap]=R[j];
j=j-gap;
}
R[j+gap]=tmp;
j=j-gap;
}
gap=gap/2; //減小增量
}
}
//3. 氣泡排序
void BubbleSort(RecType R[],int n)
{
int i,j,exchange;
RecType tmp;
for (i=0; i<n-1; i++)
{
exchange=0;
for (j=n-1; j>i; j--) //比較,找出最小關鍵字的記錄
if (R[j].key<R[j-1].key)
{
tmp=R[j]; //R[j]與R[j-1]進行交換,將最小關鍵字記錄前移
R[j]=R[j-1];
R[j-1]=tmp;
exchange=1;
}
if (exchange==0) //沒有交換,即結束演算法
return;
}
}
//4. 對R[s]至R[t]的元素進行快速排序
void QuickSortR(RecType R[],int s,int t)
{
int i=s,j=t;
RecType tmp;
if (s<t) //區間內至少存在兩個元素的情況
{
tmp=R[s]; //用區間的第1個記錄作為基準
while (i!=j) //從區間兩端交替向中間掃描,直至i=j為止
{
while (j>i && R[j].key>=tmp.key)
j--; //從右向左掃描,找第1個小於tmp.key的R[j]
R[i]=R[j]; //找到這樣的R[j],R[i]"R[j]交換
while (i<j && R[i].key<=tmp.key)
i++; //從左向右掃描,找第1個大於tmp.key的記錄R[i]
R[j]=R[i]; //找到這樣的R[i],R[i]"R[j]交換
}
R[i]=tmp;
QuickSortR(R,s,i-1); //對左區間遞迴排序
QuickSortR(R,i+1,t); //對右區間遞迴排序
}
}
//4. 快速排序輔助函式,對外同其他演算法統一介面,內部呼叫遞迴的快速排序
void QuickSort(RecType R[],int n)
{
QuickSortR(R, 0, n-1);
}
//5. 直接選擇排序
void SelectSort(RecType R[],int n)
{
int i,j,k;
RecType temp;
for (i=0; i<n-1; i++) //做第i趟排序
{
k=i;
for (j=i+1; j<n; j++) //在當前無序區R[i..n-1]中選key最小的R[k]
if (R[j].key<R[k].key)
k=j; //k記下目前找到的最小關鍵字所在的位置
if (k!=i) //交換R[i]和R[k]
{
temp=R[i];
R[i]=R[k];
R[k]=temp;
}
}
}
//6. 堆排序輔助之——調整堆
void sift(RecType R[],int low,int high)
{
int i=low,j=2*i; //R[j]是R[i]的左孩子
RecType temp=R[i];
while (j<=high)
{
if (j<high && R[j].key<R[j+1].key) //若右孩子較大,把j指向右孩子
j++; //變為2i+1
if (temp.key<R[j].key)
{
R[i]=R[j]; //將R[j]調整到雙親結點位置上
i=j; //修改i和j值,以便繼續向下篩選
j=2*i;
}
else break; //篩選結束
}
R[i]=temp; //被篩選結點的值放入最終位置
}
//6. 堆排序
void HeapSort(RecType R[],int n)
{
int i;
RecType temp;
for (i=n/2; i>=1; i--) //迴圈建立初始堆
sift(R,i,n);
for (i=n; i>=2; i--) //進行n-1次迴圈,完成推排序
{
temp=R[1]; //將第一個元素同當前區間內R[1]對換
R[1]=R[i];
R[i]=temp;
sift(R,1,i-1); //篩選R[1]結點,得到i-1個結點的堆
}
}
//7.歸併排序輔助1——合併有序表
void Merge(RecType R[],int low,int mid,int high)
{
RecType *R1;
int i=low,j=mid+1,k=0; //k是R1的下標,i、j分別為第1、2段的下標
R1=(RecType *)malloc((high-low+1)*sizeof(RecType)); //動態分配空間
while (i<=mid && j<=high) //在第1段和第2段均未掃描完時迴圈
if (R[i].key<=R[j].key) //將第1段中的記錄放入R1中
{
R1[k]=R[i];
i++;
k++;
}
else //將第2段中的記錄放入R1中
{
R1[k]=R[j];
j++;
k++;
}
while (i<=mid) //將第1段餘下部分複製到R1
{
R1[k]=R[i];
i++;
k++;
}
while (j<=high) //將第2段餘下部分複製到R1
{
R1[k]=R[j];
j++;
k++;
}
for (k=0,i=low; i<=high; k++,i++) //將R1複製回R中
R[i]=R1[k];
}
//7. 歸併排序輔助2——一趟歸併
void MergePass(RecType R[],int length,int n) //對整個數序進行一趟歸併
{
int i;
for (i=0; i+2*length-1<n; i=i+2*length) //歸併length長的兩相鄰子表
Merge(R,i,i+length-1,i+2*length-1);
if (i+length-1<n) //餘下兩個子表,後者長度小於length
Merge(R,i,i+length-1,n-1); //歸併這兩個子表
}
//7. 歸併排序
void MergeSort(RecType R[],int n) //自底向上的二路歸併演算法
{
int length;
for (length=1; length<n; length=2*length) //進行log2n趟歸併
MergePass(R,length,n);
}
//以下基數排序,為了統一測試有改造
//8. 基數排序的輔助函式,建立基數排序用的連結串列
void CreateLink(RadixRecType *&p,RecType R[],int n) //採用後插法產生連結串列
{
int i;
RadixRecType *s,*t;
for (i=0; i<n; i++)
{
s=(RadixRecType *)malloc(sizeof(RadixRecType));
s->data = R[i].key;
if (i==0)
{
p=s;
t=s;
}
else
{
t->next=s;
t=s;
}
}
t->next=NULL;
}
//8. 基數排序的輔助函式,釋放基數排序用的連結串列
void DestoryLink(RadixRecType *&p)
{
RadixRecType *q;
while(p!=NULL)
{
q=p->next;
free(p);
p=q;
}
return;
}
//8. 實現基數排序:*p為待排序序列連結串列指標,基數R和關鍵字位數D已經作為符號常量定義好
void RadixSort(RadixRecType *&p)
{
RadixRecType *head[Radix],*tail[Radix],*t; //定義各鏈隊的首尾指標
int i,j,k;
unsigned int d1, d2=1; //用於分離出第i位數字,見下面的註釋
for (i=1; i<=Digits; i++) //從低位到高位迴圈
{
//分離出倒數第i位數字,先通過對d1=10^i取餘,得到其後i位,再通過整除d2=10^(i-1)得到第i位
//例如,分離出倒數第1位,即個位數,先對d1=10取餘,再整除d2=1
//再例如,分離出倒數第2位,即十位數,先對d1=100取餘,再整除d2=10
//迴圈之前,d2已經初始化為1,在這一層迴圈末增加10倍
//下面根據d2,得到d1的值
d1=d2*10;
for (j=0; j<Radix; j++) //初始化各鏈隊首、尾指標
head[j]=tail[j]=NULL;
while (p!=NULL) //對於原連結串列中每個結點迴圈
{
k=(p->data%d1)/d2; //分離出第i位數字k
if (head[k]==NULL) //進行分配
{
head[k]=p;
tail[k]=p;
}
else
{
tail[k]->next=p;
tail[k]=p;
}
p=p->next; //取下一個待排序的元素
}
p=NULL; //重新用p來收集所有結點
for (j=0; j<Radix; j++) //對於每一個鏈隊迴圈
if (head[j]!=NULL) //進行收集
{
if (p==NULL)
{
p=head[j];
t=tail[j];
}
else
{
t->next=head[j];
t=tail[j];
}
}
t->next=NULL; //最後一個結點的next域置NULL
//下面更新用於分離出第i位數字的d2
d2*=10;
}
}