1. 程式人生 > 程式設計 >golang 各種排序大比拼例項

golang 各種排序大比拼例項

1、準備工作

準備資料:

生成隨機數並寫入檔案,之後在把資料讀取出來

//新生成整數隨機數,並存儲在txt檔案中,
func NewIntRandm(fileName string,number,maxrandm int) {
 filename := fileName
 file,err := os.Create(filename)
 if err != nil {
  return
 }
 r := rand.New(rand.NewSource(time.Now().UnixNano()))
 rans := make([]string,number)
 for i := 0; i < number; i++ {
  rans = append(rans,strconv.Itoa(r.Intn(maxrandm)))
 }
 file.WriteString(strings.Join(rans," "))
 defer file.Close()
}
//把一串陣列存入檔案總
func SavaRandmInt(fileName string,data []int) {
 if fileName == " " || len(data) == 0 {
  return
 }
 var file *os.File
 var openerr error
 file,openerr = os.Open(fileName)
 if openerr != nil {
  var newerr error
  file,newerr = os.Create(fileName)
  if newerr != nil {
   return
  }
 }
 rans := make([]string,len(data))
 for _,v := range data {
  rans = append(rans,strconv.Itoa(v))
 }
 file.WriteString(strings.Join(rans," "))
 defer file.Close()
}

準備計時的程式:

package util
import "time"
type Stopwatch struct {
 start time.Time
 stop time.Time
}
func (s *Stopwatch) Start() {
 s.start = time.Now()
}
func (s *Stopwatch) Stop() {
 s.stop = time.Now()
}
//納秒
func (s Stopwatch) RuntimeNs() int {
 return s.stop.Nanosecond() - s.start.Nanosecond()
}
//微妙
func (s Stopwatch) RuntimeUs() float64 {
 return (float64)(s.stop.Nanosecond()-s.start.Nanosecond()) / 1000.00
}
//毫秒
func (s Stopwatch) RuntimeMs() float64 {
 return (float64)(s.stop.Nanosecond()-s.start.Nanosecond()) / 1000000.00
}
//秒
func (s Stopwatch) RuntimeS() float64 {
 return (float64)(s.stop.Nanosecond()-s.start.Nanosecond()) / 10000000000.00
}

2、開始寫排序

我模仿golang中的sort原始碼包中的寫法,暴露了一個介面,把排序的實現都寫在內部

package sort
// package main
type Interface interface {
 //獲取資料的長度
 Len() int
 //判讀索引為i和索引為j的值的大小,在實現的時候如果判斷i>j 返回true,則為升序,反之為降序
 Less(i,j int) bool
 //交換索引i,j的值
 Swap(i,j int)
}
//氣泡排序
func BubbleSort(data Interface) {
 n := data.Len()
 for index := 0; index < n; index++ {
  for j := index + 1; j < n; j++ {
   if data.Less(index,j) {
    data.Swap(index,j)
   }
  }
 }
}
//此方法比上面的冒泡演算法快,因為我找最小元素是指記住下標,並沒有每一次都做元素交換
func SelectSort(data Interface) {
 n := data.Len()
 var min int
 for index := 0; index < n; index++ {
  min = index
  for j := index + 1; j < n; j++ {
   if data.Less(min,j) {
    min = j
   }
  }
  data.Swap(index,min)
 }
}
//插入排序
func InsertSrot(data Interface) {
 count := data.Len()
 for index := 1; index < count; index++ {
  for j := index; j > 0 && data.Less(j,j-1); j-- { //j>0 做一個邊界守護,不讓下標小於0
   data.Swap(j,j-1)
  }
 }
}
//希爾排序
func ShellSort(data Interface) {
 N := data.Len()
 h := 1
 for h < N/3 {
  h = 3*h + 1
 }
 for h > 0 {
  for index := h; index < N; index++ {
   for j := index; j >= h && data.Less(j,j-h); j -= h { //j>0 做一個邊界守護,不讓下標小於0
    data.Swap(j,j-h)
   }
  }
  h = h / 3
 }
}
//快速排序
func QuickSort(data Interface) {
 n := data.Len()
 low,row := 0,n-1
 quickSort(data,low,row)
}
func quickSort(data Interface,row int) {
 if low < row {
  i,j,x,last := low,row,0 //0就是使用第一個作為基準值,last這個變數時為了基準最後一次交換變數時出現在那次
  for i < j {
   for i < j && data.Less(x,j) { //比x小的放在前面出現的坑中
    j--
   }
   if i < j {
    data.Swap(i,j)
    i++
    x = j
    last = 1
   }
   for i < j && data.Less(i,x) { //比x大的放在後面出現的坑中
    i++
   }
   if i < j {
    data.Swap(i,j)
    j--
    x = i
    last = -1
   }
  }
  if last == 1 {
   data.Swap(j,x)
  } else if last == -1 {
   data.Swap(i,x)
  }
  quickSort(data,i-1)
  quickSort(data,i+1,row)
 }
}
//通過控制Less方法來控制升序降序
func HeapSort(data Interface) {
 makeHeap(data)
 n := data.Len()
 for i := n - 1; i >= 1; i-- {
  data.Swap(0,i)
  heapFixdown(data,i)
 }
}
func makeHeap(data Interface) {
 n := data.Len()
 for i := (n - 1) >> 1; i >= 0; i-- {
  heapFixdown(data,i,n)
 }
}
func heapFixdown(data Interface,r,n int) {
 root := r //跟結點
 for {
  leftChildIndex := root<<1 + 1
  if leftChildIndex >= n {
   break
  }
  if leftChildIndex+1 < n && data.Less(leftChildIndex+1,leftChildIndex) {
   leftChildIndex++
  }
  if data.Less(root,leftChildIndex) {
   return
  }
  data.Swap(leftChildIndex,root)
  root = leftChildIndex
 }
}

3、開始使用

//先實現這個排序介面
type InSort []int
func (is InSort) Len() int {
 return len(is)
}//降序
func (is InSort) Less(i,j int) bool {
 return is[i] > is[j]
}
func (is InSort) Swap(i,j int) {
 is[i],is[j] = is[j],is[i]
}
func main() {
 fileName := "randm.txt"
 // util.NewIntRandm(fileName,1000000,10000) //封裝生成5000000個隨機數字
 fileUtil := util.FileUtil{}
 insort := InSort{}
 insort = fileUtil.ReaderAllInt(fileName) //讀取生成的隨機數
 fmt.Println(insort.Len())
 t := new(util.Stopwatch) //封裝的計時間的方法
 t.Start()
 // sort.HeapSort(insort) //開始排序,519.8732 ms
 sort.QuickSort(insort) //開始排序,7.0267 ms
 t.Stop()
 fmt.Println(t.RuntimeMs(),"ms")
 util.SavaRandmInt("result.txt",insort)
}

快排:10000陣列 7.0267 ms,1000000陣列 37.7612 ms

堆排序:10000陣列 10.0039 ms,1000000陣列 358.6429 ms

下面是我測試的一些資料:

HeapSort(insort) //堆排序 10000個數 4.0013 ms,100000個數 54.0659 ms,很穩定,500000個數 208.1511 ms 很穩定
sort.QuickSort(insort,len(insort)-1) //快速排序 10000個數 3.0017 ms,100000個數,33.0222 ms,很穩定,500000個數 150.1096 ms 很穩定,100000個數 94.0823 ms 很穩定
sort.SelectSort(insort) //選擇排序 10000個數 130.8017 ms,100000個數 時間很長
sort.BubbleSort(insort) //氣泡排序 10000個數 203.5344ms ,100000個數 187.7438 ms
sort.InsertSrot(insort) // 插入排序 10000個數 858.6085 ms,100000個數,時間很長
sort.ShellSort(insort) //希爾插入 10000個數 10.9876 ms,100000個數 46.0322 m ,就做這個範圍,很穩定,500000個數 141.8833 ms,相對穩定
sort.Sort(insort) //golang原始碼的排序 10000個數 6.0062 ms ,100000個數 19.9988 ms~89.0574 ms 不穩定,500000個數 358.2536 ms 穩定

補充:golang 定時任務方面time.Sleep和time.Tick的優劣對比

golang 寫迴圈執行的定時任務,常見的有以下三種實現方式:

1、time.Sleep方法:

for {
 time.Sleep(time.Second)
 fmt.Println("我在定時執行任務")
}

2、time.Tick函式:

t1:=time.Tick(3*time.Second)
for {
 select {
 case <-t1:
  fmt.Println("t1定時器")
 }
}

3、其中Tick定時任務,也可以先使用time.Ticker函式獲取Ticker結構體,然後進行阻塞監聽資訊,這種方式可以手動選擇停止定時任務,在停止任務時,減少對記憶體的浪費。

t:=time.NewTicker(time.Second)
for {
 select {
 case <-t.C:
  fmt.Println("t1定時器")
  t.Stop()
 }
}

其中第二種和第三種可以歸為同一類

這三種定時器的實現原理

一般來說,你在使用執行定時任務的時候,一般旁人會勸你不要使用time.Sleep完成定時任務,但是為什麼不能使用Sleep函式完成定時任務呢,它和Tick函式比,有什麼劣勢呢?這就需要我們去探討閱讀一下原始碼,分析一下它們之間的優劣性。

首先,我們研究一下Tick函式,func Tick(d Duration) <-chan Time

呼叫Tick函式會返回一個時間型別的channel,如果對channel稍微有些瞭解的話,我們首先會想到,既然是返回一個channel,在呼叫Tick方法的過程中,必然建立了goroutine,該Goroutine負責傳送資料,喚醒被阻塞的定時任務。我在閱讀原始碼之後,確實發現函式中go出去了一個協程,處理定時任務。

按照當前的理解,使用一個tick,需要go出去一個協程,效率和對記憶體空間的佔用肯定不能比sleep函式強。我們需要繼續閱讀原始碼才拿獲取到真理。

簡單的呼叫過程我就不陳述了,我在這介紹一下核心結構體和方法(刪除了部分判斷程式碼,解釋我寫在表格中):

func (tb *timersBucket) addtimerLocked(t *timer) {
 t.i = len(tb.t) //計算timersBucket中,當前定時任務的長度
 tb.t = append(tb.t,t)// 將當前定時任務加入timersBucket
 siftupTimer(tb.t,t.i) //維護一個timer結構體的最小堆(四叉樹),排序關鍵字為執行時間,即該定時任務下一次執行的時間
 if !tb.created {
  tb.created = true
  go timerproc(tb)// 如果還沒有建立過管理定時任務的協程,則建立一個,執行通知管理timer的協程,最核心程式碼
 }
}

timersBucket,顧名思義,時間任務桶,是外界不可見的全域性變數。每當有新的timer定時器任務時,會將timer加入到timersBucket中的timer切片。

timerBucket結構體如下:

type timersBucket struct {
 lock   mutex //新增新定時任務時需要加鎖(衝突點在於維護堆)
 t   []*timer //timer切片,構造方式為四叉樹最小堆
}

func timerproc(tb *timersBucket) 詳細介紹

可以稱之為定時任務處理器,所有的定時任務都會加入timersBucket,然後在該函式中等待被處理。等待被處理的timer,根據when欄位(任務執行的時間,int型別,納秒級別)構成一個最小堆,每次處理完成堆頂的某個timer時,會給它的when欄位加上定時任務迴圈間隔時間(即Tick(d Duration) 中的d引數),然後重新維護堆,保證when最小的timer在堆頂。當堆中沒有可以處理的timer(有timer,但是還不到執行時間),需要計算當前時間和堆頂中timer的任務執行時間差值delta,定時任務處理器沉睡delta段時間,等待被排程器喚醒。核心程式碼如下(註釋寫在每行程式碼的後面,刪除一些判斷程式碼以及不利於閱讀的非核心程式碼):

func timerproc(tb *timersBucket) {
 for {
  lock(&tb.lock) //加鎖
  now := nanotime() //當前時間的納秒值
  delta := int64(-1) //最近要執行的timer和當前時間的差值
  for {
   if len(tb.t) == 0 {
   delta = -1
   break
   }//當前無可執行timer,直接跳出該迴圈
   t := tb.t[0]
   delta = t.when - now //取when組小的的timer,計算於當前時間的差值
   if delta > 0 {
   break
   }// delta大於0,說明還未到傳送channel時間,需要跳出迴圈去睡眠delta時間
   if t.period > 0 {
   // leave in heap but adjust next time to fire
   t.when += t.period * (1 + -delta/t.period)// 計算該timer下次執行任務的時間
   siftdownTimer(tb.t,0) //調整堆
   } else {
   // remove from heap,如果沒有設定下次執行時間,則將該timer從堆中移除(time.after和time.sleep函式即是隻執行一次定時任務)
   last := len(tb.t) - 1
   if last > 0 {
    tb.t[0] = tb.t[last]
    tb.t[0].i = 0
   }
   tb.t[last] = nil
   tb.t = tb.t[:last]
   if last > 0 {
    siftdownTimer(tb.t,0)
   }
   t.i = -1 // mark as removed
   }
   f := t.f
   arg := t.arg
   seq := t.seq
   unlock(&tb.lock)//解鎖
   f(arg,seq) //在channel中傳送time結構體,喚醒阻塞的協程
   lock(&tb.lock)
  }
  if delta < 0 {
   // No timers left - put goroutine to sleep.
   goparkunlock(&tb.lock,"timer goroutine (idle)",traceEvGoBlock,1)
   continue
  }// delta小於0說明當前無定時任務,直接進行阻塞進行睡眠
  tb.sleeping = true
  tb.sleepUntil = now + delta
  unlock(&tb.lock)
  notetsleepg(&tb.waitnote,delta) //睡眠delta時間,喚醒之後就可以執行在堆頂的定時任務了
 }
}

至此,time.Tick函式涉及到的主要功能就講解結束了,總結一下就是啟動定時任務時,會建立一個唯一協程,處理timer,所有的timer都在該協程中處理。

然後,我們再閱讀一下sleep的原始碼實現,核心原始碼如下:

//go:linkname timeSleep time.Sleep
func timeSleep(ns int64) {
 *t = timer{} //建立一個定時任務
 t.when = nanotime() + ns //計算定時任務的執行時間點
 t.f = goroutineReady //執行方法
 tb.addtimerLocked(t) //加入timer堆,並在timer定時任務執行協程中等待被執行
 goparkunlock(&tb.lock,"sleep",traceEvGoSleep,2) //睡眠,等待定時任務協程通知喚醒
}

讀了sleep的核心程式碼之後,是不是突然發現和Tick函式的內容很類似,都建立了timer,並加入了定時任務處理協程。神奇之處就在於,實際上這兩個函式產生的timer都放入了同一個timer堆,都在定時任務處理協程中等待被處理。

優劣性對比,使用建議

現在我們知道了,Tick,Sleep,包括time.After函式,都使用的timer結構體,都會被放在同一個協程中統一處理,這樣看起來使用Tick,Sleep並沒有什麼區別。

實際上是有區別的,Sleep是使用睡眠完成定時任務,需要被排程喚醒。Tick函式是使用channel阻塞當前協程,完成定時任務的執行。當前並不清楚golang 阻塞和睡眠對資源的消耗會有什麼區別,這方面不能給出建議。

但是使用channel阻塞協程完成定時任務比較靈活,可以結合select設定超時時間以及預設執行方法,而且可以設定timer的主動關閉,以及不需要每次都生成一個timer(這方面節省系統記憶體,垃圾收回也需要時間)。

所以,建議使用time.Tick完成定時任務。

以上為個人經驗,希望能給大家一個參考,也希望大家多多支援我們。如有錯誤或未考慮完全的地方,望不吝賜教。