資料結構與演算法之線性結構

阿新 • • 發佈：2019-03-06

開發十年，就只剩下這套架構體系了！ >>>

什麼是資料結構

資料結構是指相互之間存在著一種或多種關係的資料元素的集合和該集合中資料元素之間的關係的組成。

資料結構就是設計資料以何種方式儲存在計算機中，列表、字典等都算是資料結構。
程式=資料結構+演算法，資料結構屬於靜態的部分，演算法的呼叫為動態部分

資料結構的分類

根據邏輯結構劃分：

線性結構：資料結構中的元素一對一的關係，一前驅，一後繼。

樹結構：資料結構中元素一對多的關係，一前驅，多後繼。
圖結構：資料結構中元素存在多對多的關係，多前驅，多後繼，我也不會。
- 判斷一個圖形能不能一筆畫完，就判斷它的奇數度節點數目是否為0或2.這種能一筆畫完的就是尤拉圖，奇數度節點為四個，就是兩筆畫完。

線性結構

列表

列表和陣列

python中的列表和其他語言中的陣列很相似，區別為：

陣列是定長的。
陣列的資料型別也必須一致。
對列表或陣列來說，它們的下標操作是最快的。

列表解決的變長問題的方式

假設一開始在記憶體中分配了四個元素儲存的空間，那麼前四個元素的append操作不會出現問題。

當第五次append操作時，會先在記憶體中分配一個能夠儲存八個元素的空間，也就是翻倍。
然後進行復制，把以前的四個元素依次放到相應的位置上。
若再次超出長度，則繼續執行上述操作。
也就是使用了動態表的原理

append操作會不會使速度變慢？

根據攤還分析，沒有變長時的append和變長時的append均攤，最後的複雜度時O(3).
append越往後，變長時的出現頻率就會越小
浪費了一部分空間，最壞情況應該是浪費了長度除二減一的空間。

列表解決多資料型別問題的方式

對於純整數的陣列，它的每一個元素佔4個位元組，那麼就事先計算好記憶體分配的大小，計算方法為：- 第一個元素的地址+元素個數乘 4

python的列表裡存的不是值，而是指向這個值的記憶體地址。
地址的大小是一樣的，32位裡地址是4個位元組，64位裡地址是8個位元組。
這種方法的缺點是記憶體開銷翻倍，這也是python被人詬病的地方。

棧

棧的應用--括號匹配問題

給定一個字串，問其中字串是否匹配。
括號本身滿足棧的性質
匹配失敗的情況：
- 括號不匹配
- 匹配完畢棧沒空
- 棧空了又進元素
```
 
```
1. def brace_match(s):
2. stack = []
3. d ={'(':')','[':']','{':'}'}
4. for ch in s:
5. if ch in {'(','[','{'}:
6. stack.append(ch)
7. elif len(stack):
8. print('多了%s' %ch)
9. return False
10. elif d[stack[-1]] == ch:
11. stack.pop()
12. else:
13. print('%s不匹配'%ch)
14. if len(stack)==0:
15. return True
16. else:
17. print("未匹配")
18. return False

佇列

佇列的陣列實現：

簡單的pop(0)操作複雜度過高，不採用。
由於陣列定長，不能繼續新增資料，如果是列表，出隊的操作就會出現空位，所以想辦法讓陣列變成一個圓環。
設定兩個指標，隊首指標front，隊尾指標rear。
由於，佇列滿的時候和佇列空的時候rear和front都在一個位置，那麼就無法判斷了。於是設定成佇列滿的時候減去一做為隊滿的標誌。
這種佇列就叫做環形佇列。
- 當隊尾指標front=最大長度+1時，再前進一個位置就自動到0.
- 實現方式：求餘數運算
  - 隊首指標前進1：front=(www.tiaotiaoylzc.com front+1)%maxsize
  - 隊尾指標前進1：rear=(www.yongshi123.cn rear+1)%maxsize
  - 隊空條件：rear=www.yongshiyule178.com front
  - 隊滿條件：(rear+1)www.dfgjpt.com%maxsize=front

通過兩個棧做一個佇列的方法

1號棧進棧模擬進隊操作。
2號站出棧，如果2號棧空，把1號站依次出棧並進2號棧，模擬出隊操作。
通過攤還分析，時間複雜度還是O(1)。

python關於佇列的模組

import queue #涉及執行緒安全用queue
from collections import deque #常用解題的用deque
q = deque() #是一種雙向佇列，popleft出隊
#模擬linux命令 head和tail,假如是tail 5
deque(open('a.text','r',encooding='utf8'),5)
#建立一個定長的佇列，當佇列滿了之後，就會刪除第一行，繼續新增

連結串列

節點定義

class Node(object):
def __init__(self,item):
self.item=item
self.next=None
#eg
a=Node(1)
b=Node(2)
c=Node(3)
a.next=b
b.next=c #連結串列的最後一個節點的next就為None

連結串列類的實現

class LinkList:
def __init___(self,li,method='tail'):
self.head = None
self.tail = None
if method == 'head':
self.create_linklist_head(li)
if method == 'tail'
self.create_linklist_tail(li)
else:
rais ValueError('unsupport')
#頭插法
def create_linklist_head(self,li):
self.head = Node(0)
for v in li:
n = Node(v)
n.next = l.next #當插入下一個元素時，應該與下一個節點連線後再跟頭節點連線
self.head.next = n
self.head.data += 1
#尾插法
def create_linlist_tail(self,li):
self.head = Node(0)
self.tail = self.head
for v in li:
p = Node(v)
self.tail.next = p
self.tail = p
self.head.data += 1
#連結串列的遍歷輸出
def traverse_linlist(self):
p = self.head.next
while p:
yield p.data
p = p.next

插入刪除總結

插入

#p表示待插入節點，curNode表示當前節點
p.next = curNode.next #不能當前連線直接斷開
curNode,next = p

刪除

p = curNode.next
curNode.next = p.next
del p #不寫也一樣，引用計數，python的記憶體回收機制

雙鏈表

雙鏈表中每個節點有兩個指標：一個指向後面節點、一個指向前面節點。
節點定義：

class Node(object):
def __init__(self, item=None):
self.item = item
self.next =www.myzx1.com None
self.prior = None

雙鏈表的插入和刪除

插入

p.next = curNode.next
curNode.www.ycjszpgs.com next.prior = p
p.prior =www.dfzx157.com curNode
curNode.next = p

刪除

p = curNode.next
curNode.next = p.next
p.next.prior = curNode
del p

連結串列的複雜度分析

連結串列與列表相比

按元素值查詢：列表可以使用二分法是O(logn)，連結串列是O(n)
按下標查詢：O(1),O(n)
再某元素後插入：O(n),O(1)
刪除莫元素：O(n),O(1)
總的來說連結串列再插入和刪除某元素的操作時明顯快於順序表，而且通過雙鏈表可以更容易實現棧和佇列。

雜湊表

直接定址表

雜湊表就是直接定址表的改進。當關鍵字的全域U比較小時，直接定址是一種簡單有效的方法。

全域的意思就是它的取值範圍。
也就是直接把關鍵字為key的value放在key的位置上
直接定址的缺點：
當域U很大時，需要消耗大量記憶體。
如果U很大，但關鍵字很少，浪費大量空間。
若關鍵字不是數字則無法處理。
直接定址表的改進：
構建大小為m的定址表T
key為k的元素放到h(k)上
h(k)是一個函式，其將域U對映到表T(0,1,..,m-1)

雜湊表

雜湊表是一個通過雜湊函式計算資料儲存位置的線性表的儲存結構，又叫做散列表。

雜湊表由一個直接定址表和一個雜湊函式組成。
雜湊函式h(k)將元素關鍵字k作為自變數，返回元素的儲存下標。
雜湊表的基本操作：
- insert(key,value):插入鍵值對。
- get(key):如果存在鍵為key的鍵值對則返回其value。
- delete(key)：刪除鍵為key的鍵值對。

簡單雜湊函式

除法雜湊：h(k)= k mod m
乘法雜湊：h(k) = floor(m(KA mod 1)) 0<A<1

雜湊衝突

由於雜湊表的大小是有限的，而要儲存資訊的數量是無限的，因此，對於任何雜湊函式，都會出現兩個元素對映到同一個位置的情況，這種情況就叫做雜湊衝突。
解決雜湊衝突的方法：
開放定址法：如果雜湊函式返回的位置已經有值，則可以向後探查新的位置來儲存這個值。

線性探查：如果位置p被佔用，則探查 p+1,p+2....。
二次探查：如果位置p被佔用，則探查p+1**2,p-1**2,p+2**2。
二度雜湊：有n個雜湊函式，當使用第一個雜湊函式h1發生衝突時，則使用h2。
雜湊表的快速查詢可以以空間換時間，需要保證元素個數除以陣列容積小於0.5，這個比值就是裝載率。
拉鍊法：雜湊表的每個位置都連線一個連結串列，當衝突發生時，衝突的元素被加到該位置連結串列的最後。
拉鍊表需要保證每一個連結串列的長度都不要太長。
拉鍊法的裝載率是可以大於一的。
插入、查詢等操作的時間複雜度是O(1)的。

雜湊在python中的應用

字典和集合都是通過雜湊表來實現的
集合可以看作沒有value的字典，因為集合也有不重複的性質。
通過雜湊函式把字典的鍵對映為函式：

dic = {'name':'cui'}
#可以認為是h('name')=1，則雜湊表為[None,'cu

 
 
              
           
              
              
            
            相關推薦
			   
            
            
            
 

    

    
    資料結構與演算法之線性結構
      
                                                        開發十年，就只剩下這套架構體系了！
>>>   
                                        
              

  
 

    

    
    資料結構與演算法之線性表相關程式
       
 
  
  
 1.從有序表中刪除所有值重複的元素，使所有值均不同 
 #include<stdio.h>
#define MaxSize 50
#define Elemtype int
typedef struct{
    Elemtype data[MaxSize];
    int  

  
 

    

    
    資料結構與演算法之線性表簡單定義（順序結構儲存查，增，刪）
      
                線性表（List）

由零個或多個數據元素組成的有限序列，它是一個序列，也就是說元素之間是有個先來後到的，若元素存在多個，則第一個元素無前驅，最後一個元素無後繼，其他元素有且只有一個前驅和後繼，另外，線性表強調是有限的，事實上無論計算機發展多強大，它處理的元素都是有限的。

 

  
 

    

    
    資料結構與演算法之美專欄學習筆記-線性排序
      線性排序 
線性排序的概念 
線性排序演算法包括桶排序、計數排序、基數排序。 
線性排序演算法的時間複雜度為O(n)。 
線性排序的特點 
此3種排序演算法都不涉及元素之間的比較操作，是非基於比較的排序演算法。 
對排序資料的要求很苛刻，重點掌握此3種排序演算法的適用場景。 
  
桶排序 
演算法 

  
 

    

    
    《資料結構與演算法之美》專欄閱讀筆記2——線性表
       
 
  
  
  
  換個方式來寫筆記，最近啃完了《Thinking in Java》，想要在看專欄的時候多做點擴充套件性的東西，比如把難撩的泛型加進來做實現，程式碼還是要寫起來才曉得怎麼寫更酷。總之最近看書的過程中、搜尋答案的過程中發出了很多“哇~超厲害！超酷！我也要這樣棒棒噠！”的嘆聲。新的開始， 

  
 

    

    
    JavaScript 資料結構與演算法之美 - 線性表（陣列、棧、佇列、連結串列）
       
前言


基礎知識就像是一座大樓的地基，它決定了我們的技術高度。
我們應該多掌握一些可移值的技術或者再過十幾年應該都不會過時的技術，資料結構與演算法就是其中之一。


棧、佇列、連結串列、堆 是資料結構與演算法中的基礎知識，是程式設計師的地基。
筆者寫的 JavaScript 資料結構與演算法之美 系列用 

  
 

    

    
    資料結構與演算法之美專欄學習筆記-排序(上）
      排序方法 
氣泡排序、插入排序、選擇排序、快速排序、歸併排序、計數排序、基數排序、桶排序。 
  
複雜度歸類 
氣泡排序、插入排序、選擇排序 O(n^2) 
快速排序、歸併排序 O(nlogn) 
計數排序、基數排序、桶排序 O(n) 
  
  
演算法的執行效率 
1. 最 

  
 

    

    
    資料結構與演算法之美專欄學習筆記-排序(下）
      分治思想 
分治思想 
分治，顧明思意就是分而治之，將一個大問題分解成小的子問題來解決，小的子問題解決了，大問題也就解決了。 
分治與遞迴的區別 
分治演算法一般都用遞迴來實現的。分治是一種解決問題的處理思想，遞迴是一種程式設計技巧。 
  
歸併排序 
演算法原理 
歸併的思想 
先把陣列從中間分 

  
 

    

    
    資料結構與演算法之美專欄學習筆記-排序優化
      選擇合適的排序演算法 
回顧 
  
選擇排序演算法的原則 
1）線性排序時間複雜度很低但使用場景特殊，如果要寫一個通用排序函式，不能選擇線性排序。 
2）為了兼顧任意規模資料的排序，一般會首選時間複雜度為O(nlogn)的排序演算法來實現排序函式。 
3）同為O(nlogn)的快排和歸併排序相比， 

  
 

    

    
    資料結構與演算法之美專欄學習筆記-陣列
      什麼是陣列 
陣列（Array）是一種線性表資料結構。它用一組連續的記憶體空間，來儲存一組具有相同型別的資料。 
線性表 
線性表就是資料排成像一條線一樣的結構。 
常見的線性表結構：陣列，連結串列、佇列、棧等。 
非線性表有：二叉樹、圖、堆等。 
 
 
連續的記憶體空間和相同型別的資料 
優點：兩限制使得 

  
 

    

    
    資料結構與演算法之美專欄學習筆記-複雜度分析
      複雜度分析 
什麼是複雜度分析 
資料結構和演算法解決是“如何讓計算機更快時間、更省空間的解決問題”。 
因此需從執行時間和佔用空間兩個維度來評估資料結構和演算法的效能。 
分別用時間複雜度和空間複雜度兩個概念來描述效能問題，二者統稱為複雜度。 
複雜度描述的是演算法執行時間（或佔用空間）與資料規模的增長關係 

  
 

    

    
    資料結構與演算法之美專欄學習筆記-二分查詢(下)
      四種常見的二分查詢變形問題 
查詢第一個值等於給定值的元素 
 
 //查詢第一個等於給定值的元素
public static int BSearch2(int[] a, int n, int value){
    //定義陣列頭尾索引
    int low = 0, high = n - 1;
     

  
 

    

    
    資料結構與演算法之美專欄學習筆記-跳錶
      跳錶的概念 
對連結串列建立n級索引，例如每兩個結點提取一個節點到上一層，稱之為索引層。 
圖中的down表示down指標，指向下一級結點 
 
  
跳錶的時間複雜度 
跳錶的高度 
跳錶的高度是log2n。 
跳錶的時間複雜度 
跳錶中查詢某個資料的時間複雜度是O(logn)。 
   

  
 

    

    
    資料結構與演算法之美專欄學習筆記-雜湊演算法
      雜湊演算法的定義和原理 
將任意長度的二進位制串對映為固定長度的二進位制串。 
這個對映的規則就是雜湊演算法，而通過原始資料對映之後得到的二進位制串就是雜湊值。 
設計一個優秀的雜湊演算法需要滿足： 
 
 從雜湊值不能反向推匯出原始資料（所以雜湊演算法也叫單向雜湊演算法）； 
 對輸入資料非常敏感，哪怕原始 

  
 

    

    
    資料結構與演算法之美專欄學習筆記-二叉樹基礎(上）
      樹 
節點的定義 
樹中的元素稱之為節點 
高度的定義 
節點的高度：節點到葉子節點的最長路徑 
樹的高度：跟節點的高度 
深度的定義 
根節點到這個節點所經歷的邊的個數 
層的定義 
節點的深度+1 
 
  
二叉樹 
滿二叉樹 
除了葉子結點外每個節點都有左右兩個子節點 
完全二叉樹 
葉子結 

  
 

    

    
    《資料結構與演算法之美》專欄閱讀筆記5——散列表和雜湊函式
       
 
  
  
  
  這應該是看完最呆（沒有想到的那種呆~）的一個小章節了，給作者鼓掌，講的好好。果然抽象能力才是王道 
  
 
 
  文章目錄
  
   
    
     
      1、散列表
      
       1.1、小概念
       1.2、雜湊函式
       1 

  
 

    

    
    《資料結構與演算法之美》專欄閱讀筆記4——二分查詢
       
 
  
  
  
  找呀找呀找朋友 
  
 
 
  文章目錄
  
   
    
     
      1、二分查詢
      2、變形的二分查詢
      
       2.1、查詢第一個、最後一個值等於給定值的元素
       2.2、查詢第一個大於等於、最後一個小於等於給定值 

  
 

    

    
    《資料結構與演算法之美》專欄閱讀筆記3——排序演算法
       
 
  
  
  
  上週排計劃，說花個一天的時間看完好了（藐視臉）~然後每天回家看一會，看了一個星期……做人，要多照鏡子好嘛 
  
  
   
 
 
 
  文章目錄
  
   
    
     1、簡單排序
     
      1.1 如何分析排序演算法
      
       

  
 

    

    
    《資料結構與演算法之美》專欄閱讀筆記1——複雜度分析
       
 
  
  
  
  蹭可愛的男朋友買的極客時間的專欄【資料結構與演算法之美】，作者讓大家定個學習的flag。o(￣▽￣)o，好吧，最近喜歡做思維導圖（純粹因為好看！），所以flag就是每篇都要寫讀書筆記咯~ 
  
  
 
 
  文章目錄
  
   
    
     1、如何抓住重點，系統 

  
 

    

    
    資料結構與演算法之陣列篇
       
 
 
 Q1：為什麼很多程式語言中，陣列都從0開始編號？ 
      舉例說明： 
      從陣列儲存的記憶體模型上來看，"下標"最確切的定義應該是"偏移(offset)"。前面也講到，如果用a來表示陣列的首地址，a[0]就是偏移為0的位