1. 程式人生 > >關係型和非關係型資料庫的區別?

關係型和非關係型資料庫的區別?

當前主流的關係型資料庫Oracle、DB2、Microsoft SQL Server、Microsoft Access、MySQL等。

非關係型資料庫有 NoSql、Cloudant。

nosql和關係型資料庫比較? 優點: 1)成本:nosql資料庫簡單易部署,基本都是開源軟體,不需要像使用oracle那樣花費大量成本購買使用,相比關係型資料庫價格便宜。 2)查詢速度:nosql資料庫將資料儲存於快取之中,關係型資料庫將資料儲存在硬碟中,自然查詢速度遠不及nosql資料庫。 3)儲存資料的格式:nosql的儲存格式是key,value形式、文件形式、圖片形式等等,所以可以儲存基礎型別以及物件或者是集合等各種格式,而資料庫則只支援基礎型別。 4)擴充套件性:關係型資料庫有類似join這樣的多表查詢機制的限制導致擴充套件很艱難。 缺點: 1)維護的工具和資料有限,因為nosql是屬於新的技術,不能和關係型資料庫10幾年的技術同日而語。 2)不提供對sql的支援,如果不支援sql這樣的工業標準,將產生一定使用者的學習和使用成本。

3)不提供關係型資料庫對事物的處理。

非關係型資料庫的優勢:1. 效能NOSQL是基於鍵值對的,可以想象成表中的主鍵和值的對應關係,而且不需要經過SQL層的解析,所以效能非常高。2. 可擴充套件性同樣也是因為基於鍵值對,資料之間沒有耦合性,所以非常容易水平擴充套件。

關係型資料庫的優勢:1. 複雜查詢可以用SQL語句方便的在一個表以及多個表之間做非常複雜的資料查詢。2. 事務支援使得對於安全效能很高的資料訪問要求得以實現。對於這兩類資料庫,對方的優勢就是自己的弱勢,反之亦然。

關係型資料庫把所有的資料都通過行和列的二元表現形式表示出來。

關係型資料庫的優勢:

1. 保持資料的一致性(事務處理)

2.由於以標準化為前提,資料更新的開銷很小(相同的欄位基本上都只有一處)

3. 可以進行Join等複雜查詢

其中能夠保持資料的一致性是關係型資料庫的最大優勢。

關係型資料庫的不足:

不擅長的處理

1. 大量資料的寫入處理

2. 為有資料更新的表做索引或表結構(schema)變更

3. 欄位不固定時應用

4. 對簡單查詢需要快速返回結果的處理

--大量資料的寫入處理

讀寫集中在一個數據庫上讓資料庫不堪重負,大部分網站已使用主從複製技術實現讀寫分離,以提高讀寫效能和讀庫的可擴充套件性。

所以在進行大量資料操作時,會使用資料庫主從模式。資料的寫入由主資料庫負責,資料的讀入由從資料庫負責,可以比較簡單地通過增加從資料庫來實現規模化,但是資料的寫入卻完全沒有簡單的方法來解決規模化問題。

第一,要想將資料的寫入規模化,可以考慮把主資料庫從一臺增加到兩臺,作為互相關聯複製的二元主資料庫使用,確實這樣可以把每臺主資料庫的負荷減少一半,但是更新處理會發生衝突,可能會造成資料的不一致,為了避免這樣的問題,需要把對每個表的請求分別分配給合適的主資料庫來處理。

第二,可以考慮把資料庫分割開來,分別放在不同的資料庫伺服器上,比如將不同的表放在不同的資料庫伺服器上,資料庫分割可以減少每臺數據庫伺服器上的資料量,以便減少硬碟IO的輸入、輸出處理,實現記憶體上的高速處理。但是由於分別儲存字不同伺服器上的表之間無法進行Join處理,資料庫分割的時候就需要預先考慮這些問題,資料庫分割之後,如果一定要進行Join處理,就必須要在程式中進行關聯,這是非常困難的。

 

--為有資料更新的表做索引或表結構變更

在使用關係型資料庫時,為了加快查詢速度需要建立索引,為了增加必要的欄位就一定要改變表結構,為了進行這些處理,需要對錶進行共享鎖定,這期間資料變更、更新、插入、刪除等都是無法進行的。如果需要進行一些耗時操作,例如為資料量比較大的表建立索引或是變更其表結構,就需要特別注意,長時間內資料可能無法進行更新。

--欄位不固定時的應用

如果欄位不固定,利用關係型資料庫也是比較困難的,有人會說,需要的時候加個欄位就可以了,這樣的方法也不是不可以,但在實際運用中每次都進行反覆的表結構變更是非常痛苦的。你也可以預先設定大量的預備欄位,但這樣的話,時間一長很容易弄不清除欄位和資料的對應狀態,即哪個欄位儲存有哪些資料。

--對簡單查詢需要快速返回結果的處理  (這裡的“簡單”指的是沒有複雜的查詢條件)

這一點稱不上是缺點,但不管怎樣,關係型資料庫並不擅長對簡單的查詢快速返回結果,因為關係型資料庫是使用專門的sql語言進行資料讀取的,它需要對sql與越南進行解析,同時還有對錶的鎖定和解鎖等這樣的額外開銷,這裡並不是說關係型資料庫的速度太慢,而只是想告訴大家若希望對簡單查詢進行高速處理,則沒有必要非使用關係型資料庫不可。

---------------------------

NoSQL資料庫

關係型資料庫應用廣泛,能進行事務處理和表連線等複雜查詢。相對地,NoSQL資料庫只應用在特定領域,基本上不進行復雜的處理,但它恰恰彌補了之前所列舉的關係型資料庫的不足之處。

優點:

 易於資料的分散

各個資料之間存在關聯是關係型資料庫得名的主要原因,為了進行join處理,關係型資料庫不得不把資料儲存在同一個伺服器內,這不利於資料的分散,這也是關係型資料庫並不擅長大資料量的寫入處理的原因。相反NoSQL資料庫原本就不支援Join處理,各個資料都是獨立設計的,很容易把資料分散在多個伺服器上,故減少了每個伺服器上的資料量,即使要處理大量資料的寫入,也變得更加容易,資料的讀入操作當然也同樣容易。

典型的NoSQL資料庫

臨時性鍵值儲存(memcached、Redis)、永久性鍵值儲存(ROMA、Redis)、面向文件的資料庫(MongoDB、CouchDB)、面向列的資料庫(Cassandra、HBase)

一、 鍵值儲存

它的資料是以鍵值的形式儲存的,雖然它的速度非常快,但基本上只能通過鍵的完全一致查詢獲取資料,根據資料的儲存方式可以分為臨時性、永久性和兩者兼具 三種。

(1)臨時性

      所謂臨時性就是資料有可能丟失,memcached把所有資料都儲存在記憶體中,這樣儲存和讀取的速度非常快,但是當memcached停止時,資料就不存在了。由於資料儲存在記憶體中,所以無法操作超出記憶體容量的資料,舊資料會丟失。總結來說:

      。在記憶體中儲存資料

      。可以進行非常快速的儲存和讀取處理

      。資料有可能丟失

 (2)永久性

       所謂永久性就是資料不會丟失,這裡的鍵值儲存是把資料儲存在硬碟上,與臨時性比起來,由於必然要發生對硬碟的IO操作,所以效能上還是有差距的,但資料不會丟失是它最大的優勢。總結來說:

       。在硬碟上儲存資料

       。可以進行非常快速的儲存和讀取處理(但無法與memcached相比)

       。資料不會丟失

(3) 兩者兼備

       Redis屬於這種型別。Redis有些特殊,臨時性和永久性兼具。Redis首先把資料儲存在記憶體中,在滿足特定條件(預設是 15分鐘一次以上,5分鐘內10個以上,1分鐘內10000個以上的鍵發生變更)的時候將資料寫入到硬碟中,這樣既確保了記憶體中資料的處理速度,又可以通過寫入硬碟來保證資料的永久性,這種型別的資料庫特別適合處理陣列型別的資料。總結來說:

       。同時在記憶體和硬碟上儲存資料

       。可以進行非常快速的儲存和讀取處理

       。儲存在硬碟上的資料不會消失(可以恢復)

       。適合於處理陣列型別的資料

二、面向文件的資料庫

   MongoDB、CouchDB屬於這種型別,它們屬於NoSQL資料庫,但與鍵值儲存相異。

   (1)不定義表結構

     即使不定義表結構,也可以像定義了表結構一樣使用,還省去了變更表結構的麻煩。

   (2)可以使用複雜的查詢條件 

     跟鍵值儲存不同的是,面向文件的資料庫可以通過複雜的查詢條件來獲取資料,雖然不具備事務處理和Join這些關係型資料庫所具有的處理能力,但初次以外的其他處理基本上都能實現。

三、 面向列的資料庫

   Cassandra、HBae、HyperTable屬於這種型別,由於近年來資料量出現爆發性增長,這種型別的NoSQL資料庫尤其引入注目。

   普通的關係型資料庫都是以行為單位來儲存資料的,擅長以行為單位的讀入處理,比如特定條件資料的獲取。因此,關係型資料庫也被成為面向行的資料庫。相反,面向列的資料庫是以列為單位來儲存資料的,擅長以列為單位讀入資料。

面向列的資料庫具有搞擴充套件性,即使資料增加也不會降低相應的處理速度(特別是寫入速度),所以它主要應用於需要處理大量資料的情況。另外,把它作為批處理程式的儲存器來對大量資料進行更新也是非常有用的。但由於面向列的資料庫跟現行資料庫儲存的思維方式有很大不同,故應用起來十分困難。

總結:關係型資料庫與NoSQL資料庫並非對立而是互補的關係,即通常情況下使用關係型資料庫,在適合使用NoSQL的時候使用NoSQL資料庫,讓NoSQL資料庫對關係型資料庫的不足進行彌補。