資料庫(七)—— 資料庫管理技術的發展
一、資料庫技術的發展
資料模型是資料庫系統的核心和基礎,以資料模型的發展為主線,資料庫技術可以分為三個發展階段,即第一代的網狀、層次資料庫系統,第二代的關係資料庫系統,以及新一代的資料庫系統。
1、第一代資料庫系統
層次資料庫系統和網狀資料庫系統的資料模型雖然分別為層次模型和網狀模型,但實質上層次模型是網狀模型的特例,它們都是格式化模型,它們從體系結構、資料庫語言到資料儲存管理均具有共同特徵。這兩類資料庫的共同特點有:
① 支援三級模式(外模式、模式和內模式)的體系結構,模式之間具有轉換功能;
② 用存取路徑來表示資料之間的聯絡;
③ 獨立的資料定義語言,可以描述資料庫的三級模式以及相互映像;
④ 導航的資料操縱語言,層次和網狀資料庫的資料查詢和資料操縱語言是一次一個記錄的導航式的過程化語言,這類語言通常嵌入某一種高階語言,例如:COBOL、FORTRAN、C語言中。
2、第二代資料庫系統
支援關係資料模型的關係資料庫系統是第二代資料庫系統。關係資料庫是以關係模型為基礎的,而關係模型是由資料結構、關係操作和資料完整性三部分組成。關係模型不僅簡單、清晰,而且由關係代數作為語言模型,由關係資料理論作為理論基礎。
3、新一代資料庫系統
1990年高階DBMS功能委員會發表的《第三代資料庫系統宣言》提出了第三代資料庫應具備的基本特徵如下:
① 第三代資料庫應支援資料管理、物件管理和知識管理;
② 第三代資料庫系統必須保持或繼承第二代資料庫系統的技術;
③ 第三代資料庫系統必須對其他系統開放。
二、資料倉庫與資料探勘
計算機系統中存在著兩類不同的資料處理工作:一類是操作型處理,也稱為聯機事務處理,它是針對具體業務在資料庫聯機的日常操作;另一類是分析型處理,也稱為聯機分析處理,一般針對某些主題的歷史資料進行分析,支援管理決策。
特性 | OLTP | OLAP |
特徵 | 操作處理 | 資訊處理 |
面向 | 事務 | 分析 |
使用者 | 辦事員、DBA、資料庫專業人員 | 知識工人、分析員 |
功能 | 日常操作 | 長期資訊需求,決策支援 |
DB設計 | 基於E-R,面向應用 | 星形、雪花,面向主題 |
資料 | 當前的,確保最新 | 歷史的,跨時間維護 |
彙總 | 原始的,高度詳細 | 彙總的,統一的 |
檢視 | 詳細,一般關係 | 彙總的,多維的 |
工作單位 | 短的、簡單事務 | 複雜查詢 |
存取 | 讀寫 | 大多為讀 |
關注 | 資料進入 | 資訊輸出 |
操作 | 主關鍵字上索引、雜湊 | 大量掃描 |
訪問記錄數 | 數十個 | 數百萬個 |
使用者數 | 數千 | 數百 |
DB規模 | 100MB到GB | 100GB到TB |
優先 | 高效能,高可用性 | 高靈活性,端點使用者自治 |
度量 | 事務吞吐量 | 查詢吞吐量,響應時間 |
更多關於資料倉庫和資料探勘的內容可以參考: https://blog.csdn.net/lanhui_1996/article/details/77835942
三、大資料管理技術
大資料(big data),指無法在一定時間範圍內用常規軟體工具進行捕捉、管理和處理的資料集合,是需要新處理模式才能具有更強的決策力、洞察發現力和流程優化能力的海量、高增長率和多樣化的資訊資產。
麥肯錫全球研究所給出的定義是:一種規模大到在獲取、儲存、管理、分析方面大大超出了傳統資料庫軟體工具能力範圍的資料集合,具有海量的資料規模、快速的資料流轉、多樣的資料型別和價值密度低四大特徵。
關於更多大資料的資訊可以參考:https://blog.csdn.net/u013977285/article/details/71368367