資料庫第一章緒論 筆記
<1>資料庫的地位:
- 資料庫技術產生於六十年代末,是資料管理的有效技術,是電腦科學的重要分支。
- 資料庫技術是資訊系統的核心和基礎,它的出現極大地促進了計算機應用向各行各業的滲透。
- 資料資料的定義 描述事物的符號記錄 資料的種類 數字、文字、圖形、影象、音訊、視訊、學生的檔案記錄等庫已經成為每個人生活中不可缺少的部分。
<2>資料庫的4個基本概念
1. 資料:是資料庫中儲存的基本物件
資料的定義:描述事物的符號記錄
資料的種類: 數字、文字、圖形、影象、音訊、視訊、學生的檔案記錄等
2.資料庫:
資料庫的定義:資料庫(Database,簡稱DB)是長期儲存在計算機內、有組織的、可共享的大量資料的集合。
資料庫的基本特徵:資料按一定的資料模型組織、描述和儲存 可為各種使用者共享 冗餘度較小 資料獨立性較高 易擴充套件
3.資料庫管理系統:
資料庫管理系統定義:(1) 位於使用者與作業系統之間的一層資料管理軟體
(2)是基礎軟體,是一個大型複雜的軟體系統
資料庫管理系統的用途:科學地組織和儲存資料、高效地獲取和維護資料
資料庫管理系統的主要功能 :(1)資料定義功能: 提供資料定義語言(DDL)
定義資料庫中的資料物件
(2)資料組織、儲存和管理 : 分類組織、儲存和管理各種資料
確定組織資料的檔案結構和存取方式
實現資料之間的聯絡
提供多種存取方法提高存取效率
(3) 資料操縱功能: 提供資料操縱語言(DML)
實現對資料庫的基本操作 (查詢、插入、刪除和修改)
(4)資料庫的事務管理和執行管理: 資料庫在建立、執行和維護時由資料庫管理系統統一管理和控制
保證資料的安全性、完整性、多使用者對資料的併發使用
發生故障後的系統恢復
(5)資料庫的建立和維護功能: 資料庫初始資料的裝載和轉換
資料庫轉儲、恢復功能
資料庫的重組織
效能監視、分析等
(6)其它功能: 資料庫管理系統與網路中其它軟體系統的通訊
資料庫管理系統系統之間的資料轉換
異構資料庫之間的互訪和互操作
3.資料庫系統(Database System,簡稱DBS)
資料庫系統的構成 :
(1)資料庫
(2)資料庫管理系統(及其應用開發工具)
(3)應用程式
(4)資料庫管理員
<3>資料管理技術的產生和發展
資料管理定義: 對資料進行分類、組織、編碼、儲存、檢索和維護
資料處理的中心問題
資料管理技術的發展過程 :人工管理階段(20世紀50年代中之前)
檔案系統階段(20世紀50年代末--60年代中)
資料庫系統階段(20世紀60年代末--現在)
資料管理技術的發展動力: 應用需求的推動
計算機硬體的發展
計算機軟體的發展
(1)人工管理階段特點:一應用程式
資料的共享程度:無共享、冗餘度極大
資料的獨立性:不資料的管理者:使用者(程式設計師),資料不儲存
資料面向的物件:某獨立,完全依賴於程式
資料的結構化:無結構
資料控制能力:應用程式自己控制
(2)檔案系統階段特點:資料的管理者:檔案系統,資料可長期儲存
資料面向的物件:某一應用
資料的共享程度:共享性差、冗餘度大
資料的結構化:記錄內有結構,整體無結構
資料的獨立性:獨立性差
資料控制能力:應用程式自己控制
<4>資料庫系統階段特點:
1.資料結構化
資料的整體結構化是資料庫的主要特徵之一
整體結構化 : 不再僅僅針對某一個應用,而是面向全組織
不僅資料內部結構化,整體是結構化的,資料之間具有聯絡
資料記錄可以變長
資料的最小存取單位是資料項
資料的用資料模型描述,無需應用程式定義
2.資料的共享性高,冗餘度低且易擴充
資料面向整個系統,可以被多個使用者、多個應用共享使用。
資料共享的好處 : 減少資料冗餘,節約儲存空間
避免資料之間的不相容性與不一致性
使系統易於擴充
3.資料獨立性高
物理獨立性: 指使用者的應用程式與資料庫中資料的物理儲存是相互獨立的。
當資料的物理儲存改變了,應用程式不用改變。
邏輯獨立性: 指使用者的應用程式與資料庫的邏輯結構是相互獨立的。
資料的邏輯結構改變了,應用程式不用改變。
資料獨立性由資料庫管理系統的二級映像功能來保證。
4.資料由資料庫管理系統統一管理和控制
資料庫管理系統提供的資料控制功能 :
(1)資料的安全性(Security)
保護 保護資料以防止不合法的使用造成的資料的洩密和破壞。
(2)資料的完整性(Integrity)
檢查 保證資料的正確性、有效性和相容性。
(3)併發(Concurrency)控制
對多使用者的併發操作加以控制和協調,防止相互干擾而得到錯誤的結果。
(4)資料庫恢復(Recovery)
將資料庫從錯誤狀態恢復到某一已知的正確狀態。
資料模型分為兩類: (1)概念模型
(2)邏輯模型和物理模型
層次模型:
層次模型是資料庫系統中最早出現的資料模型
層次資料庫系統的典型代表是IBM公司的IMS(Information Management System)資料庫管理系統
層次模型用樹形結構來表示各類實體以及實體間的聯絡
網狀模型:
滿足下面兩個條件的基本層次聯絡的集合: 1. 允許一個以上的結點無雙親;
2. 一個結點可以有多於一個的雙親。
表示方法(與層次資料模型相同) 實體型:用記錄型別描述
每個結點表示一個記錄型別(實體)
屬性:用欄位描述
每個記錄型別可包含若干個欄位
聯絡:用結點之間的連線表示記錄型別(實體)之間的一對多的父子聯絡
網狀模型與層次模型的區別 :
網狀模型允許多個結點沒有雙親結點
網狀模型允許結點有多個雙親結點
網狀模型允許兩個結點之間有多種聯絡(複合聯絡)
網狀模型可以更直接地描述現實世界
層次模型實際上是網狀模型的一個特例
關係模型:
關係資料庫系統採用關係模型作為資料的組織方式
1970年美國IBM公司San Jose研究室的研究員E.F.Codd首次提出了資料庫系統的關係模型
計算機廠商新推出的資料庫管理系統幾乎都支援關係模型
關係(Relation): 一個關係對應通常說的一張表
元組(Tuple): 表中的一行即為一個元組
屬性(Attribute): 表中的一列即為一個屬性,給每一個屬性起一個名稱即屬性名
主碼(Key): 也稱碼鍵。表中的某個屬性組,它可以唯一確定一個元組
域(Domain): 是一組具有相同資料型別的值的集合。屬性的取值範圍來自某個域。
分量: 元組中的一個屬性值。
關係模式: 對關係的描述
關係名(屬性1,屬性2,…,屬性n)
學生(學號,姓名,年齡,性別,系名,年級)
優點: 建立在嚴格的數學概念的基礎上
概念單一 :實體和各類聯絡都用關係來表示 對資料的檢索結果也是關係
關係模型的存取路徑對使用者透明 :具有更高的資料獨立性,更好的安全保密性
簡化了程式設計師的工作和資料庫開發建立的工作
缺點 :存取路徑對使用者透明,查詢效率往往不如格式化資料模型 為提高效能,必須對使用者的查詢請求進行優化,增加了開發資料庫管理系統的難度
資料庫系統的結構
從資料庫應用開發人員角度看,資料庫系統通常採用三級模式結構,是資料庫系統內部的系統結構
從資料庫終端使用者角度看,資料庫系統的結構分為:
單使用者結構
主從式結構
分散式結構
客戶-伺服器
瀏覽器-應用伺服器/資料庫伺服器多層結構等
資料庫系統的三級模式結構:
模式(也稱邏輯模式): 資料庫中全體資料的邏輯結構和特徵的描述
所有使用者的公共資料檢視 一個數據庫只有一個模式
模式的地位:是資料庫系統模式結構的中間層
與資料的物理儲存細節和硬體環境無關
與具體的應用程式、開發工具及高階程式設計語言無關
模式的定義: 資料的邏輯結構(資料項的名字、型別、取值範圍等)
資料之間的聯絡 資料有關的安全性、完整性要求
外模式(也稱子模式或使用者模式): 資料庫使用者(包括應用程式設計師和終端使用者)使用的區域性資料的邏輯結構和特徵的描述
資料庫使用者的資料檢視,是與某一應用有關的資料的邏輯表示
內模式(也稱儲存模式): 是資料物理結構和儲存方式的描述
是資料在資料庫內部的表示方式 記錄的儲存方式(例如,順序儲存,按照B樹結構儲存,按hash方法儲存等)
1.索引的組織方式
2.資料是否壓縮儲存
3.資料是否加密
4.資料儲存記錄結構的規定
5.一個數據庫只有一個內模式