數據庫的相關介紹
阿新 • • 發佈:2018-02-25
階段 需要 主鍵約束 圖層 文件 接收 備份 面向 serve
數據庫的相關介紹
文件管理系統的缺點: 編寫應用程序不方便 數據冗余不可避免 應用程序依賴性 不支持對文件的並發訪問 數據間聯系弱 難以按用戶視圖表示數據 數據庫管理系統的優點: 相互關聯的數據的集合 較少的數據冗余 程序與數據相互獨立 保證數據的安全、可靠 最大限度地保證數據的正確性 數據可以並發使用並能同時保證一致性 數據庫管理系統 數據庫是數據的匯集,它以一定的組織形式存於存儲介質上。 DBMS是管理數據庫的系統軟件,它實現數據庫系統的各種功能,是數據庫系統的核心。 DBA負責數據庫的規劃、設計、協調、維護和管理等工作。 應用程序:指以數據庫為基礎的應用程序 數據庫管理系統的基本功能 數據定義 數據處理 數據安全 數據備份 數據庫系統的架構 單機架構 大型主機/終端架構 主從式架構(C/S) 分布式架構 實體- 聯系模型E-R 實體Entity: 客觀存在並可以相互區分的客觀事物或抽象事件稱為實體。 在E-R 圖中用矩形框表示實體,把實體名寫在框內 屬性: 實體所具有的特征或性質 聯系: 聯系是數據之間的關聯集合,是客觀存在的應用語義鏈 實體內部的聯系:指組成實體的各屬性之間的聯系。如職工,實體中職工號和部門經理號之間有一種關聯關系 實體之間的聯系:指不同實體之間聯系。例學生選課實體和學生基本信息實體之間 聯系的類型: 一對一聯系(1:1) 一對多聯系(1:n) 多對多聯系(m:n) 數據三要素 數據結構: 一類是與數據類型、內容、性質有關的對象,比如關系模型中的域、屬性和關系等; 另一類是與數據之間聯系有關的對象,它從數據組織層表達數據記錄與字段的結構 數據的操作: 數據提取:在數據集合中提取感興趣的內容。(SELECT) 數據更新:變更數據庫中的數據。(INSERT 、DELETE、UPDATE) 數據的約束條件:是一組完整性規則的集合 實體(行)完整性 Entity integrity 域(列)完整性 Domain Integrity 參考完整性 Referential Integrity 簡易數據規劃流程 第一階段: 集數據,得到字段 收集必要且完整的數據項 轉換成數據表的字段 第二階段: 把字段分類,歸入表,建立表的關聯 關聯:表和表間的關系 分割數據表並建立關聯的優點 節省空間 減少輸入錯誤 方便數據修改 第三階段: 規範化數據庫 數據庫的正規化分析 RDMBS設計範式基礎概念 設計關系數據庫時,遵從不同的規範要求,設計出合理的關系型數據庫,這些不同的規範要求被稱為不同的範式,各種範式呈遞次規範,越高的範式數據庫冗余越小。 目前關系數據庫有六種範式: 第一範式(1NF)、第二範式(2NF)、第三範式(3NF)、巴德斯科範式(BCNF)、第四範式(4NF)和第五範式(5NF ,又稱完美範式)。 滿足最低要求的範式是第一範式(1NF)。在第一範式的基礎上進一步滿足更多規範要求的稱為第二範式(2NF ),其余範式以次類推。一般說來,數據庫只需滿足第三範式(3NF) 範式: 1NF:每一列都是不可分割的基本數據項,同一列中不能有多個值,即實體中的某個屬性不能有多個值或者不能有重復的屬性。除去同類型的字段,就是無重復的列 2NF:第二範式必須先滿足第一範式,要求表中的每個行必須可以被唯一地區分。通常為表加上一個列,以存儲各個實例的唯一標識PK。非PK 的字段需要與整個PK 有直接相關性 3NF:滿足第三範式必須先滿足第二範式。第三範式要求一個數據庫表中不包含已在其它表中已包含的非主關鍵字信息,非PK SQL 概念 SQL: Structure Query Language 結構化查詢語言 SQL解釋器 數據存儲協議:應用層協議,C/S S :server, 監聽於套接字,接收並處理客戶端的應用請求 C :Client 程序接口 CLI GUI 應用編程接口 ODBC :Open Database Connectivity JDBC :Java Data Base Connectivity 約束 約束:constraint,表中的數據要遵守的限制 主鍵:一個或多個字段的組合,填入的數據必須能在本表中唯一標識本行;必須提供數據,即NOT NULL ,一個表只能存在一個 唯一鍵:一個或多個字段的組合,填入的數據必須能在本表中唯一標識本行;允許為NULL ,一個表可以存在多個 外鍵:一個表中的某字段可填入的數據取決於另一個表的主鍵或唯一鍵已有的數據 檢查:字段值在一定範圍內 索引 將表中的一個或多個字段中的數據復制一份另存,並且此些需要按特定次序排序存儲 索引是特殊數據結構,定義在查找時作為查找條件的字段 優點:提高查詢速度 缺點:占用額外空間,影響插入速度 創建索引必須要有索引名稱 關系運算: 選擇:挑選出符合條件的行 投影:挑選出需要的字段 連接:表間字段的關聯 數據模型 數據抽象: 物理層:決定數據的存儲格式,即RDBMS 在磁盤上如何組織文件 邏輯層:描述存儲什麽數據,以及數據間存在什麽樣的關系 視圖層:描述DB中的部分數據 關系模型的分類: 基於對象的關系模型 半結構化的關系模型:XML 數據庫對象的命名規則 必須以字母開頭 可包括數字和三個特殊字符(#,_ ,$) 不要使用MySQL的保留字 同一Schema下的對象不能同名 數據庫基本概念 1)數據:記錄的信息 2)表:記錄信息被組織在一起的形式 3)數據庫:表的集合,是個存儲相互有關數據的倉庫 4)數據庫管理系統(database management system,DBMS):實現對數據庫有效管理的系統軟件。 5)數據庫系統(database system ,DBS):是一個交互系統,有硬件、操作系統、數據庫、DBMS、應用軟件和數據庫用戶組成。 關系型數據庫 1)關系型數據庫是基於關系模型的數據庫,基本概念來自於關系模型。 關系就是二維表,並滿足性質是,表中的行、列次序並不重要。 關系模型建立在關系代數的理論基礎上,數據結構使用簡易的二維數據表,可用簡單的“實體-關系(E-R)”圖來直接表示。 E-R圖包含了實體(數據對象)、關系和屬性三個要素。 2)關系數據庫存儲結構是二維表格,反映事物及其相關聯數據是以表格形式保存。 在每個二維表中,每行(row)稱為一條記錄,用來描述一個對象的信息,每列(column)稱為一個字段,用來描述對象的一個屬性。 3)關系型數據庫的主鍵、域和事務。 主鍵(Primary key)是用於唯一確定一個記錄的字段。 域(domain)是屬性的取值範圍,如性別只能是‘男’和‘女’兩個值。 事務(transaction)是多個操作被當作一個整體對待。 4)關系型數據庫的常見組件 數據庫:database 表:table 行:row 列:column 索引:index 視圖:view 用戶:user 權限:privilege 存儲過程:procedure ,過程無返回值 存儲函數:function ,過程有返回值 觸發器:trigger 事件調度器:event scheduler ,任務計劃 5)當今主流的關系型數據庫 1》SQLServer(微軟的):面向window系統,簡單易用。 2》oracle:面向所有主流平臺,安全、完善但操作復雜。 3》DB2(IBM公司的):面向所有主流平臺,大型、安全和完善的 4》MySQL(甲骨文收購):免費、開源、體積小 非關系數據庫 1)非關系數據庫被稱為NoSQL(not only SQL),存儲數據不以關系模型為依據,不需要固定的表格式。 它是作為關系數據庫的一個補充,發揮著高效率和高性能。 2)非關系型數據庫的優點 1》可滿足數據庫高並發讀寫的需求 2》滿足對海量數據高效率存儲與訪問 3》滿足數據庫高擴展性與高可用性的需求 3)非關系型數據庫的存儲方式 1》鍵-值方式,以鍵為依據存儲、刪除、更改數據 2》列存儲(column-oriented),將關系的數據存儲在列族中 3》文檔方式,數據庫有一些列數據項組成,每個數據項都有對應的值 4》圖形方式,實體為頂點,關系為變,數據保存為一個圖形。 4)非關系數據庫產品 1》memcached: 是一個緩存系統,以key-value方式存儲數據,可以緩存數據以減輕數據庫壓力並能加快訪問速度,加速動態web應用,緩存的內容存儲在內存中。 2》redis 也是一個以key-value方式存儲數據,數據也保存在內存中,但定期會將數據寫入磁盤中。 特點有:支持內存緩存,支持持久化,數據類型更多,支持集群和分布式,支持隊列。 應用示例有:數據庫前端緩存,session共享,用於需要緩存除了key-value之外的更多數據的時候,用於緩存的數據需要長久保存的時候。 RDBMS DBMS ---> RDBMS 範式: 第一範式、第二範式、第三範式 表: row(行), column(列); 關系運算: 選擇 投影 數據庫: 表、索引、視圖(虛表)、sql、存儲過程、存儲函數、觸發器、事件調度器; 約束: 主鍵約束:唯一、非空;一張表只能有一個; 唯一鍵約束:唯一,可以存在多個; 外鍵約束:參考性約束; 檢查性約束:check; 三層模型: 物理層 --> sa 邏輯層 --> dba 視圖層 --> coder 實現: oracle, db2, sybase, infomix, sql server; mysql, mariadb, postgresql, sqlite; 臟讀、不可重復讀、幻讀 臟讀 : 臟讀就是指當一個事務正在訪問數據,並且對數據進行了修改,而這種修改還沒有提交到數據庫中,這時,另外一個事務也訪問這個數據,然後使用了這個數據。 不可重復讀 : 是指在一個事務內,多次讀同一數據。 在這個事務還沒有結束時,另外一個事務也訪問該同一數據。 那麽,在第一個事務中的兩 次讀數據之間,由於第二個事務的修改,那麽第一個事務兩次讀到的的數據可能是不一樣的。 這樣就發生了在一個事務內兩次讀到的數據是不一樣的,因此稱為是不 可重復讀。 例如,一個編輯人員兩次讀取同一文檔,但在兩次讀取之間,作者重寫了該文檔。當編輯人員第二次讀取文檔時,文檔已更改。原始讀取不可重復。如果只有在作者全部完成編寫後編輯人員才可以讀取文檔,則可以避免該問題。 不可重復讀的重點是修改 : 同樣的條件 , 你讀取過的數據 , 再次讀取出來發現值不一樣了 幻讀 : 是指當事務不是獨立執行時發生的一種現象。 例如,第一個事務對一個表中的數據進行了修改,這種修改涉及到表中的全部數據行。同時,第二個事務也修改這個表中的數據,這種修改是向表中插入一行新數據。那麽,以後就會發生操作第一個事務的用戶發現表中還有沒有修改的數據行,就好象發生了幻覺一樣。 例如,一個編輯人員更改作者提交的文檔,但當生產部門將其更改內容合並到該文檔的主復本時,發現作者已將未編輯的新材料添加到該文檔中。 如果在編輯人員和生產部門完成對原始文檔的處理之前,任何人都不能將新材料添加到文檔中,則可以避免該問題。 幻讀的重點在於新增或者刪除 同樣的條件 , 第 1 次和第 2 次讀出來的記錄數不一樣 Isolation 屬性一共支持五種事務設置,具體介紹如下: DEFAULT 使用數據庫設置的隔離級別 ( 默認 ) ,由 DBA 默認的設置來決定隔離級別 . READ_UNCOMMITTED 會出現臟讀、不可重復讀、幻讀 ( 隔離級別最低,並發性能高 ) READ_COMMITTED 會出現不可重復讀、幻讀問題(鎖定正在讀取的行) REPEATABLE_READ 會出幻讀(鎖定所讀取的所有行) SERIALIZABLE 保證所有的情況不會發生(鎖表)
數據庫的相關介紹