1. 程式人生 > >非常全面的概念資料模型概述-PD下畫E-R圖

非常全面的概念資料模型概述-PD下畫E-R圖

以下是用PowerDesigner介紹的:

一、概念資料模型概述
資料模型是現實世界中資料特徵的抽象。資料模型應該滿足三個方面的要求:
1)能夠比較真實地模擬現實世界
2)容易為人所理解
3)便於計算機實現

概念資料模型也稱資訊模型,它以實體-聯絡(Entity-RelationShip,簡稱E-R)理論為基礎,並對這一理論進行了擴充。它從使用者的觀點出發對資訊進行建模,主要用於資料庫的概念級設計。

通常人們先將現實世界抽象為概念世界,然後再將概念世界轉為機器世界。換句話說,就是先將現實世界中的客觀物件抽象為實體(Entity)和聯絡(Relationship),它並不依賴於具體的計算機系統或某個DBMS系統,這種模型就是我們所說的CDM;然後再將CDM轉換為計算機上某個DBMS所支援的資料模型,這樣的模型就是物理資料模型,即PDM。

CDM是一組嚴格定義的模型元素的集合,這些模型元素精確地描述了系統的靜態特性、動態特性以及完整性約束條件

等,其中包括了資料結構、資料操作和完整性約束三部分。
1)資料結構表達為實體和屬性;
2)資料操作表達為實體中的記錄的插入、刪除、修改、查詢等操作;
3)完整性約束表達為資料的自身完整性約束(如資料型別、檢查、規則等)和資料間的參照完整性約束(如聯絡、繼承聯絡等);


二、實體、屬性及識別符號的定義
實體(Entity),也稱為例項,對應現實世界中可區別於其他物件的“事件”或“事物”。例如,學校中的每個學生,醫院中的每個手術。
每個實體都有用來描述實體特徵的一組性質,稱之為屬性,一個實體由若干個屬性來描述。如學生實體可由學號、姓名、性別、出生年月、所在系別、入學年份等屬性組成。

實體集(Entity Set)是具體相同型別及相同性質實體的集合。例如學校所有學生的集合可定義為“學生”實體集,“學生”實體集中的每個實體均具有學號、姓名、性別、出生年月、所在系別、入學年份等性質。

實體型別(Entity Type)是實體集中每個實體所具有的共同性質的集合,例如“患者”實體型別為:患者{門診號,姓名,性別,年齡,身份證號.............}。實體是實體型別的一個例項,在含義明確的情況下,實體、實體型別通常互換使用。

實體型別中的每個實體包含唯一標識它的一個或一組屬性,這些屬性稱為實體型別的識別符號(Identifier),如“學號”是學生實體型別的識別符號,“姓名”、“出生日期”、“信址”共同組成“公民”實體型別的識別符號。

有些實體型別可以有幾組屬性充當識別符號,選定其中一組屬性作為實體型別的主識別符號,其他的作為次識別符號。

三、實體、屬性及識別符號的表達


介紹PowerDesigner概念資料模型以及實體、屬性建立。

一、新建概念資料模型
1)選擇File-->New,彈出如圖所示對話方塊,選擇CDM模型(即概念資料模型)建立模型。


2)完成概念資料模型的建立。以下圖示,對當前的工作空間進行簡單介紹。(以後再更詳細說明)


3)選擇新增的CDM模型,右擊,在彈出的選單中選擇“Properties”屬性項,彈出如圖所示對話方塊。在“General”標籤裡可以輸入所建模型的名稱、程式碼、描述、建立者、版本以及預設的圖表等等資訊。在“Notes”標籤裡可以輸入相關描述及說明資訊。當然再有更多的標籤,可以點選 "More>>"按鈕,這裡就不再進行詳細解釋。



二、建立新實體
1)在CDM的圖形視窗中,單擊工具選項版上的Entity工具,再單擊圖形視窗的空白處,在單擊的位置就出現一個實體符號。點選Pointer工具或右擊滑鼠,釋放Entitiy工具。如圖所示

2)雙擊剛建立的實體符號,開啟下列圖示視窗,在此視窗“General”標籤中可以輸入實體的名稱、程式碼、描述等資訊。


三、新增實體屬性
1)在上述視窗的“Attribute”選項標籤上可以新增屬性,如下圖所示。


注意:
資料項中的“新增屬性”和“重用已有資料項”這兩項功能與模型中Data Item的Unique code 和Allow reuse選項有關。
P列表示該屬性是否為主識別符號;D列表示該屬性是否在圖形視窗中顯示;M列表示該屬性是否為強制的,即該列是否為空值。

如果一個實體屬性為強制的,那麼, 這個屬性在每條記錄中都必須被賦值,不能為空。2)在上圖所示視窗中,點選插入屬性按鈕,彈出屬性對話方塊,如下圖所示。

注意:這裡涉及到域的概念,即一種標準的資料結構,它可應用至資料項或實體的屬性上

一、定義屬性的標準檢查約束
標準檢查約束是一組確保屬性有效的表示式。在實體屬性的特性視窗,開啟如圖所示的檢查選項卡。


在這個選項卡可以定義屬性的標準檢查約束,視窗中每項的引數的含義,如下
引數說明Minimum屬性可接受的最小數Maximum 屬性可接受的最大數Default屬性不賦值時,系統提供的預設值Unit單位,如公里、噸、元Format屬性的資料顯示格式Lowercase屬性的賦值全部變為小寫字母Uppercase屬性的賦值全部變為大寫字母Cannot modify該屬性一旦賦值不能再修改List Of Values屬性賦值列表,除列表中的值,不能有其他的值Label屬性列表值的標籤
二、定義屬性的附加檢查
當Standard checks 或Rules 不能滿足檢查的要求時,可以在Additional Checks選項卡的Server子頁上,通過SQL語句中使用%MINMAX%、%LISTVAL%、%RULES%、%UPPER%、%LOWER%幾個變數來定義Standard和Rule,如圖所示


%MINMAX%、%LISTVAL%、%UPPER%、%LOWER%
在Standard Check中定義的Minimum 和Maximum、List values 、uppervalues、lowervalues

%RULES%
在Rules特性視窗Expression選項卡中定義的有效性規則表示式

一、識別符號
識別符號是實體中一個或多個屬性的集合,可用來唯一標識實體中的一個例項。要強調的是,CDM中的識別符號等價於PDM中的主鍵或候選鍵。
每個實體都必須至少有一個識別符號。如果實體只有一個識別符號,則它為實體的主識別符號。如果實體有多個識別符號,則其中一個被指定為主識別符號,其餘的識別符號就是次識別符號了。

二、如果定義主、次識別符號
1)選擇某個實體雙擊彈出實體的屬性對話方塊。在Identifiers選項卡上可以進行實體識別符號的定義。如下圖所示



2)選擇第一行“主識別符號”,點選屬性按鈕或雙擊第一行“主識別符號”,彈出屬性對話方塊,如圖所示

3)選擇"Attributes"選項卡,再點選“Add Attributes”工具,彈出如圖所示視窗,選擇某個屬性作為識別符號就行了。

一、資料項
資料項(Data Item)是資訊儲存的最小單位,它可以附加在實體上作為實體的屬性。
注意:模型中允許存在沒有附加至任何實體上的資料項。

二、新建資料項
1)使用“Model”---> Data Items 選單,在開啟的視窗中顯示已有的資料項的列表,點選 “Add a Row”按鈕,建立一個新資料項,如圖所示


2)當然您可以繼續設定具體資料項的Code、DataType、Length等等資訊。這裡就不再詳細說明了。

三、資料項的唯一性程式碼選項和重用選項
使用Tools--->Model Options->Model Settings。在Data Item組框中定義資料項的唯一性程式碼選項(Unique Code)與重用選項(Allow Reuse)。
注意:
如果選擇Unique Code複選框 ,每個資料項在同一個名稱空間有唯一的程式碼,而選擇Allow reuse ,一個數據項可以充當多個實體的屬性。


四、在實體中新增資料項
1)雙擊一個實體符號,開啟該實體的屬性視窗。
2)單擊Attributes選項卡,開啟如下圖所示視窗


注意:
Add a DataItem 與 Reuse a DataItem的區別在於
Add a DataItem 情況下,選擇一個已經存在的資料項,系統會自動複製所選擇的資料項。如果您設定了UniqueCode選項,那系統在複製過程中,新資料項的Code會自動生成一個唯一的號碼,否則與所選擇的資料項完全一致。


Reuse a DataItem情況下,只引用不新增,就是引用那些已經存在的資料項,作為新實體的資料項

一、 聯絡
聯絡(Relationship)是指實體集這間或實體集內部例項之間的連線。

實體之間可以通過聯絡來相互關聯。與實體和實體集對應,聯絡也可以分為聯絡和聯絡集,聯絡集是實體集之間的聯絡,聯絡是實體之間的聯絡,聯絡是具有方向性的。聯絡和聯絡集在含義明確的情況之下均可稱為聯絡。

按照實體型別中例項之間的數量對應關係,通常可將聯絡分為4類,即一對一(ONE TO ONE)聯絡、一對多(ONE TO MANY)聯絡、多對一(MANY TO ONE)聯絡和多對多聯絡(MANY TO MANY)。 二、 建立聯絡
在CDM工具選項板中除了公共的工具外,還包括如下圖所示的其它物件產生工具。

在圖形視窗中建立兩個實體後,單擊“實體間建立聯絡”工具,單擊一個實體,在按下滑鼠左鍵的同時把游標拖至別一個實體上並釋放滑鼠左鍵,這樣就在兩個實體間建立了聯絡,右鍵單擊圖形視窗,釋放Relationship工具。如下圖所示


三、 四種基本的聯絡
即一對一(ONE TO ONE)聯絡、一對多(ONE TO MANY)聯絡、多對一(MANY TO ONE)聯絡和多對多聯絡(MANY TO MANY)。如圖所示

四、 其他幾類特殊聯絡

除了4種基本的聯絡之外,實體集與實體集之間還存在標定聯絡(Identify Relationship)、非標定聯絡(Non-Identify RelationShip)和遞迴聯絡(Recursive Relationship)。

標定聯絡:
每個實體型別都有自己的識別符號,如果兩個實體集之間發生聯絡,其中一個實體型別的識別符號進入另一個實體型別並與該實體型別中的識別符號共同組成其識別符號時,這種聯絡則稱為標定聯絡,也叫依賴聯絡。反之稱為非標定聯絡,也叫非依賴聯絡。
注意:
在非標定聯絡中,一個實體集中的部分例項依賴於另一個例項集中的例項,在這種依賴聯絡中,每個實體必須至少有一個識別符號。而在標定聯絡中,一個實體集中的全部例項完全依賴於另個實體集中的例項,在這種依賴聯絡中一個實體必須至少有一個識別符號,而另一個實體卻可以沒有自己的識別符號。沒有識別符號的實體用它所依賴的實體的識別符號作為自己的識別符號。

換句話來理解,在標定聯絡中,一個實體(選課)依賴 一個實體(學生),那麼(學生)實體必須至少有一個識別符號,而(選課)實體可以沒有自己的識別符號,沒有標識別符號的實體可以用實體(學生)的識別符號作為自己的識別符號。



遞迴聯絡:
遞迴聯絡是實體集內部例項之間的一種聯絡,通常形象地稱為自反聯絡。同一實體型別中不同實體集之間的聯絡也稱為遞迴聯絡。

例如:在“職工”實體集中存在很多的職工,這些職工之間必須存在一種領導與被領導的關係。又如“學生”實體信中的實體包含“班長”子實體集與“普通學生”子實體集,這兩個子實體集之間的聯絡就是一種遞迴聯絡。建立遞迴聯絡時,只需要單擊“實體間建立聯絡”工具從實體的一部分拖至該實體的別一個部分即可。如圖


五、 定義聯絡的特性

在兩個實體間建立了聯絡後,雙擊聯絡線,開啟聯絡特性視窗,如圖所示。


六、 定義聯絡的角色名
在聯絡的兩個方向上各自包含有一個分組框,其中的引數只對這個方向起作用,Role Name為角色名,描述該方向聯絡的作用,一般用一個動詞或動賓組表。
如:“學生 to 課目 ” 組框中應該填寫“擁有”,而在“課目To 學生”組框中填寫“屬於”。(在此只是舉例說明,可能有些用詞不太合理)。
七、 定義聯絡的強制性
Mandatory 表洋這個方向聯絡的強制關係。選中這個複選框,則在聯絡線上產生一個聯絡線垂直的豎線。不選擇這個複選框則表示聯絡這個方向上是可選的,在聯絡線上產生一個小圓圈。

八、 有關聯絡的基數
聯絡具有方向性,每個方向上都有一個基數。

舉例,
“系”與“學生”兩個實體之間的聯絡是一對多聯絡,換句話說“學生”和“系”之間的聯絡是多對一聯絡。而且一個學生必須屬於一個系,並且只能屬於一個系,不能屬於零個系,所以從“學生”實體至“系”實體的基數為“1,1”,從聯絡的另一方向考慮,一個系可以擁有多個學生,也可以沒有任何學生,即零個學生,所以該方向聯絡的基數就為“0,n”,如圖所示

CDM是大多數開發者使用PD時最先建立的模型,也是整個資料庫設計最高層的抽象。CDM是建立在傳統的ER圖模型理論之上的,ER圖中有三大主要元素:實體型,屬性和聯絡。其中實體型對應到CDM中的Entity,屬性對應到CDM中每個Entity的Attribute,在概念上基本上是一一對應的。但在聯絡上,CDM有了比較大的擴充套件,除了保留ER圖原有的RelationShip概念之外,還增加了Association,Inheritance兩種實體關係,下面就讓我們分別看看這些關係的用法和之間的區別(下圖中被標紅的工具欄按鈕就是用來向實體中新增這些關係的)。

  另外,在介紹所有這些CDM中的元素之前,筆者先給出一個很簡單的CDM圖,是對我們最最熟悉的學校場景的一個建模,下文中提到的所有概念在圖中都有體現,大家在看下文的時候可以對照著來看:


一. RelationShip(聯絡)
  先給出PD手冊裡對聯絡的定義:“A relationship is a link between entities. For example, in a CDM that manages human resources, the relationship Member links the entities Employee and Team, because employees can be members of teams. This relationship expresses that each employee works in a team and that each team has employees.” 可見,也許聯絡的概念真的太簡單了吧,所以反而不那麼好表述,所以PD的文件裡也是用一個例子來說明出現了什麼樣的情況我們就認為兩個實體間是有聯絡的。
  當我們提起實體間聯絡的時候,最先想到的恐怕是one to one,one to many 和many to many這三種聯絡型別,這些聯絡型別也是大家最熟悉的。筆者對ER圖原本的概念並不精通,但在CDM中,聯絡還有另外三個可以設定的屬性:mandatory(強制性聯絡), dependent(依賴性聯絡/標定關聯) 和dominant(統制聯絡)。這些屬性對後面PDM的生成都有比較大的影響,需要我們一一有所瞭解。它們都是在聯絡的屬性控制面板中設定的,見下圖:

1.mandatory
  聯絡是否具有強制性,指的是實體間是不是一定會出現這種聯絡;或者換句話說,當我們在談及一個聯絡的應用場景的時候,聯絡對應的那兩個實體型的實體例項的個數可不可能為零。也許這樣的解釋還是有點抽象,讓我們舉兩個聯絡的例子,一個是對兩邊的實體都有強制性的,另一個則不然。
(1)教師--學生 聯絡
  這個聯絡首先是一個多對多聯絡,因為每個老師可以教多個學生,每個學生也都有多個老師來負責他們的學業。同時,這個聯絡對教師和學生都是強制性的,也就是說,不存在任何一個老師,他不負責任何一個學生的教學;也不存在任何一個學生,他沒有任何一個任課老師。
(2)學生--俱樂部 聯絡
  這個聯絡也是一個多對多關係,但它對學生這個實體型而言就不是強制的(Optional,可選的)。每個俱樂部都有至少一個學生參加,但並不是每個學生都要去參加俱樂部的活動。完全可以有一些學生,他們什麼俱樂部都沒參加。
上面的例子主要是從概念的角度來區分了mandatory和optional的區別。實際上如果把這個模型對應到我們最後生成的表,如果A-B間的聯絡對A是mandatory的話,那麼如果在A裡面如果包含B的外來鍵,這個外來鍵不能為空值,反之可以為空值。後面我們談到PDM和實際資料庫的時候,大家會看到這一點。
2.dependent
  每一個Entity型都有自己的Identifier,如果兩個Entity型之間發生關聯時,其中一個Entity型的Identifier進入另一個Entity型並與該 Entity型中的Identifier共同組成其Identifier時,這種關聯稱為標定關聯,也叫依賴性關聯(dependent relationship)。一個Entity型的Identifier進入另一個Entity型後充當其非Identifier時,這種關聯稱為非標定關聯,也叫非依賴關聯。
  概念的定義說起來還是有些拗口,說白了其實就是主-從表關係,從表要依賴於主表。比如在我們系統裡要記錄教師休假的情況,有一個實體型Holiday,其屬性包括休假的開始時間和天數,每次有教師休假的時候,都要在這個表留下記錄。從我們的場景描述中可以看到,實體型假期必須依附於實體型教師,即對於每一個假期例項,必須指向某一個教師例項。
  對於依賴型聯絡,必須注意它不可能是一個多對多聯絡,在這個聯絡中,必須有一個作為主體的實體型。一個dependent聯絡的從實體可以沒有自己的identifier.
3.dominant
  這個聯絡屬性是最為簡單的,它僅作用於一對一聯絡,並指明這種聯絡中的主從表關係。在A,B兩個實體型的聯絡中,如果A-->B被指定為dominant,那麼A為這個一對一聯絡的主表,B為從表,並且在以後生成的PDM中會產生一個引用(如果不指定dominant屬性的話會產生兩個引用)。比如老師和班級之間的聯絡,因為每個班級都有一個老師做班主任,每個老師也最多隻能做一個班級的班主任,所以是一個一對一關係。同時,我們可以將老師作為主表,用老師的工號來唯一確定一個班主任聯絡。

二.Association(關聯)
  先來看一下PD給association的定義:“An association is a connection between entities. In the Merise modeling methodology an association is used to connect several entities that each represents clearly defined objects, but are linked by an event, which may not be so clearly represented by another entity.”。
  在上一小段提到的那些RelationShip,在很多情況下(特別是多對多關係中),我們會把聯絡專門提出來,作為一個實體型放在兩個需要被關聯的實體型中間(在PD中,選中任何一個聯絡,在右鍵的彈出選單中選擇“Change to Entity”命令即可完成聯絡轉實體的操作)。但有的時候,把若干個實體型之間的聯絡抽象為一個實體型可能不太合適,這個時候你可以選擇為這些實體型建立一個association,那麼在生成PDM的時候,所有這些相關實體型的identifier都會被加入到association對應生成的表模型中。所以,說白了,其實association就是實體型的一種特例,用來在建模的時候更確切的表達實體間的關聯資訊。在PD的文件中舉了一個錄音帶、顧客、商店三個實體型在租借錄音帶這個場景上發生關聯,然後把租借定義為上述三個實體型之間的association的例子,非常確切。在我們的學校模型裡,我定義了家訪做為老師和學生實體型中間的一個association,在接下來產生的PDM中大家就可能看到這種定義所產生的效果。

三.Inheritance(繼承)
  這種關係在概念層面是最容易理解的了,本文就不贅述了。

前面已經介紹了CDM中關於實體間關係的主要內容,接下來我們就來看看根據這個CDM所生成的PDM是一個什麼樣子:

上圖中所有標紅的部分是我們最應該關注的內容,因為他們都是由於我們對實體型間的關係的定義而產生的,下面給出一些簡單的說明。
1. “師生關係”和“學生俱樂部”這兩個表是由於我們的多對多關係而產生的。
2. “假期”表的“工號”欄位是由於我們將教師-假期關係指定為dependent而產生的。
3. “班級”表的“工號”欄位是由於我們將教師-班級關係制定為dominant而產生的。
4. “家訪”表中的“工號”和“學號”欄位是由於家訪是教師和學生實體型的association而產生的。
另外,記得我們在提到dominant屬性的時候說過,一個沒指定dominant方向的一對一聯絡將產生兩個引用,下面我們就把原本的CDM中的教師-班級關係進行一個小小的修改,去掉這個relationship的dominant定義,那麼最終產生的PDM中教師表和班級表將互相包含對方的主鍵(由於我們的班級表沒有自己的主鍵,所以只能在班級表中看到多出來的列),截圖如下:

對照這個PDM截圖和上一個PDM截圖之間的區別,大家可以很容易得看出dominant屬性對一個一對一關係的作用。