1. 程式人生 > 實用技巧 >元資料和資料元

元資料和資料元

由於最近在做主資料方面的專案,就去各論壇瞭解了一下有關主資料的姿勢。這次來記錄一下元資料和資料元的區別。

資料元(Data element):又稱資料型別,通過定義、標識、表示以及允許值等一系列屬性描述的資料單元。在特定的語義環境中被認為是不可再分的最小資料單元。

這個照我的理解啊,應該就是欄位了。沒毛病。

元資料是關於資料的組織、資料域及其關係的資訊,簡言之,元資料就是關於資料的資料。

列舉:

資料結構:資料集的名稱、關係、欄位、約束等;資料集就暫且理解為一張表,(名稱、關係、欄位、約束,可以理解為表的欄位、外來鍵關係和索引)
資料部署:資料集的物理位置;就暫且理解為儲存在磁碟上的物理路徑吧...


資料流:資料集之間的流程依賴關係(非參照依賴),包括資料集到另一個數據集的規則;
質量度量:資料集上可以計算的度量;
度量邏輯關係:資料集度量之間的邏輯運算關係;
ETL過程:過程執行的順序,並行、序列;
資料集快照:一個時間點上,資料在所有資料集上的分佈情況;
星型模式元資料:事實表、維度、屬性、層次等;
報表語義層:報表指標的規則、過濾條件物理名稱和業務名稱的對應;
資料訪問日誌:哪些資料何時被何人訪問;
質量稽核日誌:何時、何度量被稽核,其結果;
資料裝載日誌:哪些資料何時被何人裝載;

就上面這些東西在百科上找的,寫的比較抽象。以後在用的時候也許就能理解關於資料的資料這句話的含義了。


資料元一般來說由三部分組成:

a)物件類:思想、概念或真實世界中的事物的集合,它們具有清晰的邊界和含義,其特徵和行為遵循同樣的規則。
b)特性:物件類中的所有成員共同具有的一個有別於其它的、顯著的特徵。
c)表示:它描述了資料被表達的方式。
元資料(Metadata)是描述其它資料的資料(data about other data),或者說是用於提供某種資源的有關資訊的結構資料(structured data)。元資料是描述資訊資源或資料等物件的資料,其使用目的在於:識別資源;評價資源;追蹤資源在使用過程中的變化;實現簡單高效地管理大量網路化資料;實現資訊資源的有效發現、查詢、一體化組織和對使用資源的有效管理。
元資料的基本特點主要有:
a)元資料一經建立,便可共享。元資料的結構和完整性依賴於資訊資源的價值和使用環境;元資料的開發與利用環境往往是一個變化的分散式環境;任何一種格式都不可能完全滿足不同團體的不同需要;
b)元資料首先是一種編碼體系。元資料是用來描述數字化資訊資源,特別是網路資訊資源的編碼體系,這導致了元資料和傳統資料編碼體系的根本區別;元資料的最為重要的特徵和功能是為數字化資訊資源建立一種機器可理解框架。 元資料體系構建了電子政務的邏輯框架和基本模型,從而決定了電子政務的功能特徵、執行模式和系統執行的總體效能。電子政務的運作都基於元資料來實現。其主要作用有:描述功能、整合功能、控制功能和代理功能。 由於元資料也是資料,因此可以用類似資料的方法在資料庫中進行儲存和獲取。如果提供資料元的組織同時提供描述資料元的元資料,將會使資料元的使用變得準確而高效。使用者在使用資料時可以首先檢視其元資料以便能夠獲取自己所需的資訊。
摘自《GB/T 19488.1 電子政務資料元第1部分:設計和管理規範》

再說說兩者的區別吧

資料元是用來裝載資料的一個數據單元(欄位)。
元資料是用來描述資料的資料,包括資料元。