1. 程式人生 > >資料庫-Oracle中聚簇表的使用

資料庫-Oracle中聚簇表的使用

                       OracleCluster Table的使用

大家通常oracle中的cluster的理解是不準確的,經常和sql server中的cluster index混淆。Cluster是儲存一組table的一種方法,這些table共享同一資料塊中的某些相同column,並把不同table在這一共享column上值相同的data row儲存到同一block上。在sql server中的cluster index強制行根據index key按儲存順序儲存,這一點和oracle中的IOT類似。   

從下圖中我們可以清楚的看到cluster 和非cluster

的一組table的物理儲存的區別。在cluster中,單個block上的資料可能來自多個table,概念上可以儲存預連線的資料。單個table也可以使用cluster,即根據某些column按組儲存資料。如圖中,所有部門ID20110的部門資訊和員工資訊的資料都將儲存在同一block。注意,這裡儲存的並不是排序的資料(那是IOT的任務),儲存的是按部門ID分組集合的資料,是以heap的方式儲存的。因此,部門20剛好和部門110相鄰,而部門99和部門100相距很遠(硬碟的物理位置)。

當單個block放不下時,額外的block將連結到最初的block,來包容溢位的資料,這種方式和在IOT中溢位

block非常相似。

現在我們看看如何建立一個cluster。在cluster中建立一系列table是很簡單的,物件儲存定義如PCTFREEPCTUSEDINITIAL都是和cluster相關的,而不是和table相關。這是因為在cluster中儲存了若干table,每個table在同一個block中擁有不同的PCTFREE沒有意義。

SQL> create cluster e_d_cluster

  2  (deptid number(2))

  3  size 1024

  4  /

Cluster created

這裡首先建立了一個index cluster。這個cluster

keydeptid,在table中這個列可以不命名為deptid,但資料型別number2)必須匹配。Size選項是用來告訴oracle預計有1024

位元組資料和每個cluser key相關。Oracle將使用這個資訊來計算每個block能容納的最大cluster key數目。因此size太高,在每一block將得到很少的key,並且將使用比需要的更多的空間;設定容量太低,將得到過多的資料連線,這將偏離使用cluster的目的。Sizecluster的重要引數。

現在我們來建立cluster index。在把資料放入之前,需要索引clusterCluster index的作用是儲存一個cluster key,並且返回包含該keyblock的地址。

SQL> create index e_d_cluster_idx

  2  on cluster e_d_cluster

  3  /

Index created

Cluster key index可以使用index所有的正常的儲存引數,並且可以位於另一個tablespace。它是一個正常的index,能夠索引到一個cluster,並且也包含一個完全null的條目。

我們在cluster中建立table

SQL> create table department

  2  (deptid number(2) primary key,

  3  dname varchar2(14),

  4  loc varchar2(13))

  5  cluster e_d_cluster(deptid);

Table created

SQL> create table employee

  2  (empid number primary key,

  3  ename varchar2(10),

  4  job varchar2(10),

  5  mgr  number,

  6  hiredate date,

  7  sal number,

  8  comm number,

  9  deptid number(2) references department(deptid))

 10  cluster e_d_cluster(deptid);

Table created

這裡建立table與普通的table唯一的區別就是使用了cluster關鍵字,我們往table中裝載資料:

SQL> begin

  2    for x in(select * from scott.dept)

  3    loop

  4      insert into department

  5      values(x.deptno,x.dname,x.loc);

  6      insert into employee

  7      select * from scott.emp

  8      where deptno = x.deptno;

  9    end loop;

 10  end;

 11  /

PL/SQL procedure successfully completed

 我們可以看到目前table中裝載瞭如下資料:

SQL> select * from department;

DEPTID DNAME          LOC

------ -------------- -------------

    10 ACCOUNTING     NEW YORK

    20 RESEARCH       DALLAS

    30 SALES          CHICAGO

40 OPERATIONS     BOSTON

SQL> select * from employee;

     EMPID ENAME      JOB            MGR HIREDATE           SAL     COMM  DEPTID

---------- ---------- ---------- ---------- ----------- ---------- ---------- ------

      7782 CLARK      MANAGER        7839 1981-6-9          2450                10

      7839 KING       PRESIDENT             1981-11-17        5000                10

      7934 MILLER     CLERK            7782 1982-1-23         1300                10

      7369 SMITH      CLERK            7902 1980-12-17         800                20

      7566 JONES      MANAGER          7839 1981-4-2          2975                20

      7788 SCOTT      ANALYST          7566 1982-12-9         3000                20

      7876 ADAMS      CLERK            7788 1983-1-12         1100                20

      7902 FORD       ANALYST          7566 1981-12-3         3000                20

      7499 ALLEN      SALESMAN         7698 1981-2-20         1600        300     30

      7521 WARD       SALESMAN         7698 1981-2-22         1250        500     30

      7654 MARTIN     SALESMAN         7698 1981-9-28         1250       1400     30

      7698 BLAKE      MANAGER          7839 1981-5-1          2850                30

      7844 TURNER     SALESMAN         7698 1981-9-8          1500          0     30

      7900 JAMES      CLERK            7698 1981-12-3          950                30

現在我們看看這兩個table資料儲存的位置:

SQL> select dbms_rowid.rowid_block_number(department.rowid) dept_rid,

  2  dbms_rowid.rowid_block_number(employee.rowid) emp_rid,department.deptid

  3  from department,employee

  4  where employee.deptid = department.deptid;

  DEPT_RID    EMP_RID DEPTID

---------- ---------- ------

      5587       5587     10

      5587       5587     10

      5587       5587     10

      5587       5587     20

      5587       5587     20

      5587       5587     20

      5587       5587     20

      5587       5587     20

      5587       5587     30

      5587       5587     30

      5587       5587     30

      5587       5587     30

      5587       5587     30

      5587       5587     30

可以看到部門ID相同的資料儲存在一個block上。我們為什麼推薦上述方法對cluster進行最初的裝載呢?這樣能夠保證如果有些cluster key的相關資料超過了size,仍能使大部分資料聚集在一個block上。這隻適用於最初的資料裝載,在這以後,可以使用事務對cluster中的table insert資料。

    由於cluster中的特殊的資料儲存方式,出現了這樣一個問題,rowid出現了重複,現在rowid只能在一個table中唯一標識一行資料了(另一種rowid重複出現在transport tablespace的操作後)。

SQL> select rowid from department

  2  intersect

  3  select rowid from employee;

ROWID

------------------

AAAGWQAADAAABXTAAA

AAAGWQAADAAABXTAAB

AAAGWQAADAAABXTAAC

AAAGWQAADAAABXTAAD

我們還發現,重複的rowid的數量和主表中的記錄數一樣,即和cluster中的記錄數一樣。我們把這個blick dump出來,看看是什麼原因:

SQL> alter system dump datafile 3 block 5587;

System altered

Dump file D:\database\oracle\admin\ora817\udump\ORA02628.TRC
Wed Dec 31 12:31:10 2003
ORACLE V8.1.7.4.1 - Production vsnsta=0
vsnsql=f vsnxtr=3
Windows 2000 Version 5.0 Service Pack 4, CPU type 586
Oracle8i Enterprise Edition Release 8.1.7.4.1 - Production
With the Partitioning option
JServer Release 8.1.7.4.1 - Production
Windows 2000 Version 5.0 Service Pack 4, CPU type 586
Instance name: ora817

Redo thread mounted by this instance: 1

Oracle process number: 17

Windows thread id: 2628, image: ORACLE.EXE


*** SESSION ID:(17.1471) 2003-12-31 12:31:10.159
Start dump data blocks tsn: 2 file#: 3 minblk 4275 maxblk 4275
buffer tsn: 2 rdba: 0x00c010b3 (3/4275)
scn: 0x0000.00142980 seq: 0x01 flg: 0x02 tail: 0x29800601
frmt: 0x02 chkval: 0x0000 type: 0x06=trans data
 
Block header dump:  0x00c010b3
 Object id on Block? Y
 seg/obj: 0x657d  csc: 0x00.14297c  itc: 2  flg: O  typ: 1 - DATA
     fsl: 0  fnx: 0x0 ver: 0x01
 
 Itl           Xid                  Uba         Flag  Lck        Scn/Fsc
0x01   xid:  0x0003.029.000002d2    uba: 0x00800466.006e.35 
C---0  scn 0x0000.0014297c   ---1.這兩個transactionflag lck是什麼意思?
0x02   xid:  0x0003.023.000002d2    uba: 0x00800467.006e.37  --U-   18  fsc 0x0000.00142980   
 
data_block_dump
===============
tsiz: 0x1fa0
hsiz: 0x46
pbl: 0x11ab745c
bdba: 0x00c010b3
flag=------K----
ntab=3                           --這是代表5587block上有3table             

e_d_cluster,department,employee

nrow=22
frre=-1
fsbo=0x46
fseo=0x1ce3
avsp=0x1c9d
tosp=0x1c9d
0xe:pti[0] nrow=4 offs=0              --這是3table的行數及開始的偏移量
0x12:pti[1] nrow=4 offs=4
0x16:pti[2] nrow=14 offs=8
0x1a:pri[0] offs=0x1f8a              
0x1c:pri[1] offs=0x1eef
0x1e:pri[2] offs=0x1e10
0x20:pri[3] offs=0x1cf9
0x22:pri[4] offs=0x1f72
0x24:pri[5] offs=0x1edb
0x26:pri[6] offs=0x1dfe
0x28:pri[7] offs=0x1ce3
0x2a:pri[8] offs=0x1f4c
0x2c:pri[9] offs=0x1f29
0x2e:pri[10] offs=0x1f05
0x30:pri[11] offs=0x1eb8
0x32:pri[12] offs=0x1e92
0x34:pri[13] offs=0x1e6d
0x36:pri[14] offs=0x1e4a
0x38:pri[15] offs=0x1e26
0x3a:pri[16] offs=0x1dd5
0x3c:pri[17] offs=0x1dac
0x3e:pri[18] offs=0x1d81
0x40:pri[19] offs=0x1d5b
0x42:pri[20] offs=0x1d32
0x44:pri[21] offs=0x1d0f
block_row_dump:
tab 0, row 0, @0x1f8a                                         --從這開始是emp_dept_cluster
tl: 22 fb: K-H-FL-- lb: 0x0 cc: 1
curc: 4 comc: 4 pk: 0x00c010b3.0 nk: 0x00c010b3.0
col  0: [ 2]  c1 0b
tab 0, row 1, @0x1eef
tl: 22 fb: K-H-FL-- lb: 0x0 cc: 1
curc: 6 comc: 6 pk: 0x00c010b3.1 nk: 0x00c010b3.1
col  0: [ 2]  c1 15
tab 0, row 2, @0x1e10
tl: 22 fb: K-H-FL-- lb: 0x0 cc: 1
curc: 7 comc: 7 pk: 0x00c010b3.2 nk: 0x00c010b3.2
col  0: [ 2]  c1 1f
tab 0, row 3, @0x1cf9
tl: 22 fb: K-H-FL-- lb: 0x0 cc: 1
curc: 1 comc: 1 pk: 0x00c010b3.3 nk: 0x00c010b3.3
col  0: [ 2]  c1 29
tab 1, row 0, @0x1f72                                         --從這開始是department
tl: 24 fb: -CH-FL-- lb: 0x2 cc: 2 cki: 0
col  0: [10]  41 43 43 4f 55 4e 54 49 4e 47
col  1: [ 8]  4e 45 57 20 59 4f 52 4b
tab 1, row 1, @0x1edb
tl: 20 fb: -CH-FL-- lb: 0x2 cc: 2 cki: 1
col  0: [ 8]  52 45 53 45 41 52 43 48
col  1: [ 6]  44 41 4c 4c 41 53
tab 1, row 2, @0x1dfe
tl: 18 fb: -CH-FL-- lb: 0x2 cc: 2 cki: 2
col  0: [ 5]  53 41 4c 45 53
col  1: [ 7]  43 48 49 43 41 47 4f
tab 1, row 3, @0x1ce3
tl: 22 fb: -CH-FL-- lb: 0x2 cc: 2 cki: 3
col  0: [10]  4f 50 45 52 41 54 49 4f 4e 53
col  1: [ 6]  42 4f 53 54 4f 4e
tab 2, row 0, @0x1f4c                                 --2從這開始是employee,因為department

                                          employee都從row 0開始,所以rowid會出現重複

tl: 38 fb: -CH-FL-- lb: 0x2 cc: 6 cki: 0                  --3.這為什麼有tran的資訊?

 col  0: [ 3]  c2 4e 53
col  1: [ 5]  43 4c 41 52 4b
col  2: [ 7]  4d 41 4e 41 47 45 52
col  3: [ 3]  c2 4f 28
col  4: [ 7]  77 b5 06 09 01 01 01
col  5: [ 3]  c2 19 33
tab 2, row 1, @0x1f29
tl: 35 fb: -CH-FL-- lb: 0x2 cc: 6 cki: 0
col  0: [ 3]  c2 4f 28
col  1: [ 4]  4b 49 4e 47
col  2: [ 9]  50 52 45 53 49 44 45 4e 54
col  3: *NULL*
col  4: [ 7]  77 b5 0b 11 01 01 01
col  5: [ 2]  c2 33
tab 2, row 2, @0x1f05
tl: 36 fb: -CH-FL-- lb: 0x2 cc: 6 cki: 0
col  0: [ 3]  c2 50 23
col  1: [ 6]  4d 49 4c 4c 45 52
col  2: [ 5]  43 4c 45 52 4b
col  3: [ 3]  c2 4e 53
col  4: [ 7]  77 b6 01 17 01 01 01
col  5: [ 2]  c2 0e
tab 2, row 3, @0x1eb8
tl: 35 fb: -CH-FL-- lb: 0x2 cc: 6 cki: 1
col  0: [ 3]  c2 4a 46
col  1: [ 5]  53 4d 49 54 48
col  2: [ 5]  43 4c 45 52 4b
col  3: [ 3]  c2 50 03
col  4: [ 7]  77 b4 0c 11 01 01 01
col  5: [ 2]  c2 09
tab 2, row 4, @0x1e92
tl: 38 fb: -CH-FL-- lb: 0x2 cc: 6 cki: 1
col  0: [ 3]  c2 4c 43
col  1: [ 5]  4a 4f 4e 45 53
col  2: [ 7]  4d 41 4e 41 47 45 52
col  3: [ 3]  c2 4f 28
col  4: [ 7]  77 b5 04 02 01 01 01
col  5: [ 3]  c2 1e 4c
tab 2, row 5, @0x1e6d
tl: 37 fb: -CH-FL-- lb: 0x2 cc: 6 cki: 1
col  0: [ 3]  c2 4e 59
col  1: [ 5]  53 43 4f 54 54
col  2: [ 7]  41 4e 41 4c 59 53 54
col  3: [ 3]  c2 4c 43
col  4: [ 7]  77 b6 0c 09 01 01 01
col  5: [ 2]  c2 1f
tab 2, row 6, @0x1e4a
tl: 35 fb: -CH-FL-- lb: 0x2 cc: 6 cki: 1
col  0: [ 3]  c2 4f 4d
col  1: [ 5]  41 44 41 4d 53
col  2: [ 5]  43 4c 45 52 4b
col  3: [ 3]  c2 4e 59
col  4: [ 7]  77 b7 01 0c 01 01 01
col  5: [ 2]  c2 0c
tab 2, row 7, @0x1e26
tl: 36 fb: -CH-FL-- lb: 0x2 cc: 6 cki: 1
col  0: [ 3]  c2 50 03                                      

col  1: [ 4]  46 4f 52 44
col  2: [ 7]  41 4e 41 4c 59 53 54
col  3: [ 3]  c2 4c 43
col  4: [ 7]  77 b5 0c 03 01 01 01
col  5: [ 2]  c2 1f
tab 2, row 8, @0x1dd5
tl: 41 fb: -CH-FL-- lb: 0x2 cc: 7 cki: 2
col  0: [ 3]  c2 4b 64                                     
col  1: [ 5]  41 4c 4c 45 4e
col  2: [ 8]  53 41 4c 45 53 4d 41 4e
col  3: [ 3]  c2 4d 63
col  4: [ 7]  77 b5 02 14 01 01 01
col  5: [ 2]  c2 11
col  6: [ 2]  c2 04
tab 2, row 9, @0x1dac
tl: 41 fb: -CH-FL-- lb: 0x2 cc: 7 cki: 2
col  0: [ 3]  c2 4c 16
col  1: [ 4]  57 41 52 44
col  2: [ 8]  53 41 4c 45 53 4d 41 4e
col  3: [ 3]  c2 4d 63
col  4: [ 7]  77 b5 02 16 01 01 01
col  5: [ 3]  c2 0d 33
col  6: [ 2]  c2 06
tab 2, row 10, @0x1d81
tl: 43 fb: -CH-FL-- lb: 0x2 cc: 7 cki: 2
col  0: [ 3]  c2 4d 37
col  1: [ 6]  4d 41 52 54 49 4e
col  2: [ 8]  53 41 4c 45 53 4d 41 4e
col  3: [ 3]  c2 4d 63
col  4: [ 7]  77 b5 09 1c 01 01 01
col  5: [ 3]  c2 0d 33
col  6: [ 2]  c2 0f
tab 2, row 11, @0x1d5b
tl: 38 fb: -CH-FL-- lb: 0x2 cc: 6 cki: 2
col  0: [ 3]  c2 4d 63
col  1: [ 5]  42 4c 41 4b 45
col  2: [ 7]  4d 41 4e 41 47 45 52
col  3: [ 3]  c2 4f 28
col  4: [ 7]  77 b5 05 01 01 01 01
col  5: [ 3]  c2 1d 33
tab 2, row 12, @0x1d32
tl: 41 fb: -CH-FL-- lb: 0x2 cc: 7 cki: 2
col  0: [ 3]  c2 4f 2d
col  1: [ 6]  54 55 52 4e 45 52
col  2: [ 8]  53 41 4c 45 53 4d 41 4e
col  3: [ 3]  c2 4d 63
col  4: [ 7]  77 b5 09 08 01 01 01
col  5: [ 2]  c2 10
col  6: [ 1]  80
tab 2, row 13, @0x1d0f
tl: 35 fb: -CH-FL-- lb: 0x2 cc: 6 cki: 2
col  0: [ 2]  c2 50
col  1: [ 5]  4a 41 4d 45 53
col  2: [ 5]  43 4c 45 52 4b
col  3: [ 3]  c2 4d 63
col  4: [ 7]  77 b5 0c 03 01 01 01
col  5: [ 3]  c2 0a 33
end_of_block_dump
End dump data blocks tsn: 2 file#: 3 minblk 5587 maxblk 5587

現在我們來說明這個block中的幾個問題:

1.這兩個transactionflag lck是什麼意思?

這裡是blockITL的資訊,這裡初始有兩個事務,事務槽在block有空間時是可以擴充套件的。

falg  ------ 依次4個位置是   CBUT
 C 
表示該 ITL 事務已經提交

B: 當讀到這個ITL 的時候該block需要 rollback (一致讀)導致ITL 來自 rollback segment,也就是說該ITL事務被提交過多次了需要追述到最早的部分
U   表示該ITL 事務已經提交,但是提交的SCNoracle 在資料有效性的基礎上出來的,可能並不是真實的 commit  scn ,這個SCN就是 scn/fsc  . 
T : 
事務提交後ITL涉及到的資料行上的 lock資訊也就是 lb ,在下次dml操作到該塊資料的時候,lb 會清零,表示清除lock(當然即使沒有清除該ITL若已經提交也認為鎖不存在),在這個清理的過程中相應flag位置會設定為 T

lck  表示該 itl 在該block上影響到的行數

2.為什麼rowid會出現重複?

   我們想知道rowid為什麼會重複,首先要明白rowid的含義。ROWID 在磁碟上需要10 個位元組的儲存空間並使用18 個字元來顯示它包含下列元件

  • 資料物件編號每個資料物件如表或索引在建立時都分配有此編號,並且此編號在資料庫中是唯一的;
  • 相關檔案編號此編號對於一個表空間中的每個檔案是唯一的;
  • 塊編號表示包含此行的塊在檔案中的位置;
  • 行編號標識塊頭中行目錄位置的位置;

在內部資料物件編號需要32 位,相關檔案編號需要10 位,塊編號需要22,位行編號需要16 位,加起來總共是80 位或10 個位元組,ROWID 使用以64 為基數的編碼方案來顯示該方案將六個位置用於資料物件,編號三個位置用於相關檔案編號六個位置用於塊編號三個位置用於行編號以64 為基數的編碼方案使用字元A-Z a-z 0-9 + 和/共64 個字元如下例所示

AAAGWQ AAD AAABXT AAA

在本例中

AAAGWQ 是資料物件編號

AAD    是相關檔案編號

AAABXT 是塊編號

AAA    是行編號

在block 5587中delparment和employee中行編號都是從0開始,檔案編號和塊編號相同,我們再來看一下資料物件編號:

SQL> select OBJECT_NAME,OBJECT_ID ,DATA_OBJECT_ID from user_objects

  2  where OBJECT_NAME in ('DEPARTMENT','EMPLOYEE','E_D_CLUSTER');

OBJECT_NAME               OBJECT_ID        DATA_OBJECT_ID

-------------------------------------------------------------------------------- ---------- 

E_D_CLUSTER               26000             26000

EMPLOYEE                  26004             26000

DEPARTMENT                26002             26000

從這裡能看出物件編號雖然不一樣,但在一個cluster中資料物件編號是一樣的。既然構成rowid的元件都是一樣的,那麼rowid自然是相同的。

3.這為什麼有tran的資訊?

tl: 38 fb: -CH-FL-- lb: 0x2 cc: 6 cki: 0

lb: 0x2 表示改行上有事務0x02,這就是oracle的行鎖,如果該行上沒有事務,lb: 0x0,即沒有鎖。但這行資料是否有鎖還倚賴於該事務是不是活動的,這裡雖然lb: 0x2 ,但我們在ITL中可以看到事務0x02狀態為--U-,表示事務已經提交,即非活動事務,所以這行資料上並沒有鎖。