1. 程式人生 > 其它 >示例講解PostgreSQL表分割槽的三種方式

示例講解PostgreSQL表分割槽的三種方式

我最新最全的文章都在 南瓜慢說 www.pkslow.com ,歡迎大家來喝茶!

1 簡介

表分割槽是解決一些因單表過大引用的效能問題的方式,比如某張表過大就會造成查詢變慢,可能分割槽是一種解決方案。一般建議當單表大小超過記憶體就可以考慮表分割槽了。PostgreSQL的表分割槽有三種方式:

  • Range:範圍分割槽;
  • List:列表分割槽;
  • Hash:雜湊分割槽。

本文通過示例講解如何進行這三種方式的分割槽。

2 例講三種方式

為方便,我們通過Docker的方式啟動一個PostgreSQL,可參考:《Docker啟動PostgreSQL並推薦幾款連線工具》。我們要選擇較高的版本,否則不支援Hash分割槽,命令如下:

docker run -itd \
    --name pkslow-postgres \
    -e POSTGRES_DB=pkslow \
    -e POSTGRES_USER=pkslow \
    -e POSTGRES_PASSWORD=pkslow \
    -p 5432:5432 \
    postgres:13

2.1 Range範圍分割槽

先建立一張錶帶有年齡,然後我們根據年齡分段來進行分割槽,建立表語句如下:

CREATE TABLE pkslow_person_r (
    age int not null,
    city varchar not null
) PARTITION BY RANGE (age);

這個語句已經指定了按age欄位來分割槽了,接著建立分割槽表:

create table pkslow_person_r1 partition of pkslow_person_r for values from (MINVALUE) to (10);
create table pkslow_person_r2 partition of pkslow_person_r for values from (11) to (20);
create table pkslow_person_r3 partition of pkslow_person_r for values from (21) to (30);
create table pkslow_person_r4 partition of pkslow_person_r for values from (31) to (MAXVALUE);

這裡建立了四張分割槽表,分別對應年齡是0到10歲、11到20歲、21到30歲、30歲以上。

接著我們插入一些資料:

insert into pkslow_person_r(age, city) VALUES (1, 'GZ');
insert into pkslow_person_r(age, city) VALUES (2, 'SZ');
insert into pkslow_person_r(age, city) VALUES (21, 'SZ');
insert into pkslow_person_r(age, city) VALUES (13, 'BJ');
insert into pkslow_person_r(age, city) VALUES (43, 'SH');
insert into pkslow_person_r(age, city) VALUES (28, 'HK');

可以看到這裡的表名還是pkslow_person_r,而不是具體的分割槽表,說明對於客戶端是無感知的。

我們查詢也一樣的:

但實際上是有分割槽表存在的:

而且分割槽表與主表的欄位是一致的。

查詢分割槽表,就只能查到那個特定分割槽的資料了:

2.2 List列表分割槽

類似的,列表分割槽是按特定的值來分割槽,比較某個城市的資料放在一個分割槽裡。這裡不再給出每一步的講解,程式碼如下:

-- 建立主表
create table pkslow_person_l (
                          age int not null,
                          city varchar not null
) partition by list (city);

-- 建立分割槽表
CREATE TABLE pkslow_person_l1 PARTITION OF pkslow_person_l FOR VALUES IN ('GZ');
CREATE TABLE pkslow_person_l2 PARTITION OF pkslow_person_l FOR VALUES IN ('BJ');
CREATE TABLE pkslow_person_l3 PARTITION OF pkslow_person_l DEFAULT;

-- 插入測試資料
insert into pkslow_person_l(age, city) VALUES (1, 'GZ');
insert into pkslow_person_l(age, city) VALUES (2, 'SZ');
insert into pkslow_person_l(age, city) VALUES (21, 'SZ');
insert into pkslow_person_l(age, city) VALUES (13, 'BJ');
insert into pkslow_person_l(age, city) VALUES (43, 'SH');
insert into pkslow_person_l(age, city) VALUES (28, 'HK');
insert into pkslow_person_l(age, city) VALUES (28, 'GZ');

當我們查詢第一個分割槽的時候,只有廣州的資料:

2.3 Hash雜湊分割槽

雜湊分割槽是指按欄位取雜湊值後再分割槽。具體的語句如下:

-- 建立主表
create table pkslow_person_h (
                          age int not null,
                          city varchar not null
) partition by hash (city);

-- 建立分割槽表
create table pkslow_person_h1 partition of pkslow_person_h for values with (modulus 4, remainder 0);
create table pkslow_person_h2 partition of pkslow_person_h for values with (modulus 4, remainder 1);
create table pkslow_person_h3 partition of pkslow_person_h for values with (modulus 4, remainder 2);
create table pkslow_person_h4 partition of pkslow_person_h for values with (modulus 4, remainder 3);

-- 插入測試資料
insert into pkslow_person_h(age, city) VALUES (1, 'GZ');
insert into pkslow_person_h(age, city) VALUES (2, 'SZ');
insert into pkslow_person_h(age, city) VALUES (21, 'SZ');
insert into pkslow_person_h(age, city) VALUES (13, 'BJ');
insert into pkslow_person_h(age, city) VALUES (43, 'SH');
insert into pkslow_person_h(age, city) VALUES (28, 'HK');

可以看到建立分割槽表的時候,我們用了取模的方式,所以如果要建立N個分割槽表,就要取N取模。

隨便查詢一張分割槽表如下:

可以看到同是SZ的雜湊值是一樣的,肯定會分在同一個分割槽,而BJ的雜湊值取模後也屬於同一個分割槽。

3 總結

本文講解了PostgreSQL分割槽的三種方式。

程式碼請檢視:https://github.com/LarryDpk/pkslow-samples


歡迎關注微信公眾號<南瓜慢說>,將持續為你更新...

多讀書,多分享;多寫作,多整理。