MySQL 使用自增ID主鍵和UUID 作為主鍵的優劣比較具體過程（從百萬到千萬表記錄測試）

阿新 • • 發佈：2018-02-04

popu tis pack 方案表數據 lock 進行 args ios

測試緣由

一個開發同事做了一個框架。裏面主鍵是uuid。我跟他建議說mysql不要用uuid用自增主鍵，自增主鍵效率高，他說不一定高，我說innodb的索引特性導致了自增id做主鍵是效率最好的，為了拿實際的案例來說服他，所以準備做一個具體的測試。

作為互聯網公司，一定實用戶表，並且用戶表UC_USER基本會有百萬記錄，所以在這個表基礎上準測試數據來進行測試。

???????? 測試過程是眼下我想到的多方位的經常使用的幾種類型的sql進行測試。當然可能不太完好。歡迎大家留言提出更加完好的測試方案或者測試sql語句。

1、準備表以及數據

UC_USER，自增ID為主鍵，表結構相似例如以下：

CREATE?TABLE?`UC_USER`?(
??`ID`?bigint(20)?NOT?NULL?AUTO_INCREMENT?COMMENT?‘主鍵‘,
??`USER_NAME`?varchar(100)?DEFAULT?NULL?COMMENT?‘username‘,
??`USER_PWD`?varchar(200)?DEFAULT?NULL?COMMENT?‘password‘,
??`BIRTHDAY`?datetime?DEFAULT?NULL?COMMENT?‘生日‘,
??`NAME`?varchar(200)?DEFAULT?NULL?COMMENT?‘姓名‘,
??`USER_ICON`?varchar(500)?DEFAULT?NULL?COMMENT?‘頭像圖片‘,

??`SEX`?char(1)?DEFAULT?NULL?COMMENT?‘性別,?1:男，2:女。3：保密‘,
??`NICKNAME`?varchar(200)?DEFAULT?NULL?COMMENT?‘昵稱‘,
??`STAT`?varchar(10)?DEFAULT?NULL?COMMENT?‘用戶狀態。01:正常，02:凍結‘,
??`USER_MALL`?bigint(20)?DEFAULT?NULL?COMMENT?‘當前所屬MALL‘,
??`LAST_LOGIN_DATE`?datetime?DEFAULT?NULL?COMMENT?‘最後登錄時間‘,
??`LAST_LOGIN_IP`?varchar(100)?DEFAULT?NULL?COMMENT?‘最後登錄IP‘,

??`SRC_OPEN_USER_ID`?bigint(20)?DEFAULT?NULL?COMMENT?‘來源的聯合登錄‘,
??`EMAIL`?varchar(200)?DEFAULT?NULL?COMMENT?‘郵箱‘,
??`MOBILE`?varchar(50)?DEFAULT?NULL?COMMENT?‘手機‘,
??`IS_DEL`?char(1)?DEFAULT?‘0‘?COMMENT?‘是否刪除‘,
??`IS_EMAIL_CONFIRMED`?char(1)?DEFAULT?‘0‘?COMMENT?‘是否綁定郵箱‘,
??`IS_PHONE_CONFIRMED`?char(1)?DEFAULT?‘0‘?COMMENT?‘是否綁定手機‘,
??`CREATER`?bigint(20)?DEFAULT?NULL?COMMENT?‘創建人‘,
??`CREATE_DATE`?datetime?DEFAULT?CURRENT_TIMESTAMP?COMMENT?‘註冊時間‘,
??`UPDATE_DATE`?datetime?DEFAULT?CURRENT_TIMESTAMP?COMMENT?‘改動日期‘,
??`PWD_INTENSITY`?char(1)?DEFAULT?NULL?COMMENT?‘password強度‘,
??`MOBILE_TGC`?char(64)?DEFAULT?NULL?COMMENT?‘手機登錄標識‘,
??`MAC`?char(64)?DEFAULT?NULL?COMMENT?‘mac地址‘,
??`SOURCE`?char(1)?DEFAULT?‘0‘?COMMENT?‘1:WEB,2:IOS,3:ANDROID,4:WIFI,5:管理系統,?0:未知‘,
??`ACTIVATE`?char(1)?DEFAULT?‘1‘?COMMENT?‘激活，1：激活。0：未激活‘,
??`ACTIVATE_TYPE`?char(1)?DEFAULT?‘0‘?COMMENT?‘激活類型，0：自己主動，1：手動‘,
??PRIMARY?KEY?(`ID`),
??UNIQUE?KEY?`USER_NAME`?(`USER_NAME`),
??KEY?`MOBILE`?(`MOBILE`),
??KEY?`IDX_MOBILE_TGC`?(`MOBILE_TGC`,`ID`),
??KEY?`IDX_EMAIL`?(`EMAIL`,`ID`),
??KEY?`IDX_CREATE_DATE`?(`CREATE_DATE`,`ID`),
??KEY?`IDX_UPDATE_DATE`?(`UPDATE_DATE`)
)?ENGINE=InnoDB?AUTO_INCREMENT=7122681?DEFAULT?CHARSET=utf8?COMMENT=‘用戶表‘

UC_USER_PK_VARCHAR表，字符串ID為主鍵，採用uuid

CREATE?TABLE?`UC_USER_PK_VARCHAR_1`?(
??`ID`?varchar(36)?CHARACTER?SET?utf8mb4?NOT?NULL?DEFAULT?‘0‘?COMMENT?‘主鍵‘,
??`USER_NAME`?varchar(100)?DEFAULT?NULL?COMMENT?‘username‘,
??`USER_PWD`?varchar(200)?DEFAULT?NULL?COMMENT?‘password‘,
??`BIRTHDAY`?datetime?DEFAULT?NULL?COMMENT?‘生日‘,
??`NAME`?varchar(200)?DEFAULT?NULL?COMMENT?‘姓名‘,
??`USER_ICON`?varchar(500)?DEFAULT?NULL?COMMENT?‘頭像圖片‘,
??`SEX`?char(1)?DEFAULT?NULL?COMMENT?‘性別,?1:男，2:女。3：保密‘,
??`NICKNAME`?varchar(200)?DEFAULT?NULL?COMMENT?‘昵稱‘,
??`STAT`?varchar(10)?DEFAULT?NULL?COMMENT?‘用戶狀態。01:正常。02:凍結‘,
??`USER_MALL`?bigint(20)?DEFAULT?NULL?COMMENT?‘當前所屬MALL‘,
??`LAST_LOGIN_DATE`?datetime?DEFAULT?NULL?COMMENT?‘最後登錄時間‘,
??`LAST_LOGIN_IP`?varchar(100)?DEFAULT?NULL?COMMENT?‘最後登錄IP‘,
??`SRC_OPEN_USER_ID`?bigint(20)?DEFAULT?NULL?COMMENT?‘來源的聯合登錄‘,
??`EMAIL`?varchar(200)?DEFAULT?NULL?COMMENT?‘郵箱‘,
??`MOBILE`?varchar(50)?DEFAULT?NULL?COMMENT?‘手機‘,
??`IS_DEL`?char(1)?DEFAULT?‘0‘?COMMENT?‘是否刪除‘,
??`IS_EMAIL_CONFIRMED`?char(1)?DEFAULT?‘0‘?COMMENT?‘是否綁定郵箱‘,
??`IS_PHONE_CONFIRMED`?char(1)?DEFAULT?‘0‘?COMMENT?‘是否綁定手機‘,
??`CREATER`?bigint(20)?DEFAULT?NULL?COMMENT?‘創建人‘,
??`CREATE_DATE`?datetime?DEFAULT?CURRENT_TIMESTAMP?COMMENT?‘註冊時間‘,
??`UPDATE_DATE`?datetime?DEFAULT?CURRENT_TIMESTAMP?COMMENT?‘改動日期‘,
??`PWD_INTENSITY`?char(1)?DEFAULT?NULL?COMMENT?‘password強度‘,
??`MOBILE_TGC`?char(64)?DEFAULT?NULL?COMMENT?‘手機登錄標識‘,
??`MAC`?char(64)?DEFAULT?NULL?COMMENT?‘mac地址‘,
??`SOURCE`?char(1)?DEFAULT?‘0‘?COMMENT?‘1:WEB,2:IOS,3:ANDROID,4:WIFI,5:管理系統,?0:未知‘,
??`ACTIVATE`?char(1)?DEFAULT?‘1‘?COMMENT?‘激活，1：激活，0：未激活‘,
??`ACTIVATE_TYPE`?char(1)?DEFAULT?‘0‘?COMMENT?‘激活類型，0：自己主動。1：手動‘,
??PRIMARY?KEY?(`ID`),
??UNIQUE?KEY?`USER_NAME`?(`USER_NAME`),
??KEY?`MOBILE`?(`MOBILE`),
??KEY?`IDX_MOBILE_TGC`?(`MOBILE_TGC`,`ID`),
??KEY?`IDX_EMAIL`?(`EMAIL`,`ID`),
??KEY?`IDX_CREATE_DATE`?(`CREATE_DATE`,`ID`),
??KEY?`IDX_UPDATE_DATE`?(`UPDATE_DATE`)
)?ENGINE=InnoDB?DEFAULT?CHARSET=utf8?COMMENT=‘用戶表‘;

2、500W數據測試

2.1 錄入500W數據。自增ID節省一半磁盤空間

確定兩個表數據量

# 自增id為主鍵的表

mysql> select count(1) from UC_USER;

+----------+

| count(1) |

+----------+

|? 5720112 |

+----------+

1 row in set (0.00 sec)

mysql>

# uuid為主鍵的表

mysql> select count(1) from UC_USER_PK_VARCHAR_1;

+----------+

| count(1) |

+----------+

|? 5720112 |

+----------+

1 row in set (1.91 sec)

占領的空間容量來看，自增ID比UUID小一半左右。

主鍵類型	數據文件大小	占領容量
自增ID	-rw-rw---- 1 mysql mysql 2.5G Aug 11 18:29 UC_USER.ibd	2.5 G
UUID	-rw-rw---- 1 mysql mysql 5.4G Aug 15 15:11 UC_USER_PK_VARCHAR_1.ibd	5.4 G

2.2 單個數據走索引查詢，自增id和uuid相差不大

主鍵類型	SQL語句	運行時間 (秒)
自增ID	SELECT SQL_NO_CACHE t.* FROM test.`UC_USER` t WHERE t.`MOBILE` =‘14782121512‘;	0.118
?	?	?
UUID	SELECT SQL_NO_CACHE t.* FROM test.`UC_USER_PK_VARCHAR_1` t WHERE t.`MOBILE` =‘14782121512‘;	0.117
?	?	?
自增ID	SELECT SQL_NO_CACHE t.* FROM test.`UC_USER` t WHERE t.`MOBILE` IN( ‘14782121512‘,‘13761460105‘);	0.049
UUID	SELECT SQL_NO_CACHE t.* FROM test.`UC_USER_PK_VARCHAR_1` t WHERE t.`MOBILE` IN(‘14782121512‘,‘13761460105‘);	0.040
?	?	?
自增ID	SELECT SQL_NO_CACHE t.* FROM test.`UC_USER` t WHERE t.`CREATE_DATE`=‘2013-11-24 10:26:36‘ ;	0.139
UUID	SELECT SQL_NO_CACHE t.* FROM test.`UC_USER_PK_VARCHAR_1` t WHERE t.`CREATE_DATE`=‘2013-11-24 10:26:43‘ ;	0.126

2.3 範圍like查詢，自增ID性能優於UUID

主鍵類型	SQL語句	運行時間 (秒)
? （1）模糊範圍查詢1000條數據，自增ID性能要好於UUID
自增ID	SELECT SQL_NO_CACHE t.* FROM test.`UC_USER` t WHERE t.`MOBILE` LIKE ‘147%‘ LIMIT 1000;	1.784
UUID	SELECT SQL_NO_CACHE t.* FROM test.`UC_USER_PK_VARCHAR_1` t WHERE t.`MOBILE` LIKE ‘147%‘ LIMIT 1000;	3.196
? （2）日期範圍查詢20條數據，自增ID略微弱於UUID
自增ID	SELECT SQL_NO_CACHE t.* FROM test.`UC_USER` t WHERE t.`CREATE_DATE` > ‘2016-08-01 10:26:36‘ ORDER BY t.`UPDATE_DATE` DESC LIMIT 20;	0.601
UUID	SELECT SQL_NO_CACHE t.* FROM test.`UC_USER_PK_VARCHAR_1` t WHERE t.`CREATE_DATE` > ‘2016-08-01 10:26:36‘ ORDER BY t.`UPDATE_DATE` DESC LIMIT 20;	0.543
? （3）範圍查詢200條數據，自增ID性能要好於UUID
自增ID	SELECT SQL_NO_CACHE t.* FROM test.`UC_USER` t WHERE t.`CREATE_DATE` > ‘2016-07-01 10:26:36‘ ORDER BY t.`UPDATE_DATE` DESC LIMIT 200;	2.314
UUID	SELECT SQL_NO_CACHE t.* FROM test.`UC_USER_PK_VARCHAR_1` t WHERE t.`CREATE_DATE` > ‘2016-07-01 10:26:36‘ ORDER BY t.`UPDATE_DATE` DESC LIMIT 200;	3.229
? 範圍查詢總數量。自增ID要好於UUID
自增ID	SELECT SQL_NO_CACHE COUNT(1) FROM test.`UC_USER` t WHERE t.`CREATE_DATE` > ‘2016-07-01 10:26:36‘? ;	0.514
UUID	SELECT SQL_NO_CACHE COUNT(1) FROM test.`UC_USER_PK_VARCHAR_1` t WHERE t.`CREATE_DATE` > ‘2016-07-01 10:26:36‘? ;	1.092

PS：在有緩存的情況下。兩者運行效率沒有相差非常小。

2.4 寫入測試。自增ID是UUID的4倍

主鍵類型	SQL語句	運行時間 (秒)
? ?	? ?	?
自增ID	UPDATE test.`UC_USER` t SET t.`MOBILE_TGC`=‘T2‘ WHERE t.`CREATE_DATE` > ‘2016-05-03 10:26:36‘ AND t.`CREATE_DATE` <‘2016-05-04 00:00:00‘? ;	1.419 ?
UUID	UPDATE test.`UC_USER_PK_VARCHAR_1` t SET t.`MOBILE_TGC`=‘T2‘ WHERE t.`CREATE_DATE` > ‘2016-05-03 10:26:36‘ AND t.`CREATE_DATE` <‘2016-05-04 00:00:00‘? ;	5.639
?	?	?
自增ID	INSERT INTO test.`UC_USER`(?? ID,?? `USER_NAME`,?? `USER_PWD`,?? `BIRTHDAY`,?? `NAME`,?? `USER_ICON`,?? `SEX`,?? `NICKNAME`,?? `STAT`,?? `USER_MALL`,?? `LAST_LOGIN_DATE`,?? `LAST_LOGIN_IP`,?? `SRC_OPEN_USER_ID`,?? `EMAIL`,?? `MOBILE`,?? `IS_DEL`,?? `IS_EMAIL_CONFIRMED`,?? `IS_PHONE_CONFIRMED`,?? `CREATER`,?? `CREATE_DATE`,?? `UPDATE_DATE`,?? `PWD_INTENSITY`,?? `MOBILE_TGC`,?? `MAC`,?? `SOURCE`,?? `ACTIVATE`,?? `ACTIVATE_TYPE` ) SELECT?????? NULL,??? CONCAT(‘110‘,`USER_NAME`,8),?? `USER_PWD`,?? `BIRTHDAY`,?? `NAME`,?? `USER_ICON`,?? `SEX`,?? `NICKNAME`,?? `STAT`,?? `USER_MALL`,?? `LAST_LOGIN_DATE`,?? `LAST_LOGIN_IP`,?? `SRC_OPEN_USER_ID`,?? `EMAIL`, CONCAT(‘110‘,TRIM(`MOBILE`)),?? `IS_DEL`,?? `IS_EMAIL_CONFIRMED`,?? `IS_PHONE_CONFIRMED`,?? `CREATER`,?? `CREATE_DATE`,?? `UPDATE_DATE`,?? `PWD_INTENSITY`,?? `MOBILE_TGC`,?? `MAC`,?? `SOURCE`,?? `ACTIVATE`,?? `ACTIVATE_TYPE` FROM `test`.`UC_USER_1` LIMIT 100;	0.105
UUID	INSERT INTO test.`UC_USER_PK_VARCHAR_1`(??? ID,?? `USER_NAME`,?? `USER_PWD`,?? `BIRTHDAY`,?? `NAME`,?? `USER_ICON`,?? `SEX`,?? `NICKNAME`,?? `STAT`,?? `USER_MALL`,?? `LAST_LOGIN_DATE`,?? `LAST_LOGIN_IP`,?? `SRC_OPEN_USER_ID`,?? `EMAIL`,?? `MOBILE`,?? `IS_DEL`,?? `IS_EMAIL_CONFIRMED`,?? `IS_PHONE_CONFIRMED`,?? `CREATER`,?? `CREATE_DATE`,?? `UPDATE_DATE`,?? `PWD_INTENSITY`,?? `MOBILE_TGC`,?? `MAC`,?? `SOURCE`,?? `ACTIVATE`,?? `ACTIVATE_TYPE` ) SELECT???????? UUID(),?? CONCAT(‘110‘,`USER_NAME`,8),?? `USER_PWD`,?? `BIRTHDAY`,?? `NAME`,?? `USER_ICON`,?? `SEX`,?? `NICKNAME`,?? `STAT`,?? `USER_MALL`, ??`LAST_LOGIN_DATE`,?? `LAST_LOGIN_IP`,?? `SRC_OPEN_USER_ID`,?? `EMAIL`, CONCAT(‘110‘,TRIM(`MOBILE`)),?? `IS_DEL`,?? `IS_EMAIL_CONFIRMED`,?? `IS_PHONE_CONFIRMED`,?? `CREATER`,?? `CREATE_DATE`,?? `UPDATE_DATE`,?? `PWD_INTENSITY`,?? `MOBILE_TGC`,?? `MAC`,?? `SOURCE`,?? `ACTIVATE`,?? `ACTIVATE_TYPE` FROM `test`.`UC_USER_1` LIMIT 100;	0.424

2.5、備份和恢復，自增ID性能優於UUID

主鍵類型	SQL語句	運行時間 (秒)
? Mysqldump備份
自增ID	time mysqldump -utim -ptimgood -h192.168.121.63 test UC_USER_500> UC_USER_500.sql	28.59秒
UUID	time mysqldump -utim -ptimgood -h192.168.121.63 test UC_USER_PK_VARCHAR_500> UC_USER_PK_VARCHAR_500.sql	31.08秒
? MySQL恢復
自增ID	time mysql? -utim -ptimgood -h192.168.121.63? test < UC_USER_500.sql	7m36.601s
UUID	time mysql? -utim -ptimgood -h192.168.121.63? test < UC_USER_PK_VARCHAR_500.sql	9m42.472s
?	?	?

3、500W總結

在500W記錄表的測試下：

（1）??????普通單條或者20條左右的記錄檢索，uuid為主鍵的相差不大差點兒效率同樣；

（2）??????可是範圍查詢特別是上百成千條的記錄查詢，自增id的效率要大於uuid。

（3）??????在範圍查詢做統計匯總的時候，自增id的效率要大於uuid；

（4）??????在存儲上面，自增id所占的存儲空間是uuid的1/2；

（5）??????在備份恢復上，自增ID主鍵略微優於UUID。

4、1000W數據測試

4.1 錄入1000W數據記錄，看存儲空間

# 自增id為主鍵的表

mysql> use test;

Database changed

mysql> select count(1) from UC_USER_1;

+----------+

| count(1) |

+----------+

| 10698102 |

+----------+

1 row in set (27.42 sec)

# uuid為主鍵的表

mysql> select count(1) from UC_USER_PK_VARCHAR_1;

+----------+

| count(1) |

+----------+

| 10698102 |

+----------+

1 row in set (0.00 sec)

mysql>

占領的空間容量來看。自增ID比UUID小一半左右：

主鍵類型	數據文件大小	占領容量?
自增ID	-rw-rw---- 1 mysql mysql 4.2G Aug 20 23:08 UC_USER_1.ibd	4.2 G
UUID	-rw-rw---- 1 mysql mysql 8.8G Aug 20 18:20 UC_USER_PK_VARCHAR_1.ibd	8.8 G

4.2 單個數據走索引查詢。自增id和 uuid效率比是：(2~3):1

主鍵類型	SQL語句	運行時間 (秒)
? 單條記錄查詢
自增ID	SELECT SQL_NO_CACHE t.* FROM test.`UC_USER_1` t WHERE t.`MOBILE` =‘14782121512‘;	0.069
UUID	SELECT SQL_NO_CACHE t.* FROM test.`UC_USER_PK_VARCHAR_1` t WHERE t.`MOBILE` =‘14782121512‘;	0.274
? 小範圍查詢
自增ID	SELECT SQL_NO_CACHE t.* FROM test.`UC_USER_1` t WHERE t.`MOBILE` IN( ‘14782121512‘,‘13761460105‘);	0.050
UUID	SELECT SQL_NO_CACHE t.* FROM test.`UC_USER_PK_VARCHAR_1` t WHERE t.`MOBILE` IN(‘14782121512‘,‘13761460105‘);	0.151
? 依據日期查詢
自增ID	SELECT SQL_NO_CACHE t.* FROM test.`UC_USER_1` t WHERE t.`CREATE_DATE`=‘2013-11-24 10:26:36‘ ;	0.269
UUID	SELECT SQL_NO_CACHE t.* FROM test.`UC_USER_PK_VARCHAR_1` t WHERE t.`CREATE_DATE`=‘2013-11-24 10:26:43‘ ;	0.810

4.3 範圍like查詢，自增ID性能優於UUID，比值(1.5~2)：1

主鍵類型	SQL語句	運行時間 (秒)
? （1）模糊範圍查詢1000條數據，自增ID性能要好於UUID
自增ID	SELECT SQL_NO_CACHE t.* FROM test.`UC_USER` t WHERE t.`MOBILE` LIKE ‘147%‘ LIMIT 1000;	2.398
UUID	SELECT SQL_NO_CACHE t.* FROM test.`UC_USER_PK_VARCHAR_1` t WHERE t.`MOBILE` LIKE ‘147%‘ LIMIT 1000;	5.872
? （2）日期範圍查詢20條數據。自增ID略微弱於UUID
自增ID	SELECT SQL_NO_CACHE t.* FROM test.`UC_USER_1` t WHERE t.`CREATE_DATE` > ‘2016-08-01 10:26:36‘ ORDER BY t.`UPDATE_DATE` DESC LIMIT 20;	0.765
UUID	SELECT SQL_NO_CACHE t.* FROM test.`UC_USER_PK_VARCHAR_1` t WHERE t.`CREATE_DATE` > ‘2016-08-01 10:26:36‘ ORDER BY t.`UPDATE_DATE` DESC LIMIT 20;	1.090
? （3）範圍查詢200條數據，自增ID性能要好於UUID
自增ID	SELECT SQL_NO_CACHE t.* FROM test.`UC_USER_1` t WHERE t.`CREATE_DATE` > ‘2016-07-01 10:26:36‘ ORDER BY t.`UPDATE_DATE` DESC LIMIT 200;	1.569
UUID	SELECT SQL_NO_CACHE t.* FROM test.`UC_USER_PK_VARCHAR_1` t WHERE t.`CREATE_DATE` > ‘2016-07-01 10:26:36‘ ORDER BY t.`UPDATE_DATE` DESC LIMIT 200;	2.597
? 範圍查詢總數量。自增ID要好於UUID
自增ID	SELECT SQL_NO_CACHE COUNT(1) FROM test.`UC_USER_1` t WHERE t.`CREATE_DATE` > ‘2016-07-01 10:26:36‘? ;	1.129
UUID	SELECT SQL_NO_CACHE COUNT(1) FROM test.`UC_USER_PK_VARCHAR_1` t WHERE t.`CREATE_DATE` > ‘2016-07-01 10:26:36‘? ;	2.302

4.4 寫入測試，自增ID比UUID效率高，比值(3~10)：1

主鍵類型	SQL語句	運行時間 (秒)
? ? 改動一天的記錄
自增ID	UPDATE test.`UC_USER_1` t SET t.`MOBILE_TGC`=‘T2‘ WHERE t.`CREATE_DATE` > ‘2016-05-03 10:26:36‘ AND t.`CREATE_DATE` <‘2016-05-04 00:00:00‘? ;	2.685
UUID	UPDATE test.`UC_USER_PK_VARCHAR_1` t SET t.`MOBILE_TGC`=‘T2‘ WHERE t.`CREATE_DATE` > ‘2016-05-03 10:26:36‘ AND t.`CREATE_DATE` <‘2016-05-04 00:00:00‘? ;	26.521
? 錄入數據
自增ID	INSERT INTO test.`UC_USER_1`(?? ID,?? `USER_NAME`,?? `USER_PWD`,?? `BIRTHDAY`,?? `NAME`,?? `USER_ICON`,?? `SEX`,?? `NICKNAME`,?? `STAT`,?? `USER_MALL`,?? `LAST_LOGIN_DATE`,?? `LAST_LOGIN_IP`,?? `SRC_OPEN_USER_ID`,?? `EMAIL`,?? `MOBILE`,?? `IS_DEL`,?? `IS_EMAIL_CONFIRMED`,?? `IS_PHONE_CONFIRMED`,?? `CREATER`,?? `CREATE_DATE`,?? `UPDATE_DATE`,?? `PWD_INTENSITY`,?? `MOBILE_TGC`,?? `MAC`,?? `SOURCE`,?? `ACTIVATE`,?? `ACTIVATE_TYPE` ) SELECT?????? NULL,??? CONCAT(‘110‘,`USER_NAME`,8),?? `USER_PWD`,?? `BIRTHDAY`,?? `NAME`,?? `USER_ICON`,?? `SEX`,?? `NICKNAME`,?? `STAT`,?? `USER_MALL`,?? `LAST_LOGIN_DATE`,?? `LAST_LOGIN_IP`,?? `SRC_OPEN_USER_ID`,?? `EMAIL`, CONCAT(‘110‘,TRIM(`MOBILE`)),?? `IS_DEL`,?? `IS_EMAIL_CONFIRMED`,?? `IS_PHONE_CONFIRMED`,?? `CREATER`,?? `CREATE_DATE`,?? `UPDATE_DATE`,?? `PWD_INTENSITY`,?? `MOBILE_TGC`,?? `MAC`,?? `SOURCE`,?? `ACTIVATE`,?? `ACTIVATE_TYPE` FROM `test`.`UC_USER_1` LIMIT 100;	0.534
UUID	INSERT INTO test.`UC_USER_PK_VARCHAR_1`(??? ID,?? `USER_NAME`,?? `USER_PWD`,?? `BIRTHDAY`,?? `NAME`,?? `USER_ICON`,?? `SEX`,?? `NICKNAME`,?? `STAT`,?? `USER_MALL`,?? `LAST_LOGIN_DATE`,?? `LAST_LOGIN_IP`,?? `SRC_OPEN_USER_ID`,?? `EMAIL`,?? `MOBILE`,?? `IS_DEL`,?? `IS_EMAIL_CONFIRMED`,?? `IS_PHONE_CONFIRMED`,?? `CREATER`,?? `CREATE_DATE`,?? `UPDATE_DATE`,?? `PWD_INTENSITY`,?? `MOBILE_TGC`,?? `MAC`,?? `SOURCE`,?? `ACTIVATE`,?? `ACTIVATE_TYPE` ) SELECT???????? UUID(),?? CONCAT(‘110‘,`USER_NAME`,8),?? `USER_PWD`,?? `BIRTHDAY`,?? `NAME`,?? `USER_ICON`,?? `SEX`,?? `NICKNAME`,?? `STAT`,?? `USER_MALL`,?? `LAST_LOGIN_DATE`,?? `LAST_LOGIN_IP`,?? `SRC_OPEN_USER_ID`,?? `EMAIL`, CONCAT(‘110‘,TRIM(`MOBILE`)),?? `IS_DEL`,?? `IS_EMAIL_CONFIRMED`,?? `IS_PHONE_CONFIRMED`,?? `CREATER`,?? `CREATE_DATE`,?? `UPDATE_DATE`,?? `PWD_INTENSITY`,?? `MOBILE_TGC`,?? `MAC`,?? `SOURCE`,?? `ACTIVATE`,?? `ACTIVATE_TYPE` FROM `test`.`UC_USER_1` LIMIT 100;	1.716

4.5、備份和恢復，自增ID性能優於UUID

主鍵類型	SQL語句	運行時間 (秒)
? Mysqldump備份
自增ID	time mysqldump -utim -ptimgood -h192.168.121.63 test UC_USER_1> UC_USER_1.sql	0m50.548s
UUID	time mysqldump -utim -ptimgood -h192.168.121.63 test UC_USER_PK_VARCHAR_1> UC_USER_PK_VARCHAR_1.sql	0m58.590s
? MySQL恢復
自增ID	time mysql -utim -ptimgood -h192.168.121.63 test < UC_USER_1.sql	17m30.822s
UUID	time mysql -utim -ptimgood -h192.168.121.63 test < UC_USER_PK_VARCHAR_1.sql	23m6.360s
?	?	?

5、1000W總結

在1000W記錄表的測試下：

（1）普通單條或者20條左右的記錄檢索，自增主鍵效率是uuid主鍵的2到3倍。

（2）可是範圍查詢特別是上百成千條的記錄查詢。自增id的效率要大於uuid；

（3）在範圍查詢做統計匯總的時候，自增id主鍵的效率是uuid主鍵1.5到2倍；

（4）在存儲上面，自增id所占的存儲空間是uuid的1/2；

（5）在寫入上面，自增ID主鍵的效率是UUID主鍵的3到10倍，相差比較明顯。特別是update小範圍之內的數據上面。

（6）在備份恢復上。自增ID主鍵略微優於UUID。

6、MySQL分布式架構的取舍

分布式架構，意味著須要多個實例中保持一個表的主鍵的唯一性。

這個時候普通的單表自增ID主鍵就不太合適。由於多個mysql實例上會遇到主鍵全局唯一性問題。

6.1、自增ID主鍵+步長。適合中等規模的分布式場景

???????? 在每一個集群節點組的master上面，設置（auto_increment_increment），讓眼下每一個集群的起始點錯開 1，步長選擇大於將來基本不可能達到的切分集群數，達到將 ID 相對分段的效果來滿足全局唯一的效果。

長處是：實現簡單，後期維護簡單。相應用透明。

缺點是：第一次設置相對較為復雜。由於要針對未來業務的發展而計算好足夠的步長;

規劃：

比方計劃總共N個節點組，那麽第i個節點組的my.cnf的配置為：

auto_increment_offset? i

auto_increment_increment ?N

假如規劃48個節點組，N為48，如今配置第8個節點組。這個i為8，第8個節點組的my.cnf裏面的配置為：

auto_increment_offset? 8

auto_increment_increment? 48

6.2、UUID。適合小規模的分布式環境

???????? 對於InnoDB這樣的聚集主鍵類型的引擎來說。數據會依照主鍵進行排序。由於UUID的無序性，InnoDB會產生巨大的IO壓力，並且由於索引和數據存儲在一起，字符串做主鍵會造成存儲空間增大一倍。

在存儲和檢索的時候，innodb會對主鍵進行物理排序，這對auto_increment_int是個好消息，由於後一次插入的主鍵位置總是在最後。

可是對uuid來說，這卻是個壞消息。由於uuid是雜亂無章的。每次插入的主鍵位置是不確定的，可能在開頭，也可能在中間，在進行主鍵物理排序的時候，勢必會造成大量的 IO操作影響效率，在數據量不停增長的時候。特別是數據量上了千萬記錄的時候。讀寫性能下降的非常厲害。

長處：搭建比較簡單，不須要為主鍵唯一性的處理。

缺點：占用兩倍的存儲空間（在雲上光存儲一塊就要多花2倍的錢）。後期讀寫性能下降厲害。

6.3、雪花算法自造全局自增ID。適合大數據環境的分布式場景

由twitter發布的開源的分布式id算法snowflake（Java版本號）

IdWorker.java：

package com.demo.elk;

import org.slf4j.Logger;?

import org.slf4j.LoggerFactory;

public class IdWorker {

???

??? protected static final Logger LOG = LoggerFactory.getLogger(IdWorker.class);

????

??? private long workerId;

??? private long datacenterId;

??? private long sequence = 0L;

??? private long twepoch = 1288834974657L;

??? private long workerIdBits = 5L;

??? private long datacenterIdBits = 5L;

??? private long maxWorkerId = -1L ^ (-1L << workerIdBits);

??? private long maxDatacenterId = -1L ^ (-1L << datacenterIdBits);

??? private long sequenceBits = 12L;

??? private long workerIdShift = sequenceBits;

??? private long datacenterIdShift = sequenceBits + workerIdBits;

??? private long timestampLeftShift = sequenceBits + workerIdBits + datacenterIdBits;

??? private long sequenceMask = -1L ^ (-1L << sequenceBits);

??? private long lastTimestamp = -1L;

??? public IdWorker(long workerId, long datacenterId) {

??????? // sanity check for workerId

??????? if (workerId > maxWorkerId || workerId < 0) {

??????????? throw new IllegalArgumentException(String.format("worker Id can‘t be greater than %d or less than 0", maxWorkerId));

??????? }

??????? if (datacenterId > maxDatacenterId || datacenterId < 0) {

?????????? ?throw new IllegalArgumentException(String.format("datacenter Id can‘t be greater than %d or less than 0", maxDatacenterId));

??????? }

??????? this.workerId = workerId;

??????? this.datacenterId = datacenterId;

??????? LOG.info(String.format("worker starting. timestamp left shift %d, datacenter id bits %d, worker id bits %d, sequence bits %d, workerid %d", timestampLeftShift, datacenterIdBits, workerIdBits, sequenceBits, workerId));

??? }

??? public synchronized long nextId() {

??????? long timestamp = timeGen();

??????? if (timestamp < lastTimestamp) {

??????????? LOG.error(String.format("clock is moving backwards.? Rejecting requests until %d.", lastTimestamp));

??????????? throw new RuntimeException(String.format("Clock moved backwards.? Refusing to generate id for %d milliseconds", lastTimestamp - timestamp));

??????? }

??????? if (lastTimestamp == timestamp) {

??????????? sequence = (sequence + 1) & sequenceMask;

??????????? if (sequence == 0) {

??????????????? timestamp = tilNextMillis(lastTimestamp);

??????????? }

??????? } else {

??????????? sequence = 0L;

??????? }

??????? lastTimestamp = timestamp;

??????? return ((timestamp - twepoch) << timestampLeftShift) | (datacenterId << datacenterIdShift) | (workerId << workerIdShift) | sequence;

? ??}

??? protected long tilNextMillis(long lastTimestamp) {

??????? long timestamp = timeGen();

??????? while (timestamp <= lastTimestamp) {

??????????? timestamp = timeGen();

??????? }

??????? return timestamp;

??? }

??? protected long timeGen() {

??? ????return System.currentTimeMillis();

??? }

}

測試生成ID的測試類，IdWorkerTest.java：

package com.demo.elk;

import java.util.HashSet;

import java.util.Set;

public class IdWorkerTest {

???????? ?

??? static class IdWorkThread implements Runnable {

??????? private Set<Long> set;

??????? private IdWorker idWorker;

??????? public IdWorkThread(Set<Long> set, IdWorker idWorker) {

??????????? this.set = set;

??????????? this.idWorker = idWorker;

??????? }

??????? public void run() {

??????????? while (true) {

?????????? ?????long id = idWorker.nextId();

??????????????? System.out.println("??????????? real id:" + id);

??????????????? if (!set.add(id)) {

??????????????????? System.out.println("duplicate:" + id);

??????????????? }

??????????? }

??????? }

??? }

??? public static void main(String[] args) {

??????? Set<Long> set = new HashSet<Long>();

??????? final IdWorker idWorker1 = new IdWorker(0, 0);

??????? final IdWorker idWorker2 = new IdWorker(1, 0);

??????? Thread t1 = new Thread(new IdWorkThread(set, idWorker1));

? ??????Thread t2 = new Thread(new IdWorkThread(set, idWorker2));

??????? t1.setDaemon(true);

??????? t2.setDaemon(true);

??????? t1.start();

??????? t2.start();

??????? try {

??????????? Thread.sleep(30000);

??????? } catch (InterruptedException e) {

????? ??????e.printStackTrace();

??????? }

??? }

}

7，總結

（1）單實例或者單節點組：

經過500W、1000W的單機表測試，自增ID相對UUID來說。自增ID主鍵性能高於UUID。磁盤存儲費用比UUID節省一半的錢。所以在單實例上或者單節點組上，使用自增ID作為首選主鍵。

（2）分布式架構場景：

???????? 20個節點組下的小型規模的分布式場景。為了高速實現部署，能夠採用多花存儲費用、犧牲部分性能而使用UUID主鍵高速部署；

???????? 20到200個節點組的中等規模的分布式場景，能夠採用自增ID+步長的較高速方案。

???????? 200以上節點組的大數據下的分布式場景，能夠借鑒相似twitter雪花算法構造的全局自增ID作為主鍵。

MySQL 使用自增ID主鍵和UUID 作為主鍵的優劣比較具體過程（從百萬到千萬表記錄測試）

popu tis pack 方案表數據 lock 進行 args ios ?測試緣由? 一個開發同事做了一個框架。裏面主鍵是uuid。我跟他建議說mysql不要用uuid用自增主鍵，自增主鍵效率高，他說不一定高，我說inn

MySQL 使用自增ID主鍵和UUID 作為主鍵的優劣比較具體過程（從百萬到千萬表記錄測試）

1、準備表以及數據

2、500W數據測試

2.1 錄入500W數據。自增ID節省一半磁盤空間

2.2 單個數據走索引查詢，自增id和uuid相差不大

2.3 範圍like查詢，自增ID性能優於UUID

2.4 寫入測試。自增ID是UUID的4倍

2.5、備份和恢復，自增ID性能優於UUID

3、500W總結

4、1000W數據測試

4.1 錄入1000W數據記錄，看存儲空間

4.2 單個數據走索引查詢。自增id和 uuid效率比是：(2~3):1

4.3 範圍like查詢，自增ID性能優於UUID，比值(1.5~2)：1

4.4 寫入測試，自增ID比UUID效率高，比值(3~10)：1

4.5、備份和恢復，自增ID性能優於UUID

5、1000W總結

6、MySQL分布式架構的取舍

6.1、自增ID主鍵+步長。適合中等規模的分布式場景

6.2、UUID。適合小規模的分布式環境

6.3、雪花算法自造全局自增ID。適合大數據環境的分布式場景

7，總結

相關推薦