數據庫存在即更新的高並發處理 - 轉

阿新 • • 發佈：2017-10-06

都得 uid 增加出了驗證 snapshot 一個這樣的 blank

這篇文章的主要內容，來自與其他人的討論。

　　軟件系統的開發或設計時，容易遇到有並發的情況。有時候需要刻意去避免，防止數據錯誤。比如超市賣商品，可能兩個櫃臺同時賣出一款礦泉水，如果軟件系統後臺需要跟蹤每個商品的庫存，此時就需要特別考慮。如果兩個櫃臺，同時采取＂讀當前庫存，減一，得到最新庫存，保存＂的設計，則可能會導致數據錯誤。比如，兩個櫃臺，讀當前庫存，都得到 100, 減一，都得到99，作為最新數據保存，保存99。最後，盡管同時賣出了兩瓶礦泉水，最後系統的庫存確是99。無疑是有問題的。

　　一個簡單的解決辦法，就是再設計一個接口表。對於有可能並發的操作，統一插入一條"待處理的操作指令"到此接口表中，然後單獨起一個線程，逐個處理此接口表中待處理數據。

　　大致步驟如下：

1. 並發處理，統一插入一條待處理的操作指令到此接口表中，只 insert:
insert into ti_xxx ....; --process_flag = 0

2. 單獨起一個線程，逐個讀 : ti_xxx 中未處理的數據.
2.1
select top 1 from ti_xxx where process_flag = 0 order by increase_key,created_time;

2.2. insert/update 到 tt_xxx :
if exists(select 1 from tt_xxx where ....)
　　update tt_xxx ....

else
　　insert into tt_xxx...

2.3 更新 ti_xxx 數據為已處理:
update ti_xxx set process_flag = 1 where increase_key = xxx;

其中，ti_xxx 表使用自增長主鍵，或使用 uuid 做主鍵。

　　如果只是單純的超市軟件系統，它的庫存計算，其實不用很實時。讓管理員人員，看當前時間的庫存，與看5分鐘之前的庫存，從純粹的管理層面，並沒有大的區別。實際上，絕大多數系統，數據的實時性要求，都沒有高到需要完全實時。另一方面，此類系統對數據的最終準確性，要求卻是非常高的。比如，客戶不太在意，9:05 分賣出一款礦泉水，只能在 9:10看到庫存減少。但客戶在意的是，9:05 分時刻賣出一款礦泉水，至少在下班後(21:00)，能看到結果。

　　如果我們將以上所述"單獨起一個線程"，做成每 0.5秒運行一次的定時任務，則對於客戶來說，完全看不到影響。

-------------------------------

2017/6/3 補充，（2017/6/4發現，以下測試步驟中有不當的地方，請忽略).

有人提到，可以用純 SQL 來處理並發，使用適當的 lock 。但這樣有時並不管用。比如按如下測試，則測試出問題:

---------------------------------------------

2017/6/4 補充更正

重新測試，結論是 UPDATE...WITH(HOLDLOCK)... 可以鎖住表的 update 操作，起到"並發時順序處理"的期望結果。但並不需要使用 SET [Counter] = [Counter] + 1 這樣的語句。

測試環境: Windows 8.1 64位 + SQL Server 2014 Express.
測試步驟:
step_1, 創建數據庫 test_db1。

step_2, 運行 SQL 更改數據庫屬性:
ALTER DATABASE test_db1 SET SINGLE_USER WITH ROLLBACK IMMEDIATE;
ALTER DATABASE test_db1 SET ALLOW_SNAPSHOT_ISOLATION ON;
ALTER DATABASE test_db1 SET READ_COMMITTED_SNAPSHOT ON;
ALTER DATABASE test_db1 SET MULTI_USER;

step_3,創建表,
CREATE TABLE [dbo].[Test](
[Id] [bigint] NULL,
[Name] [varchar](50) NULL,
[Counter0] [bigint] NULL,
[created_time] [datetime] NULL,
[updated_time] [datetime] NULL
) ON [PRIMARY];

step_4,創建存儲過程:
CREATE PROCEDURE [dbo].[sp_test]
@Id [bigint],
@Name [varchar](50)

AS
BEGIN
BEGIN TRANSACTION
--先嘗試更新記錄占坑
print ‘a0:‘+ convert(varchar(255), getdate(), 121) + ‘,‘

UPDATE Test WITH(HOLDLOCK)
SET -- [Counter] = [Counter] + 1,
[email protected], updated_time = getdate()
WHERE Id = @Id;

--需要在 WAITFOR DELAY 之前，將 @@ROWCOUNT 中的數值，暫時保存起來。因為 WAITFOR DELAY 之後，@@ROWCOUNT 中的數值會變。
DECLARE @v_ROWCOUNT bigint
set @v_ROWCOUNT = @@ROWCOUNT
print ‘a1:‘+ convert(varchar(255), getdate(), 121) + ‘,ROWCOUNT=‘+ cast( @v_ROWCOUNT as varchar(255))
print ‘a1.5:‘+ convert(varchar(255), getdate(), 121) + ‘,ROWCOUNT=‘+ cast( @@ROWCOUNT as varchar(255))

WAITFOR DELAY ‘00:00:20‘;

print ‘a2:‘+ convert(varchar(255), getdate(), 121) + ‘,ROWCOUNT=‘+ cast( @@ROWCOUNT as varchar(255))

--如果更新操作沒有影響行，證明記錄不存在，則插入
IF @v_ROWCOUNT < 1
BEGIN
INSERT Test
( Id, Name
--, [Counter]
,created_time,updated_time )
VALUES ( @Id, @Name
--, 1
, getdate(), getdate() );
print ‘a3:‘+ convert(varchar(255), getdate(), 121) + ‘,ROWCOUNT=‘+ cast( @@ROWCOUNT as varchar(255))

WAITFOR DELAY ‘00:00:05‘;
END
print ‘a4:‘+ convert(varchar(255), getdate(), 121)
WAITFOR DELAY ‘00:00:02‘;
print ‘a4.5:‘+ convert(varchar(255), getdate(), 121)
COMMIT
print ‘a5:‘+ convert(varchar(255), getdate(), 121)
END

GO

中間加了暫停。

step_5. 開兩個 SQL Server Management studio, 分別運行 sp_test, 參數分別為:
step_5_1:
id=1,
name=‘A‘,

step_5_2:
id=1,
name=‘B‘,

step_6, 驗證最後數據:
SELECT TOP 1000 * FROM [test_db1].[dbo].[Test];
得到一行數據:
Id Name Counter0 created_time updated_time
1 B NULL 2017-06-04 14:59:46.517 2017-06-04 14:59:53.520

從調試運行執行存儲過程 SQL 的消息日誌中，可以看到第二次存儲過程的 update 的執行，確實是在第一次執行的 commit 之後。

結論:
UPDATE...WITH(HOLDLOCK)... 可以鎖住表的 update 操作，起到"並發時順序處理"的期望結果。但並不需要使用 SET [Counter] = [Counter] + 1 這樣的語句。

很抱歉之前的錯誤結論，可能誤導了一些朋友。

實測結果，數據庫屬性中，增加 :

ALTER DATABASE test_db1 SET ALLOW_SNAPSHOT_ISOLATION ON;
ALTER DATABASE test_db1 SET READ_COMMITTED_SNAPSHOT ON;

可以在 UPDATE...WITH(HOLDLOCK)... 的數據庫事務執行過程中，select 表 Test 數據。

而不加 ALLOW_SNAPSHOT_ISOLATION + READ_COMMITTED_SNAPSHOT，則此時 select 也堵塞。但 update Test 表都堵塞。

數據庫存在即更新的高並發處理 - 轉

數據庫存在即更新的高並發處理 - 轉

數據庫存在即更新的並發處理 - 轉

數據庫存在即更新的高並發處理 - 轉

Linux(Centos )的網絡內核參數優化來提高服務器並發處理能力【轉】

Linux(debian)的網絡內核參數優化來提高服務器並發處理能力

Ubuntu上使用Redis數據庫存儲SessionID並實現Session共享

【nginx筆記】系統參數設置-使Nginx支持更多並發請求的TCP網絡參數

Python爬蟲抓取東方財富網股票數據並實現MySQL數據庫存儲

Super CSV 線程池高並發處理大批量數據

Python 提取數據庫（Postgresql）並郵件發送

數據庫存儲過程、觸發器、連接

用java訪問Oracle數據庫、取得記錄並輸出到界面

MYSQL，數據庫存儲引擎！

[大數據]-Logstash-5.3.1的安裝導入數據到Elasticsearch5.3.1並配置同義詞過濾

10、管理數據庫存儲(行遷移及行連接)

如何通過當前地區經緯度，搜索數據庫存儲的地區（距離最近的地區）

什麽通用數據交換格式更好

數據庫存儲語句

數據加載更多js代碼

mysql數據庫存儲引擎及區別

MySQL數據庫存儲過程動態表建立(PREPARE)

數據庫存在即更新的高並發處理 - 轉

相關推薦