巧用Sqlite3加速資料庫

阿新 • • 發佈：2022-05-13

當遇到大量高頻欄位需要更新時候，資料庫CPU分分鐘飈起來，嚇得定時任務都不敢運行了。連上資料庫，人工掐表執行下

MariaDB [AAAA]>  show  global  status like 'Question%'; 
+---------------+---------+
| Variable_name | Value   |
+---------------+---------+
| Questions     | 5025774 |
+---------------+---------+
1 row in set (0.00 sec)

兩數相減，原來還真是查詢過多導致。仔細分析了下，查詢來源：

通過聯合欄位鎖定記錄
更新記錄屬性，回寫資料庫

更新可以批量，不過資源鎖定是個問題。有人說直接莽，全拉倒記憶體，自己一條條匹配，反正記憶體也不會很慢。但是幾萬條記錄，又不是kv，多欄位匹配，每次找到一條資料也是難度很大。帶著這個問題，sqlite3 in memory 閃亮登場！

以Django為例，多資料庫配置如下：

DATABASES = {
    'default': {
        'ENGINE': 'django.db.backends.mysql',
        'NAME': 'name',
        'USER': 'user',
        'PASSWORD': 'password',
        'HOST': '127.0.0.1',
        'PORT': '3306',
    },
    'memory': {
        'ENGINE': 'django.db.backends.sqlite3',
        # :memory: 屬於獨佔，單程序內多執行緒無法共享 
        'NAME': 'file:memDB1?mode=memory&cache=shared',
        'uri': True,
    }
}

記憶體表無法儲存表結構，每次都要初始下，mysql 與 sqlite3 結構並不一樣，因此我採用的是先用檔案，然後匯出sql

sqlite3 db.sqlite3
sqlite> .output tmpl.sql
sqlite> .dump
sqlite> .exit

然後定時任務執行前，初始化表結構

from django.db import connections

@classmethod
def init_cache(cls):
    path = '../sql/tmpl.sql'
    cache_con = connections['memory']
    with cache_con.cursor() as cursor:
        with open(path) as fp:
            for sql in fp.readlines():
                cursor.execute(sql)

@classmethod
def init_table(cls, *args):
    for model in args:
        objs = model.objects.all()
        logger.info("同步表結構: %s 總共: %s 進入cache" % (model, len(objs)))
        model.objects.using("memory").bulk_create(objs, batch_size=1000)

上述邏輯，只要在定時任務啟動時初始化一次，就可以快照一波指定資料到記憶體。由於API例項是直接查詢資料庫，cache只有自身使用，那麼讀寫分離前提就夠了。簡單邏輯我們可以直接這麼寫也不卡：

objs = []
for item in data['data']['result']:
    flag = item['metric']['disk']
    instance = item['metric']['instance']
    ip = instance.split(":")[0]
    disk = Disk.objects.using("memory").filter(host__ip=ip, flag=flag).first()
    if not disk:
        logger.warning("硬碟<%s-%s>不在資料庫中" % (ip, flag))
        continue
    value = item['value'][-1]
    disk.io_usage = value
    objs.append(disk)
Disk.objects.using("default").bulk_update(objs, ("io_usage",), batch_size=500)

從Prometheus中讀取硬碟IO使用率，先去cache中鎖定model，更新欄位，然後合併更新到資料庫中。記住，這裡一定要指定更新欄位，這樣cache的作用就只是查主鍵拼SQL，而不用手動生成，簡潔明瞭。

巧用Sqlite3加速資料庫

巧用Sqlite3加速資料庫

巧用shell生成資料庫檢查指令碼 (74天)

electron專案用Sequelize連線資料庫sqlite3（二）

巧用shell指令碼分析資料庫使用者(r2第4天)

巧用自動化測試組合拳保證產品質量

巧用遞迴解決矩陣最大序列和問題

Mysql巧用join優化sql的方法詳解

JAVA 模擬網站註冊登入功能，用檔案代替資料庫

用eclipse編輯資料庫裡面的登入註冊功能使用md5對密碼進行加密

巧用transform: scale()

真會玩！竟然可以這樣用IDEA通過資料庫生成lombok版的POJO...

如何巧用HashMap一行程式碼統計單詞出現次數詳解

巧用win32print來控制windows系統印表機並推送列印任務

如何巧用vimdiff來替代原始的svn diff和git diff(效率提升)

[NOI2015]軟體包管理器（巧用線段樹）

空間寶石（巧用線段樹之二）

NHibernate之(8)：巧用元件之依賴物件

【API進階之路】幫公司省下20萬調研費！如何巧用情感分析API實現使用者偏好調研

巧用你的GDB

IDEA巧用Postfix Completion讓碼速起飛(小技巧)

巧用Sqlite3加速資料庫

相關推薦