python 統計MySQL大於100萬的表

阿新 • • 發佈：2018-11-26

一、需求分析

線上的MySQL伺服器，最近有很多慢查詢。需要統計出行數大於100萬的表，進行統一優化。

需要篩選出符合條件的表，統計到excel中，格式如下：

庫名	表名	行數
db1	users	1234567

二、統計表的行數

統計表的行數，有2中方法：

1. 通過查詢mysql的information_schema資料庫中INFODB_SYS_TABLESTATS表,它記錄了innodb型別每個表大致的資料行數

2. select count(1) from 庫名.表名

下面來分析一下這2種方案。

第一種方案，不是精確記錄的。雖然效率快，但是表會有遺漏！

第二鍾方案，才是準確的。雖然慢，但是表不會遺漏。

備註：

count(1)其實這個1，並不是表示第一個欄位，而是表示一個固定值。

count(1)，其實就是計算一共有多少符合條件的行。
1並不是表示第一個欄位，而是表示一個固定值。
其實就可以想成表中有這麼一個欄位，這個欄位就是固定值1，count(1)，就是計算一共有多少個1.

寫入json檔案

下面這段程式碼，是參考我之前寫的一篇文章：

https://www.cnblogs.com/xiao987334176/p/9901692.html

在此基礎上，做了部分修改，完整程式碼如下：

#!/usr/bin/env python3
# coding: utf-8

import pymysql
import json

conn = pymysql.connect(
    host="192.168.91.128",  # mysql ip地址
    user="root",
    passwd="root",
    port=3306,  # mysql 埠號,注意：必須是int型別
    connect_timeout = 3  # 超時時間
)

cur  
= conn.cursor()  # 建立遊標

# 獲取mysql中所有資料庫
cur.execute('SHOW DATABASES')

data_all = cur.fetchall()  # 獲取執行的返回結果
# print(data_all)

dic = {}  # 大字典，第一層
for i in data_all:
    if i[0] not in dic:  # 判斷庫名不在dic中時
        # 排序列表,排除mysql自帶的資料庫
        exclude_list = ["sys", "information_schema", "mysql", "performance_schema"]
        if i[0] not in exclude_list:  # 判斷不在列表中時
            # 寫入第二層資料
            dic[i[0]] = {'name': i[0], 'table_list': []}
            conn.select_db(i[0])  # 切換到指定的庫中
            cur.execute('SHOW TABLES')  # 檢視庫中所有的表
            ret = cur.fetchall()  # 獲取執行結果

            for j in ret:
                # 查詢表的行數
                cur.execute('select count(1) from `%s`;'% j[0])
                ret = cur.fetchall()
                # print(ret)
                for k in ret:
                    print({'tname': j[0], 'rows': k[0]})
                    dic[i[0]]['table_list'].append({'tname': j[0], 'rows': k[0]})


with open('tj.json','w',encoding='utf-8') as f:
    f.write(json.dumps(dic))

View Code

三、寫入excel中

直接讀取tj.json檔案，進行寫入，完整程式碼如下：

#!/usr/bin/env python3
# coding: utf-8

import xlwt
import json
from collections import OrderedDict

f = xlwt.Workbook()
sheet1 = f.add_sheet('統計', cell_overwrite_ok=True)
row0 = ["庫名", "表名", "行數"]

# 寫第一行
for i in range(0, len(row0)):
    sheet1.write(0, i, row0[i])

# 載入json檔案
with open("tj.json", 'r') as load_f:
    load_dict = json.load(load_f)  # 反序列化檔案
    order_dic = OrderedDict()  # 有序字典
    for key in sorted(load_dict):  # 先對普通字典key做排序
        order_dic[key] = load_dict[key]  # 再寫入key

    num = 0  # 計數器
    for i in order_dic:

        # 遍歷所有表
        for j in order_dic[i]["table_list"]:
            # 判斷行數大於100萬時
            if j['rows'] > 1000000:
                # 寫入庫名
                sheet1.write(num + 1, 0, i)
                # 寫入表名
                sheet1.write(num + 1, 1, j['tname'])
                # 寫入行數
                sheet1.write(num + 1, 2, j['rows'])
                num += 1  # 自增1

    f.save('test1.xls')

View Code

執行程式，開啟excel檔案，效果如下：

python 統計MySQL大於100萬的表

一、需求分析線上的MySQL伺服器，最近有很多慢查詢。需要統計出行數大於100萬的表，進行統一優化。需要篩選出符合條件的表，統計到excel中，格式如下：庫名表名行數 db1 users 1234567

[排序] 對檔案A.txt中儲存了N個整數進行排序（N大於100萬）要求僅佔用4K記憶體 - 點陣圖排序

【題目】檔案A.txt中儲存了N個整數（N大於100萬），要求僅佔用4K記憶體，對該檔案中的整數進行排序，結果輸出到B.txt 【思路】百萬級別的資料排序，理論上講，應該需要1M以上的空間。4k也可以做不過效率會差不少 4k位元組應該是32768個bit（4*1024*8）申請

Python連線MySQL並建立資料表

閒暇之餘學習了下python。並通過python連線資料庫，以及簡單的對資料庫的操作。先貼一段已經實現的程式碼，我使用的版本為3.6，所以安裝的是pysql來實現連線的。執行pip install

python查詢mysql並生成excel表

group pen nbsp 生成連接數據庫 port 關閉連接添加數據個數需求說明開發不願意單獨為某個項目做後臺並且運營那邊需要合並多個表的數據因此找上了我。要求每周執行一次。月初也執行一次要查詢2個mysql數據庫多個表並生成exc

通過Python進行MySQL表資訊統計

導讀在上一篇文章中簡單的介紹了使用python-mysql-replication 來解析 MySQL binlog來完成實時統計的業務，當然，在現實的業務中不可能用的那麼簡單的。囉哩八說今天的目的不是介紹真實的業務場景如何使用 python-mysql-replication，而是推出一枚&l

python-day11-MYSQL 數據庫及數據表

cname number creat ren reference mar score prim def 創庫create database lianx1 DEFAULT character set utf8 表##############################

MySQL 整庫單表備份 for python腳本

col ros print makedirs cin alt show urg ria #!/usr/bin/python#! _*_ coding:utf-8 _*_from datetime import date, datetime, timedel

python開發mysql：mysql安裝(windows)&密碼找回&存儲引擎簡介&庫表的增刪改查

mem 合並 utf 詳細 rop bsp database pri 註意一，mysql安裝 1 下載地址 https://dev.mysql.com/downloads/file/?id=471342 2 解壓後，將目錄C:\mysql-5.7.19-winx64

python開發mysql:表關系&單表簡單查詢

for 查詢 comment modify tween upd price odi nbsp 一一對多，多對一 1 1.1 建立多對一，一對多的關系需要註意 2 先建立被關聯的表，被關聯的字段必須保證時唯一的 3 在創建關聯的表，關聯的字

Python之mysql數據庫更新表數據接口實現

其中指正 view spec tween att use back .com 昨天，因為項目需求要添加表的更新接口，來存儲預測模型訓練的數據。先碼為敬~~~~~~~ 1 # -*- coding: utf-8 -*- 2 import pymysq

統計mysql表數量及表記錄數

統計MySQL中某個資料庫中有多少張表 SELECT count(*) TABLES, table_schema FROM information_schema.TABLES where table_sc

是時候丟棄 Python 2.0，將 100 萬行的程式碼遷移到 Python 3.0 了！

Python 2 vs Python 3，究竟誰是效能之王？前段時間，Hackermoon 上一位叫 Anthony Shaw 的作者為我們做了一些測試，最終得出結論，雖然 Python 2 在加密和啟動時間測試過程中，比 Python 3 的速度更勝一籌，但整體而言，Py

關於使用python來實現mysql自動生成資料表

注：環境 windows 7 旗艦版 python 3.6.4 xlrd模組 pymysql模組 mysql 8.0.12 前幾天拿到一個專案需要在資料庫建立‘一堆’的表！於是就有了一個偷懶的想法！經過努力終於完成了‘乞丐版’程式碼如下： # -*-

mysql sum join 多表統計求和時不正確的問題

但是我們發現，這個資料是錯誤的於是我想到了用 distinct 但是發現用不了於是又想到 group by 出來的結果是下面這樣的發現統計只是分組統計，沒達到所有行統計，而且統計的資料不正確於是我寫了下面的語句來檢視結果,加多了一個count函式檢視

python對mysql增刪改查+計算器+九九乘法表

廢話不多說，直接上程式碼 import pymysql connection = pymysql.connect(host='127.0.0.1', port=3306, user='root', password='roo

MySql 100萬級別資料中隨機獲取一條或多條記錄之RAND()優化

處理業務中，有這樣的需求，例如：有100W甚至更多的使用者，此時我們要隨機一條男性或者女性使用者出來做資料操作。基於這個需求，我們做一下實驗。基礎準備準備一張使用者表，結構如下 CREATE TABLE `user` (

mysql中關於批量插入資料（1萬、10萬、100萬、1000萬、1億級別的資料）

硬體：windows7+8G記憶體+i3-4170處理器+4核CPU 首先貼上資料庫的操作類BaseDao： import java.sql.Connection; import java.sql.DriverManager; import java.sql.PreparedStatem

python將mysql表中資料抽取到另一個mysql庫中，持續更新抽取到oracle中

import MySQLdb import ConfigParser class Mysql2Mysql(object): def getConn(self,filename,dbname): cf = ConfigParser.ConfigPars

mysql中關於批量插入資料（1萬、10萬、100萬、1000萬、1億級別的資料）二

硬體：windows7+8G記憶體+i3-4170處理器+4核CPU 關於前天寫的批量插入資料，還有一種方式，就是通過預先寫入文字檔案，然後通過mysql的load in file命令匯入到資料庫，今天把這種方式也說一下，首先是main方法呼叫：解釋一下為什麼要兩個引數：第一個引

快速匯入100萬條Excel資料到MySql

因業務需要,將100萬條Excel資料匯入MySql OS : CentOS7 , MySql 5.7 做了2個純命令匯入測試,不考慮phpmyadmin,navicate匯入. 首先MySql調整全域性變數 set max allowed packet =104857600 (

python 統計MySQL大於100萬的表

一、需求分析

二、統計表的行數

寫入json檔案

三、寫入excel中

相關推薦