python 字典查詢提速的小技巧

阿新 • • 發佈：2020-12-18

考慮一個問題：一個python的字典，有1000萬個key-value對，新插入1000對鍵值對，怎麼速度才最快

自己測試了一部分程式碼，慢速的要300秒，加速的只要0.3秒，原因是慢速的程式碼每次查詢非常費時，

if k in C14.keys()可能是這句話的問題，
改進後使用

defaultdict（int）方法提速！不要用dict()初始化方法了...

原始程式碼：極其慢（尤其是原始字典很大的時候）

#test slower code
import pandas as pd
import pickle
from collections import Counter
import os
from tqdm import 
 tqdm
import time
from collections import defaultdict

C14 = dict() #注意這裡沒有用defaultdict
for i in tqdm(range(10000000)):
    C14[i] = i

print("start processing test data:")
s_time = time.time()


data = pd.read_csv('../../test.gz')
print("read test.gz over")

print("start to process C14:")
s_tt = time.time()

C14_list  
= data['C14'].values  #data是dataframe格式，data['C14'].values相當於一個list，比如[42,523,23,24,3,4,1,5,3]
for k,v in tqdm(Counter(C14_list).items()):

　　if k in C14.keys():  #判斷所消耗的時間很長
         C14[k] += v
　　else:
         C14[k] = v
        
e_tt = time.time()
print("C14 over,cost time:{} seconds".format(e_tt-s_tt))
            
    

e_time  
= time.time()
print("test data processing over, cost {} minutes".format((e_time-s_time)/60))

改進後的程式碼：極快

#test code
import pandas as pd
import pickle
from collections import Counter
import os
from tqdm import tqdm
import time
from collections import defaultdict

C14 = defaultdict(int)   #使用python的defaultdict方法，意思是，如果key[value]的value不存在時，預設value值是int的0
for i in tqdm(range(10000000)):
    C14[i] = i

print("start processing test data:")
s_time = time.time()

data = pd.read_csv('../../test.gz')
print("read test.gz over")

print("start to process C14:")
s_tt = time.time()

C14_list = data['C14'].values
for k,v in tqdm(Counter(C14_list).items()):
    C14[k] += v
#下面四行話可以全部註釋掉了
     #if k in C14.keys():  
         #C14[k] += v
     #else:
         #C14[k] = v
        
e_tt = time.time()
print("C14 over,cost time:{} seconds".format(e_tt-s_tt))
            
    
e_time = time.time()
print("test data processing over, cost {} minutes".format((e_time-s_time)/60))

python 字典查詢提速的小技巧

考慮一個問題：一個python的字典，有1000萬個key-value對，新插入1000對鍵值對，怎麼速度才最快

使用Python操作MySQL的小技巧

1、獲取插入資料的主鍵id import pymysql database = pymysql.connect( host=\"127.0.0.1\",port=3306,user=\"root\",password=\"root\",database=\"test\"

python基礎教程使用Python操作MySQL的小技巧

更多python教程請到：菜鳥教程https://www.piaodoo.com/ 1、獲取插入資料的主鍵id import pymysql

Python字典查詢效能

timeit.repeat timeit.repeat預設會執行3輪，每輪執行1000000次。返回每輪的總執行時間列表

Python字典新增，刪除，查詢等相關操作方法詳解

一、建立增加修改 1、實現程式碼 #建立 stu_info = { \"xiedi\":28,\"liuhailin\":27,\"daiqiao\":30,\"hanwenhai\":25,\"chenqun\":38}

Python如何將影象音視訊等資原始檔隱藏在程式碼中(小技巧)

下午有同學Python學習群裡說，使用pyinstaller打包原始碼時，因為程式碼中使用了影象、音訊、視訊等資原始檔，無法將程式打包成單一的可執行檔案。有沒有方法將這些資原始檔按儲存在程式碼中呢？我想了一下，應該是可

Python中使用filter過濾列表的一個小技巧分享

有的時候使用dir(Module)，可以檢視裡面的方法，但是模組自帶的屬性\"__\"開頭的也會顯示，如下:

python使用小技巧總結1

1、合併兩個字典d1={\"a\":1,\"b\":3}d2={\"b\":2}print({**d1,**d2}) 結果為：{\"a\":1,\"b\":2}print(dict(d1.items()|d2.items()))結果為：{\"a\":1,\"b\":3}d1.update(d2) print(d1) 結果為：{\"a\":1,\"b\":2}

常用的10個Python實用小技巧

大家好，都說追女孩方法大於態度，學Python也是，今天就給大家分享的是我在用Python編寫程式時常用的一些小技巧。

【小技巧】python print方法重寫

print方法的引數 print方法的引數：（在python3的命令列執行help(print)就可以看到）

Python寫陰陽師指令碼帶GUI又是一個學習小技巧！

需要用到環境 Python3、 pycharm、天天模擬器、陰陽師。準備庫 pip install pyautogui pip install pywin32

Python關於使用dict的一些小技巧

上週組裡的同事分享了一些Python中使用dict的技巧，有一些自己之前也不太瞭解，在此分享一下。

python 提高開發效率的5個小技巧

很多時候學習是一種難者不會，會者不難的事情。下面的5個python技巧是價效比極高的知識點，一學就會，不難但是相當管用。

Python 製作查詢商品歷史價格的小工具

一年一度的雙十一就快到了，各種砍價、蓋樓、挖現金的口令將在未來一個月內充斥朋友圈、微信群中。玩過多次雙十一活動的小編表示一頓操作猛如虎，一看結果2毛5。浪費時間不說而且未必得到真正的優惠，雙十一電商的“

python 小技巧

1、F字串（F-Strings) name = \"eric\" age = 10 res = f\"hi my name is {name} i\'m {age} now\" print(res)

mybatis時間查詢小技巧

網上大多數使用mybatis查詢的時候都是把時間轉換成Date使用的，其實這裡時可以直接使用String的，比如

python小技巧——將變數儲存在本地及讀取

在用jupyter notebook寫python程式碼的過程中會產生很多變數，而關閉後或者restart jupyter kernel後所有變數均會消失，想要檢視變數就必須將程式碼重新再執行一遍，而想在另一個jupyter notebook中呼叫變數就更加麻

SQL小技巧一拼音首字母的模糊查詢

建立函式，把中文欄位翻譯成拼音縮寫，例如“你好”翻譯成“NH” SET ANSI_NULLS ON

python小技巧

#coding:utf-8# 知識點一：將2個字典合成一個字典dict1={\'小顏\':18,\'小小\':\"20\",\'小A\':48}dict2={\'小酒\':18,\"MM\":24,\'小小\':24}dict3={**dict1,**dict2,\'小米\':\'ss\'}print(dict3)dict3={**dict2,*

小技巧:用python迅速列印Java寫的Flink程式碼中的hive建表語句

技術標籤：Hive 假設我們想要用Flink對hive進行讀寫, 並且其中一段程式碼如下: //如果hive中已經存在了相應的表，則這段程式碼省略

python 字典查詢提速的小技巧

相關推薦