Python資料庫MongoDB騷操作
阿新 • • 發佈:2018-11-08
前言
最近這幾天準備介紹一下 Python 與三大資料庫的使用,這是第一篇,首先來介紹 MongoDB 吧,,走起!!
MongoDB GUI 工具
首先介紹一款 MongoDB 的 GUI 工具 Robo 3T,初學 MongoDB 用這個來檢視資料真的很爽。可以即時看到資料的增刪改查,不用操作命令列來檢視。
PyMongo(同步)
可能大家都對 PyMongo 比較熟悉了,這裡就簡單介紹它的增刪改查等操作。
連線
# 普通連線 client = MongoClient('localhost', 27017) client = MongoClient('mongodb://localhost:27017/') # # 密碼連線 client = MongoClient('mongodb://username:[email protected]:27017/dbname') db = client.zfdb # db = client['zfdb'] test = db.test 複製程式碼
增
# 增加一條記錄 person = {'name': 'zone','sex':'boy'} person_id = test.insert_one(person).inserted_id print(person_id) 複製程式碼 # 批量插入 persons = [{'name': 'zone', 'sex': 'boy'}, {'name': 'zone1', 'sex': 'boy1'}] result = test.insert_many(persons) print(result.inserted_ids) 複製程式碼
刪
# 刪除單條記錄 result1 = test.delete_one({'name': 'zone'}) pprint.pprint(result1) 複製程式碼 # 批量刪除 result1 = test.delete_many({'name': 'zone'}) pprint.pprint(result1) 複製程式碼
改
# 更新單條記錄 res = test.update_one({'name': 'zone'}, {'$set': {'sex': 'girl girl'}}) print(res.matched_count) 複製程式碼 # 更新多條記錄 test.update_many({'name': 'zone'}, {'$set': {'sex': 'girl girl'}}) 複製程式碼
查
# 查詢多條記錄 pprint.pprint(test.find()) # 新增查詢條件 pprint.pprint(test.find({"sex": "boy"}).sort("name")) 複製程式碼
聚合
如果你是我的老讀者,那麼你肯定知道我之前的騷操作,就是用爬蟲爬去資料之後,用聚合統計結合視覺化圖表進行資料展示。
aggs = [ {"$match": {"$or" : [{"field1": {"$regex": "regex_str"}}, {"field2": {"$regex": "regex_str"}}]}}, # 正則匹配欄位 {"$project": {"field3":1, "field4":1}},# 篩選欄位 {"$group": {"_id": {"field3": "$field3", "field4":"$field4"}, "count": {"$sum": 1}}}, # 聚合操作 ] result = test.aggregate(pipeline=aggs) 複製程式碼
例子:以分組的方式統計 sex 這個關鍵詞出現的次數,說白了就是統計有多少個男性,多少個女性。
test.aggregate([{'$group': {'_id': '$sex', 'weight': {'$sum': 1}}}]) 複製程式碼
聚合效果圖:( 秋招季,用Python分析深圳程式設計師工資有多高? 文章配圖)
Motor(非同步)
Motor 是一個非同步實現的 MongoDB 儲存庫 Motor 與 Pymongo 的配置基本類似。連線物件就由 MongoClient 變為 AsyncIOMotorClient 了。下面進行詳細介紹一下。
連線
# 普通連線 client = motor.motor_asyncio.AsyncIOMotorClient('mongodb://localhost:27017') # 副本集連線 client = motor.motor_asyncio.AsyncIOMotorClient('mongodb://host1,host2/?replicaSet=my-replicaset-name') # 密碼連線 client = motor.motor_asyncio.AsyncIOMotorClient('mongodb://username:[email protected]:27017/dbname') # 獲取資料庫 db = client.zfdb # db = client['zfdb'] # 獲取 collection collection = db.test # collection = db['test'] 複製程式碼
增加一條記錄
新增一條記錄。
async def do_insert(): document = {'name': 'zone','sex':'boy'} result = await db.test_collection.insert_one(document) print('result %s' % repr(result.inserted_id)) loop = asyncio.get_event_loop() loop.run_until_complete(do_insert()) 複製程式碼
批量增加記錄
新增結果如圖所暗示。
async def do_insert(): result = await db.test_collection.insert_many( [{'name': i, 'sex': str(i + 2)} for i in range(20)]) print('inserted %d docs' % (len(result.inserted_ids),)) loop = asyncio.get_event_loop() loop.run_until_complete(do_insert()) 複製程式碼
查詢一條記錄
async def do_find_one(): document = await db.test_collection.find_one({'name': 'zone'}) pprint.pprint(document) loop = asyncio.get_event_loop() loop.run_until_complete(do_find_one()) 複製程式碼
查詢多條記錄
查詢記錄可以新增篩選條件。
async def do_find(): cursor = db.test_collection.find({'name': {'$lt': 5}}).sort('i') for document in await cursor.to_list(length=100): pprint.pprint(document) loop = asyncio.get_event_loop() loop.run_until_complete(do_find()) # 新增篩選條件,排序、跳過、限制返回結果數 async def do_find(): cursor = db.test_collection.find({'name': {'$lt': 4}}) # Modify the query before iterating cursor.sort('name', -1).skip(1).limit(2) async for document in cursor: pprint.pprint(document) loop = asyncio.get_event_loop() loop.run_until_complete(do_find()) 複製程式碼
統計
async def do_count(): n = await db.test_collection.count_documents({}) print('%s documents in collection' % n) n = await db.test_collection.count_documents({'name': {'$gt': 1000}}) print('%s documents where i > 1000' % n) loop = asyncio.get_event_loop() loop.run_until_complete(do_count()) 複製程式碼
替換
替換則是將除 id 以外的其他內容全部替換掉。
async def do_replace(): coll = db.test_collection old_document = await coll.find_one({'name': 'zone'}) print('found document: %s' % pprint.pformat(old_document)) _id = old_document['_id'] result = await coll.replace_one({'_id': _id}, {'sex': 'hanson boy'}) print('replaced %s document' % result.modified_count) new_document = await coll.find_one({'_id': _id}) print('document is now %s' % pprint.pformat(new_document)) loop = asyncio.get_event_loop() loop.run_until_complete(do_replace()) 複製程式碼
更新
更新指定欄位,不會影響到其他內容。
async def do_update(): coll = db.test_collection result = await coll.update_one({'name': 0}, {'$set': {'sex': 'girl'}}) print('更新條數: %s ' % result.modified_count) new_document = await coll.find_one({'name': 0}) print('更新結果為: %s' % pprint.pformat(new_document)) loop = asyncio.get_event_loop() loop.run_until_complete(do_update()) 複製程式碼
刪除
刪除指定記錄。
async def do_delete_many(): coll = db.test_collection n = await coll.count_documents({}) print('刪除前有 %s 條資料' % n) result = await db.test_collection.delete_many({'name': {'$gte': 10}}) print('刪除後 %s ' % (await coll.count_documents({}))) loop = asyncio.get_event_loop() loop.run_until_complete(do_delete_many()) 複製程式碼
後記
MongoDB 的騷操作就介紹到這裡,後面會繼續寫 MySQL 和 Redis 的騷操作。盡請期待。