部落格資料庫要連線Elasticsearch，使用MySQL還是MongoDB更合理

阿新 • • 發佈：2021-02-28

若進行部落格等文字類資料的讀寫以及專業搜尋引擎的連線的解決方案對比，可以肯定的下結論：MongoDB的解決方案中要遠遠好於MySQL的解決方案。 # 一、從開發工序角度 **MySQL的文章讀寫方式** **方式一：**文章標題、作者、標籤、時間和內容存關係表，圖片存OSS，地址存關係表 ![file](https://img2020.cnblogs.com/other/497767/202102/497767-20210228202607726-1817612985.png) 上述方式因為OSS和MySQL沒有事務關係，因此需要編輯文章過程中儲存圖片和儲存草稿都是分開設計，後臺寫入是分開執行，查詢過程更適合前端非同步獲取圖片，另外OSS需要額外的訪問授權。最最關鍵的問題是OSS收費！ **方式2：**文章標題、作者、標籤、時間和內容存關係表，圖片存本地，地址存關係表，Nginx作為圖片查詢代理 ![file](https://img2020.cnblogs.com/other/497767/202102/497767-20210228202608143-1503423438.png) 上圖中實線為寫入過程，虛線為查詢過程。寫入本地檔案的過程依然無法保證事務，因此仍需要後臺分開執行，查詢過程Nginx的業務授權非常麻煩，需要引入Openresty和授權伺服器的對接，而且檔案的儲存存在檔案數超過作業系統最大限制的可能，圖片缺乏可靠性備份機制。唯一的好處就是圖片儲存本地不用額外付費。 **我們再看看MongoDB文章讀寫方式** ![file](https://img2020.cnblogs.com/other/497767/202102/497767-20210228202608449-1176484551.png) 如上圖**方式一**：整存整取，MongoDB可以將文章標題、作者、標籤、時間和內容，圖片存在一個集合中，那麼圖片為BSON格式，形成整存整取，若文章+圖片的完整文件不超過16M，是BSON比較合適。若文件因為圖過大，超過16M，就使用**方式二**，使用MongoDB提供的GridFS外掛存取。 **方式一：**從開發工序上最簡單，但不適合太大圖片，導致文件整體超過16M。 **方式二：**相當於需要訪問不同的MongoDB資料庫，從程式碼複雜度上就要更高，而且一致性控制不如方式一好。其他優勢：這兩種方式都可以得到MongoDB的統一訪問控制保護。這兩種方式都使圖片通過副本集實現可靠性備份。但最最關鍵的是沒有MySQL變扭的超出技術範圍的架構考慮，到底用OSS要收費，還是用Http代理的免費模式，容忍可靠性、複雜性及安全性問題超級大的情況。 # 二、從效能角度看 **1、文章插入效能** 從目前MongoDB4實測情況看，給定時間段內資料寫入量級越大，MongoDB的完成時間就比MySQL的完成時間越短。因此部落格網站平臺或者部落格爬蟲系統，寫入的資料量特別大的情況下，MongoDB可以提供更優越的負載能力。 **2、伸縮性** MongoDB和MySQL都可以進行資料庫級的記憶體快取，但是MongoDB可以將文件最大可能的快取在記憶體中，得到最優的效能表現。若記憶體不夠的情況出現就會溢位到磁碟中，那麼效能就會減弱，這個時候可以通過水平分割槽實現，更好的記憶體表現。 MySQL的分片必須通過自研或引入第三方的分片應用實現手動分片，即一張資料表遷移到不同MySQL庫中，按照資料記錄進行分表，最終達到分片應用對多庫實現負載均衡的目的，這種方式的缺點就是實現分片的過程非常複雜和麻煩。 MongoDB的分片屬於其核心架構之一，也是NoSQL天然所擅長的能力，因此MongoDB可以在使用者不干預的情況下實現集合分片，這比MySQL的手動分片不知道要輕鬆多少。 ![file](https://img2020.cnblogs.com/other/497767/202102/497767-20210228202609358-1384828972.png) 上圖中Mongos路由器作為介面，連線整個叢集，將所有的讀寫請求指引到合適的分片上，配置伺服器持久化分片叢集的元資料，以及資料在分片之間進行遷移的歷史資訊，而且配置伺服器本身也是高可靠的。 # 三、與Elasticsearch連線角度看 **MySQL連線Elasticsearch** 一種方式可以通過CDC（資料變更捕獲）工具抓取binglog到Kafka，再由Kafka管道輸出到Elasticsearch 另一種方式通過JDBC輪詢資料庫，再推送Elasticsearch ![file](https://img2020.cnblogs.com/other/497767/202102/497767-20210228202609659-1519773782.png) 第一種方式在引入CDC抓取工具，例如debezium後，會讓整個流程非常複雜，經歷的環節過多，仍要控制好Kafka的按鍵分割槽和摺疊模式，資料管道也要解決關係結構向文件結構的ETL過程。當然方式一也可以不用Kafka，直接走Logstash管道的過濾通道，但是第三方CDC抓取工具就要再考慮一層與Logstash的對接過程。第二種方式雖然簡單，不過JDBC輪詢對MySQL有不小的影響，而且業務表需要提供變化日誌表，再有Logstash等清洗程式再做ETL合併同步，這個過程也不容易。 **我們再看MongoDB連線Elasticsearch** 通過mongo-connector可以輕鬆實現MongoDB到Elasticsearch的資料實時同步 ![file](https://img2020.cnblogs.com/other/497767/202102/497767-20210228202609958-1095171984.png) mongo-connector通過監聽Oplog，非常類似MySQL CDC工具對binglog的監聽，實時對資料進行採集並直接同步到Elasticsearch中，因為MongoDB和Elasticsearch都是無模式的文件型資料庫，因此ETL過程可以由mongo-connector工具實現MongoDB集合向ES索引的無縫寫入，會省去ETL過程很大的麻煩。 # 四、總結從上面的架構描述上，其實已經強有力的論證了MongoDB無論作為儲存文件型的部落格文章也好，還是與其他專有搜尋引擎同步也好，相對於MySQL，是更好的解決方案。 > 我們是“讀位元組”技術專家團隊，感謝您的關注！ [讀位元組官網](http://www.readby

部落格資料庫要連線Elasticsearch，使用MySQL還是MongoDB更合理

若進行部落格等文字類資料的讀寫以及專業搜尋引擎的連線的解決方案對比，可以肯定的下結論：MongoDB的解決方案中要遠遠好於MySQL的解決方案。 # 一、從開發工序角度 **MySQL的文章讀寫方式** **方式一：**文章標題、作者、標籤、時間和內容存關係表，圖片存OSS，地址存關係表 ![file

【二喵君的部落格】要一個完成，不要千萬個開始

巨佬在身邊賊厲害的多肉隊友：https://blog.csdn.net/wentong_Xu 神仙大隊長：https://blog.csdn.net/u011815404 萬能的餅：http://www.bycore.net/ 人美心善四次元大佬：https://w

arcgis10.0以後版本，已知座標，生成shp檔案 ---經驗證，此部落格記錄步驟較繁瑣，ArcGIS Desktop有更簡單的方法

arcgis10.0以後版本沒有Write Features To Text File，Create Features From Text File首先要生成這兩個工具，參考連結如下：http://wenku.baidu.com/link?url=3-WqIKo00_KbG9

網站出現資料庫連線失敗，mysql 2003錯誤(10061) 的解決方法

這幾天有一臺MySQL資料庫伺服器出現了頻繁的掉線情況，通過排查，並沒有排查出哪個網站被攻擊，百思不得其解中的時候，群裡有個朋友說是因為微軟KB967723造成的，網上搜索了一下，果然很多人都是這樣的問題，都是windows系統下安裝的MySQL造成的網上一共提供了兩種方法：第一種：解除安裝KB967

簡易部落格資料庫，並進行簡單操作

建立簡易部落格資料庫create database blogdb; create table users( id int unsigned not null primary key auto_increment, name varchar(32) null uniq

python爬蟲設計刷部落格訪問量（刷訪問量，贊，爬取圖片）

分享一下我老師大神的人工智慧教程！零基礎，通俗易懂！http://blog.csdn.net/jiangjunshow 也歡迎大家轉載本篇文章。分享知識，造福人民，實現我們中華民族偉大復興！

Python爬蟲，看看我最近部落格都寫了啥，帶你製作高逼格的資料聚合雲圖

今天一時興起，想用python爬爬自己的部落格，通過資料聚合，製作高逼格的雲圖(對詞彙出現頻率視覺上的展示)，看看最近我到底寫了啥文章。 1.1 爬取文章的標題的聚合 1.2 爬取文章的摘要的聚合 1.3 爬取文章的標題+摘要的聚合我

【CSDN部落格之星】2013年CSDN部落格之星正在評選，希望大家支援投票，非常感謝

深入貫徹落實《關於積極響應中央號召堅決實行錯誤收集部落格的通知》精神，共建和諧繁榮OI圈(Last update 11/16)

深入貫徹落實《關於積極響應中央號召堅決實行錯誤收集部落格的通知》精神，共建和諧繁榮OI圈每天倒映在眼中的風景正在應接不暇的轉變這是我們,未曾經歷的青春注意本文釋出後，原來部落格裡的《錯題集》一文將會同步刪除，以後會實時更新附件內容通知

【mark】CSDN部落格訪問突破50萬，MARK一下

DATE:2018.12.16 或許總有一些事值得被記住，總有一些人值得被銘記！不管歷經多少歲月，那些人那些事依舊曆久彌新。今天，公元2018年12月16日，普通的一天，我的CSDN部落格訪問量超過50萬！不知不覺中，堅持寫部落格已經2年多了，希望可以一直堅持下去。在這裡

部落格園設定版權說明，自動新增文章連結

改編自：https://www.cnblogs.com/gzdaijie/p/5187171.html 功能： 1.給每一篇文章開頭加上版權說明； 2.自動獲取地址。 <script type="text/javascript"> var setMyBlog = {

【部落格搬往 http://begtostudy.cnblogs.com】請不要在這個部落格發表評論，抗議CSDN隨意刪除我部落格元件和博文，廢棄部落格不再回復！

Dr. Ing. 白途思（Begtostudy）微訊號：Begtostudy QQ：370566617 Email: [email protected] 點選這裡給我發郵件工作單位：上海航天技術研究院身份：上海交通大學工學博士校內名片

簡單程式碼爬取部落格超連結的文字，並且去除字元“原”和空格

這裡給大家分享一個怎麼用Python爬取超連結的文字，並且能夠去除字元“原“和前後空格、空行等等。這個程式碼不多，而且非常簡單。我這裡用的是Python3，版本不和的可以調整一下，這個程式碼還是很好理解的。接下來我給大家分享爬取我的部落格超連結

送人玫瑰，手留餘香，如果本部落格幫助到你了，幫忙點開本篇投上一票

送人玫瑰，手留餘香，如果本部落格幫助到您了，幫忙點開本篇，為我投上一票，謝謝，2019年，我們相約，繼續加油！而選擇投票的您，也將有機會獲得免費開跑車的機會。請選擇第4位候選人：004 Soyoger 投票即可。投票地址：https://bs

麥克周的技術部落格(微訊號：michael_tec)，保持軟體工匠心態

清空Shared pool: alter system flush shared_pool; 但為了整個記憶體的清空，只好將整個Oracle RAC環境的例項和資料庫都關機，再重新啟動。可以採用清空buffer cache的方式來做： alter system flush

Kemin | 本部落格只發技術內容，更多在sugeladi.net/kemin

嵌入式開發實作（Linux核心編譯及安裝） KEY:Linux 核心編譯核心配置嵌入式核心配置（Kernel configuration） Makefile版本修改為了區別基於同一原始碼構建（bulid）的不核心映象，可使用變數EXTRAVERSION（定義位於

此部落格停止維護和更新，已轉移https://github.com/ilvseyinfu/blog

14 + 16 單選+不定項感覺選擇考的還是比較基礎的，cookie / 本地儲存 / 網路協議 / CSS3新特性 / HTML5新元素剩下的記不起來了，對了還考了Vue和react 程式設計題2道，第二道沒時間看了，剛開始還覺得時間很充裕，然後就卡到第一道程式設計

讀大神的部落格後對於position:absolute，position:fixed的總結

1、沒有定義值得absolute和float一樣，是脫離文件流的 eg: .image{position:absolute;width:50px;height:50px;} .box2{paddin

CSDN 官方部落格（歡迎加入部落格 QQ 群：374041348，加群請註明 CSDN 部落格地址。）

這些年，我們讀過的技術經典圖書極限程式設計創始人Kent Beck說過“每個有思想的軟體開發人員，書架上都應該有這樣一本書”，你的書架上又都有些什麼書呢？CSDN眾博主們用一起分享了自己學程式設計過程中讀過的技術經典。

【nzf_001的專欄nzf_001的專欄nzf_001的專欄nzf_001的專欄nzf_001的專欄】歡迎加入部落格 QQ 群：631873947，加群請註明 CSDN 部落格地址。歡迎加入部落格 QQ 群：631873947，加群請註明 CSDN 部落格地址。

歡迎加入部落格 QQ 群：631873947，加群請註明 CSDN 部落格地址。歡迎加入部落格 QQ 群：631873947，加群請註明 CSDN 部落格地址。歡迎加入部落格 QQ 群：631873947，加群...

部落格資料庫要連線Elasticsearch，使用MySQL還是MongoDB更合理

相關推薦