1. 程式人生 > >10倍以上提高Pentaho Kettle的MySQL寫入速度

10倍以上提高Pentaho Kettle的MySQL寫入速度

使用Pentaho Kettle做了個數據抓取入庫的程式,大致這個樣:



    使用文字調測的時候,速度大概7500條/秒,但是換上資料庫後,速度只有150條/秒,對於20萬左右的資料入庫要超過20分鐘,這讓人沒法接受。

   使用批量插入好像也沒什麼效果,依然慢



 求助Google,找到了2個參考:

描述的基本一致,根據參考調整了連線引數:

Java程式碼 複製程式碼 收藏程式碼
  1. useServerPrepStmts=false
  2. rewriteBatchedStatements=true
  3. useCompression=true
useServerPrepStmts=false
rewriteBatchedStatements=true
useCompression=true

  資料寫入速度馬上提升到2300條/秒左右,開3個執行緒,寫入速度就與文字寫入差不多了。

  也算寫了很長時間的程式碼,使用Kettle也算有一段時間,一般只是關注Tranaction如何實現功能,對連線引數可以說基本不關注,但這樣的速度提升擺在面前,不熟悉這些效能引數,要想提高效能還真的不容易,寫出來也是希望碰到相同問題時能有點參考,因為使用百度,完全搜尋不到^_^,寫點中文的,希望能被收錄

相關推薦

10以上提高Pentaho Kettle的MySQL寫入速度

使用Pentaho Kettle做了個數據抓取入庫的程式,大致這個樣:     使用文字調測的時候,速度大概7500條/秒,但是換上資料庫後,速度只有150條/秒,對於20萬左右的資料入庫要超過20分鐘,這讓人沒法接受。    使用批量插入好像也沒什麼效果,依然慢  求

RedisCluster-Pipeline操作,提升10以上響應速度

本文中的程式碼來自我正在寫的分散式快取框架(主要解決快取使用中的各種痛點:快取穿透\redis-cluster pipeline\註解使用等等)。 什麼是pipeLine 為什麼使用pipeLine ? 管道(pipeline)將客戶端 client 與

Mysql換種寫法速度提高10

t_house 表有 4萬多條資料,現在僅僅只要查詢10條 原先的sql語句是: select h.*, u.* from t_house h left join t_user u on u.id = h.user_id order by h.create_t

如何提高Pentaho Kettle的MySQL寫入速度

轉載自:https://blog.csdn.net/smooth00/article/details/69389424使用Kettle的初期,一般只是關注Tranaction如何實現功能,對連線引數可以說基本不關注,其實這裡面隱含一些效能問題,如果不熟悉這些效能引數,要想提高

MySQL之按月拆分主表並按月分表寫入數據提高數據查詢速度

tom auto begin rda rim 日期 pre tran create 使用場景: 主表數據量特別大,為了提高查詢的速度,可以考慮按月進行分表,要求就是當月的數據到當月表查詢,上月的數據到上月表查詢,當天的數據到主表來查詢。這樣在一定程度上也是提高了數據的查詢速

扎克伯格的26張PPT,提高10工作效率

1、時間常有,時間在於優先。 2、時間總會有的:每天只計劃 4~5 小時真正的工作。 3、當你在狀態時,就多幹點;不然就好好休息:有時候會連著幾天不是工作狀態,有時在工作狀態時卻又能天天忙活 12 小時,這都很正常的。 4、重視你的時間,並使其值得重視:你的時間值 10

2018.10.9 上線發現elasticsearch寫入速度超級慢,原來罪魁禍首是阿里雲服務的OSS的鍋

問題描述: 按照專案計劃,今天上線部署日誌系統(收集線上的所有日誌,便於問題排查)。 運維按照以前的部署過程,部署elasticsearch,部署結束之後,通過x-pack的monitor發現elasticsearch的索引速度只有幾百/秒的索引速度,遠遠小於同樣的配置,沒有做優化的另一個es叢集

學會這幾個搜尋技巧,你的效率將提高 10

我之前有一篇許岑的課程筆記(如何有效訓練你的研究能力)中提到過下面這句話:「研究在英文中叫 research,search 就是搜尋的意思,勤於搜尋,才適合做研究。」 很多新手總是喜歡問別人簡單的問題,其實沒有自己搜尋過就去問別人問題對你的研究能力基本沒有提升。我剛畢業的時候我

印度決心提高LCA戰機生產速度 建新廠房產量擬翻

“90後”女大學生放棄北大保送復旦!她到底有多厲害?  東北網12月6日訊(記者 姜姍姍) 在東北農業大學有這樣一個自強不息的女大學生,她放棄北大直博被保送到復旦大學藥學院。她本科期間獲得國家獎學金、國家勵志獎學金、新東方自強獎學金、第一屆全國大學生生命聯賽國家二等獎……被評為黑龍江省“三好學生”。她就是生命

python pip源更換國內映象,速度加快10

python安裝第三方模組,更換為國內的資源 python的伺服器是在國外的,所以我們pip安裝pyqt5之類的模組時就很慢了 下面就介紹了一些國內的 阿里雲 http://mirrors.aliyun.com/pypi/simple/ 中國科技大

下單介面調優實戰,效能提高10

概述 最近公司的下單介面有些慢,老闆擔心無法支撐雙11,想讓我優化一把,但是前提是不允許大改,因為下單介面太複雜了,如果改動太大,怕有風險。另外開發成本和測試成本也非常大。對於這種有挑戰性的任務,我向來是非常喜歡的,因為在解決問題的過程中,可以學習到很多東西。

【京緣網路電商系統】下單介面調優實戰過程公開 效能提高10

對於我們公司定製的電商系統,客戶反映最近下單介面有點慢心無法支撐雙12(好像是雙十一搞了場超大的垮了),現在想讓我優化一把,但是前提是不允許大改,因為下單介面太複雜了,如果改動太大,怕有風險。另外開發成本和測試成本也非常大。對於這種有挑戰性的任務,我向來是非常喜歡的,因為在解決問題的過程中,可以

彙總:將Web應用效能提高1010條建議

提高 web 應用的效能從來沒有比現在更重要過。網路經濟的比重一直在增長;全球經濟超過 5% 的價值是在因特網上產生的(資料參見下面的資料)。這個時刻線上的超連線世界意味著使用者對其的期望值也處於歷史上的最高點。如果你的網站不能及時的響應,或者你的 app 不能無延時的工作,使用者會很快的投奔到你的

配置這幾個引數,提高mysql寫入速度

如 果用Innodb,那麼這是一個重要變數。相對於MyISAM來說,Innodb對於buffer size更敏感。MySIAM可能對於大資料量使用預設的key_buffer_size也還好,但Innodb在大資料量時用預設值就感覺在爬了。 Innodb的緩衝池會快取資料和索引,所以不需要給系統的快取留空間

Bminer 10.6.0 大幅度提升挖礦速度,如1080ti上,不超頻即可達4650以上 sol/s。

10.6.0 — 顯著增加常用挖礦N卡的BTM挖礦速度,如1080ti上,不超頻即可達4650以上 sol/s。 不超頻的情況下,BTM挖礦的算力: 在 GTX 1080Ti 上可執行4650以上 H/s 在 GTX 1070 上可執行2850 H/s 在

今天很有成效,程式碼優化,效能提高了近10

beanutil的效能是我們的系統的效能瓶頸,雖然,我們的平臺已經固化,我們只能不改變現有結構的方式下進行優化,但是,優化的空間還是很大的。經過優化,我們的系統性能提高超過了一倍。 這是我們優化前和優化後的執行效率比較 (優化前方法buildVO佔據了整個請求的59.6%

比Gson解析速度10!——Json解析神器Jackson使用介紹

    在前面的兩篇文章中,我們介紹了Json資料格式和系統自帶Json以及Google的Gson專案,如果能學會這些東西,基本能滿足工作需求了。但是,程式設計師都有追求極致效率的嗜好,在滿足了基本需求之後,我們會考慮能不能再優化一下效率呢?當然!今天這篇文章要介

阿里雲elasticsearch實踐(最大限度提高寫入速度

ES學習文件 如果英文文件閱讀有困難,參考:Elasticsearch: 權威指南,但是中文文件有滯後性,比如目前es已經到6.X版本,而中文文件以2.X版本為基礎,因此對於新版本的話會有部分不適用。 參考部落格:銘毅天下 使用阿里雲 elastics

提高Kettle的MySQL寫入速度

本文mysql資料庫安裝在樹莓派上1 適當加大defaultFetchSize能提高ETL速度,大概10%2 修改引數useCompression=true樹莓派插入效能暴漲10倍下文是轉載內容使用Kettle的初期,一般只是關注Tranaction如何實現功能,對連線引數可

掌握這些PPT技巧,讓你的工作效率提高10

點擊 不知道 src 同事 方法 text 快速 分享 type 大家平時在辦公中是不是經常聽到有很多同事說PPT很難繪制呢?熟練的人們只要花一個小時就可以將一份精美的PPT就繪制好了,而我們要花費一上午甚至一天才能將其繪制好,做的慢就算了,做出來的效果還不忍直視,是不是很