Java jdbc批量多執行緒讀取CVS檔案入庫效能優化篇

阿新 • • 發佈：2018-12-29

在寫完上一篇文章之後，在使用過程中慢慢發現一些問題，比如說資料入庫很慢，10W的資料分10個檔案入庫大概需要兩三分鐘，如下圖
這裡寫圖片描述
這是我忍受不了的，所以我尋思著如何優化該程式，提高入庫效能。因此我對JDBC資料入庫的幾種方法做了一個對比，在大量的實驗下，發現瞭如下的規律：

1、使用statement耗時最長;
2、使用PreparedStatement耗時明顯縮短;
3、使用PreparedStatement + 批處理耗時暫時耗時最少。

針對我的小程式，入庫的表所需要的欄位有上百個，我懶得去拼字串，於是就選擇Statement+批處理來處理，關鍵程式碼如下：

if(conn == null 
) {
     conn = dbutil.getConnection();
}
pre = conn.createStatement();
conn.setAutoCommit(false);

while (line_record != null) {
    if(line_record.indexOf("cdrid") != -1) {
        line_record = buf.readLine();
        continue;
    }
    // 解析每一條記錄
    sql = "INSERT IGNORE INTO " + tablename + " VALUES('" 
;

    String[] fields = line_record.split(DELIMITERS);

   //對Insert語句的合法性進行判斷
   if(fields.length != colCount){
       line_record = buf.readLine();
       System.out.println("要插入的資料列數和表的資料列不相匹配，停止執行");
       continue;
   }

   for (int i = 0; i < fields.length; i++) {
       sql += fields[i];
       if 
 (i < fields.length - 1) {
           sql += "','";
       }
   }

   sql += "');";

   // 在控制檯輸出SQL語句
//                System.out.println(sql);

   //執行SQL語句
   pre.addBatch(sql);

   rowCount++;
   line_record = buf.readLine();

   if (rowCount >= rc) {
       break;
   }

 }

pre.executeBatch();
conn.commit();
pre.close();

然而程式入庫的效率並沒有顯著的提高，最後，我在批量執行500條Sql的時候提交一次，程式碼如下：

if(rowCount % 500 == 0) {
   pre.executeBatch();
    conn.commit();
//  pre.clearBatch();
}

這裡的數字是自己定的，根據Java虛擬機器大小來設定不同的值，這裡的clearBatch()執行不執行都可以，在設定為100的時候，效率如下：
這裡寫圖片描述

回顧本文最開始10W條資料分十個檔案入庫，效率明顯提升了不少。

Java jdbc批量多執行緒讀取CVS檔案入庫效能優化篇

在寫完上一篇文章之後，在使用過程中慢慢發現一些問題，比如說資料入庫很慢，10W的資料分10個檔案入庫大概需要兩三分鐘，如下圖這是我忍受不了的，所以我尋思著如何優化該程式，提高入庫效能。因此我對JDBC資料入庫的幾種方法做了一個對比，在大量的實驗下，發現瞭

Java多執行緒讀取大檔案

前言　　今天是五一假期第一天，按理應該是快樂玩耍的日子，但是作為一個北漂到京師的開發人員，實在難想出去那玩耍。好玩的地方比較遠，近處又感覺沒意思。於是乎，閒著寫篇文章，總結下昨天寫的程式吧。　　昨天下午朋友跟我聊起，他說有個需求，需要把上G的txt檔案讀取寫入到資料庫。

java中多執行緒讀取同一個檔案的不同位置，多執行緒讀取檔案

今天遇到一個問題，需要多個執行緒讀取同一個檔案的不同位置，提高效率，寫程式碼驗證了一下，把結果記錄下來。首先我們寫個檔案，然後多執行緒讀取，以下是我實驗的程式碼： package com.alibaba.middleware.race; im

多執行緒讀取日誌檔案

import com.cndatacom.service.ServiceOrderLogService; import org.slf4j.Logger; import org.slf4j.LoggerFactory; import org.springframework.b

Java 大文字多執行緒高效讀取

本文介紹 Java多執行緒讀取大檔案效能提升的高效方案。前沿我們在讀取一個正常檔案的時候，將使用，BufferedReader.read() 的三種方法： BufferedReader.read() 單位元組，這個效率最低，基本不考了 BufferedReader.

Java基礎、Java集合、多執行緒、JDBC、HTTP、JSP、Servlet、Struts面試題彙總（附答案）

[Java基礎] 1.”==”和equals方法有什麼區別？答：==是運算子，equals是方法，方法可以通過重寫改變其行為，如String的equals就是比較字串內容。 2. switch語句能否作用在byte上，能否作用在long上，能否作用在String上？

QT中使用GDAL多執行緒讀取遙感影象到QImage

GDAL 是一個很強大的可以讀取很多格式的帶有GIS資訊的柵格型影象。前陣子專案中需要讀取遙感影象，並顯示到QT介面，由於遙感影象一般很大，所以採取新開一個讀圖執行緒的方式來讀取，防止介面假死。下面是程式碼共享，測試通過讀取500MB的24000*24000畫素GeoTiff圖並在QT的QGr

【Java筆記】多執行緒實現簡單的非同步運算

實現Callable介面，重寫call（）方法，使操作執行緒池時能帶有返回值的效果： import java.util.concurrent.Callable; public class GetSumCallable implements Callable<Integer> {

Java中的多執行緒你只要看這一篇就夠了（轉）

引如果對什麼是執行緒、什麼是程序仍存有疑惑，請先Google之，因為這兩個概念不在本文的範圍之內。用多執行緒只有一個目的，那就是更好的利用cpu的資源，因為所有的多執行緒程式碼都可以用單執行緒來實現。說這個話其實只有一半對，因為反應“多角色”的程式程式碼，最起碼每個角色要給他一個執行緒吧，否

java核心技術-多執行緒基礎

程序、執行緒程序(Process) 是程式的執行例項。例如，一個執行的 Eclipse 就是一個程序。程序是程式向作業系統申請資源(如記憶體空間和檔案控制代碼)的基本單位。執行緒(Thread)是程序中可獨立執行的最小單位。一個程序可以包含多個執行緒。程序和執行緒的關係，好比一個營業中的飯店與其正在工

Java建立一個多執行緒的三種方式

步驟一：執行緒概念首先要理解程序(Processor)和執行緒(Thread)的區別程序：啟動一個LOL.exe就叫一個程序。接著又啟動一個DOTA.exe，這叫兩個程序。執行緒：執行緒是在程序內部同時做的事情，比如在LOL裡，有很多事情要同時做，比如"蓋倫” 擊殺“

java 產生紅包多執行緒

import java.util.HashMap; import java.util.HashSet; import java.util.LinkedList; import java.util.List; import java.util.Map; import java.util.Optiona

JAVA複習之多執行緒

java中多執行緒同步是什麼？在多執行緒程式下，同步能控制對共享資源的訪問。如果沒有同步，當一個java縣城在修改一個共享變數時，另外一個執行緒正在使用或者更新同一個變數，這樣容易導致程式出現錯誤。解釋實現多執行緒的幾種方法？區別是什麼？ Java執行緒可以實現Runnable介面或

Java基礎之多執行緒及併發庫

實際上關於多執行緒的基礎知識，前面自己已經總結過一部分，但是每一個階段對於同樣知識點的學習側重點是不一樣的，前面的Java基礎總結八之多執行緒（一）和 Java基礎總結九之多執行緒（二）是對JDK5以前多執行緒相關基礎知識的一個簡單總結，今天本文將偏重於JDK5提供的併發庫進行學習總結。首先，

java學習筆記-多執行緒程式設計模擬十個人過山洞

編寫多執行緒應用程式，模擬多個人通過一個山洞的模擬。這個山洞每次只能通過一個人，每個人通過山洞的時間為5秒，隨機生成10個人，同時準備過此山洞，顯示一下每次通過山洞人的姓名。使用執行緒同步，把山洞看做臨界資源，五秒內只允許一個人來訪問。 class cave { p

JAVA高併發多執行緒必須懂的50個問題

ImportNew 首頁所有文章資訊Web架構基礎技術書籍教程Java小組工具資源 Java執行緒面試題 Top 50 2014/08/21 | 分類：基礎技術 | 27 條評論 | 標籤：多執行緒, 面試題分享到： 692 本文由

【OS大作業】用多執行緒統計txt檔案中字元個數（Java實現）

問題描述給定一個txt檔案，利用不同個數的執行緒查詢檔案中某字元的個數，探究執行緒個數與查詢時間的關係。本作業程式碼使用JAVA實現，版本為10.0.2，使用的IDE為Eclipse4.9.0. 結果測試所用的txt檔案內容為英文，編碼格式為UTF-8。原始碼第一版程式碼：（

java併發和多執行緒

volatile—保證可見性、禁止指令重排序，不保證原子性出於執行速率的考慮，java編譯器會把經常訪問的變數存放在快取，直接從快取中讀取變數，多執行緒下記憶體與快取不一樣 volatile不會被快取到暫存器，多執行緒下可見使用條件：只有單個執行緒更新變數的值該變數不與

黑馬程式設計師----Java基礎之多執行緒

------- <a href="http://www.itheima.com" target="blank">android培訓</a>、<a href="http://www.itheima.com" target="blank">java培訓</a&g

java 如何使用多執行緒呼叫類的靜態方法？

1.情景展示　　靜態方法內部實現：將指定內容生成圖片格式的二維碼；　　如何通過多執行緒實現？ 2.分析　　之所以採用多執行緒，是為了節省時間 3.解決方案　　準備工作　　logo檔案　　　將生成的檔案儲存在F

Java jdbc批量多執行緒讀取CVS檔案入庫效能優化篇

相關推薦