C# 大資料量List＜T＞去重複方法效率比較

阿新 • • 發佈：2021-10-20

大資料量List<T>中的資料根據多個屬性進行去重有多種方法，在資料量達到10萬以上時，各種方法效率有明顯的區別，這裡只列舉兩種方式：這裡以類Model為例建立List<Model>

 public class Model
    {
        public string Id { get; set; }
        public string Name { get; set; }
        public int Style { get; set; } 
    }

建立比較類（實現IEqualityComparer介面）,重寫Equals方法

public 
 class ModelComparer : IEqualityComparer<Model>
 {
     public bool Equals(Model x, Model y)
     {
         if (x.Id == y.Id && x.Name == y.Name)       
             return true;         
         else           
             return false;           
     }
 
     public int GetHashCode(Model obj)
     {
          
return 0;
     }
 }

使用時直接使用Distinct方法：

var lstTemp = lstOrigin.Distinct(new ModelComparer());

但是這種方式去重效率非常慢，20萬條資料能達到15-20分鐘，如果資料量較大又對效率有要求，那麼可以嘗試下面一種方法：

改進辦法

public class CommonEqualityComparer<T, V> : IEqualityComparer<T>
    {
        private Func<T, V> keySelector;

        public 
 CommonEqualityComparer(Func<T, V> keySelector)
        {
            this.keySelector = keySelector;
        }

        public bool Equals(T x, T y)
        {
            return EqualityComparer<V>.Default.Equals(keySelector(x), keySelector(y));
        }

        public int GetHashCode(T obj)
        {
            return EqualityComparer<V>.Default.GetHashCode(keySelector(obj));
        }
    }

    public static class DistinctExtensions
    {
        public static IEnumerable<T> Distinct<T, V>(this IEnumerable<T> source, Func<T, V> keySelector)
        {
            return source.Distinct(new CommonEqualityComparer<T, V>(keySelector));
        }
    }

使用時:

var lstTemp = lstOrigin.Distinct(p => (p.Id + p.Name)).ToList();

這種方法能將效率從15~20分鐘提高到5秒以內，雖然這種將兩個欄位字串相加作為比較引數的比較方法有些侷限，但是相比於前一種方式方式可以極大地提高效率。另也測試過在新建List後，在迴圈新增資料時通過list.Contains()的方法和通過Linq的方法去重效率都比較低，都與第一種方法時間相近，網上相關文章比較多這裡就不列舉了。

C# 大資料量List＜T＞去重複方法效率比較

C# List＜T＞的Contains, Exists, Any，Where效能對比

測試新建一個Person類 public class Person { public Person(string name,int id) { Name = name; Id = id;

詳解C# List＜T＞的Contains,Exists,Any,Where效能對比

測試新建一個Person類 public class Person { public Person(string name,int id) { Name = name; Id = id;

C#NPOI List＜T＞轉換成Excel，只需配置DisplayName註解！

文章目錄一、引入NPOl二、建立ExcelExportHelper公共類1.建立TestItem實體2.呼叫3.結果

SpringMVC List＜T＞ @NotEmpty @NotNull 入參校驗未生效

技術標籤：爬坑指南Java註解springmvcNotNull未生效場景描述 controller.java public CommonResponse<Boolean> save(@Valid @RequestBody List<CatalogDto> catalogDtos)

Java中List＜T＞和List＜?＞的區別詳解

一、簡介 <T>在List、Set、Map中經常見到，用來限制Class中的引數型別，確保Class中引數的一致性。例如：List<String> list = new ArrayList<>();建立了一個內部引數是String型別的類，list中的操

jdk8 List＜T＞根據某一個欄位去重

技術標籤：jdk8 新特性jdk8javastream petList = petList.stream().collect(Collectors.collectingAndThen(Collectors.toCollection(

list＜T＞ it報錯解決

技術標籤：C/C++ 報錯報錯原因 https://blog.csdn.net/pb1995/article/details/49532285 報錯程式碼

記錄fastjson轉換List＜T＞泛型失敗的解決方法

技術標籤：Java學習java 為了方便的接收多個介面返回的不同資料，我們可以通過定義泛型的方法，避免建立冗餘的程式碼。

java 較大資料量取差集,list.removeAll效能優化詳解

今天在優化專案中的考勤同步功能時遇到將考勤機中的資料同步到資料庫，兩邊都是幾萬條資料的樣子，老程式碼的做法差不多半個小時，優化後我本機差不多40秒，伺服器速度會更加理想。

c++ std標準庫演算法＜algorithm＞ min_element() max_element()求最大值最小值

技術標籤：# 4.1 C++c++algorithmmin_elementmax_element #include <functional> #include <iostream>

C# List＜string＞，List＜double＞，string互轉。

//【1】List<string>轉string List<string> list1=new List<string>(); list1.Add(\"a\");

Java使用POI匯出大資料量Excel

背景今天需要寫一個匯出的Excel的功能，但是發現當資料量到3萬條時，列數在23列時，記憶體溢位，CPU使用100%,測試環境直接炸掉。在本地測試時發現，匯出3000條左右的資料的時候，堆記憶體瞬間升高500M左右。然後發現

Java使用POI匯出大資料量Excel的方法

今天需要寫一個匯出的Excel的功能，但是發現當資料量到3萬條時，列數在23列時，記憶體溢位，CPU使用100%,測試環境直接炸掉。在本地測試時發現，匯出3000條左右的資料的時候，堆記憶體瞬間升高500M左右。然後發現了SX

java poi sax方式處理大資料量excel檔案

系統需要用到一個匯入excel檔案的功能，使用poi元件常規方式讀取excel時，記憶體耗盡，OutOfMemoryError,或者讀取非常慢

poi讀寫大資料量到excel記憶體溢位

　　使用poi寫excel，資料量超過幾萬時可能會記憶體溢位。可以參考下面的2篇文章來解決。

完美解決TensorFlow和Keras大資料量記憶體溢位的問題

記憶體溢位問題是參加kaggle比賽或者做大資料量實驗的第一個攔路虎。以前做的練手小專案導致新手產生一個慣性思維——讀取訓練集圖片的時候把所有圖讀到記憶體中，然後分批訓練。

Java實現excel大資料量匯入

本文例項為大家分享了Java實現excel大資料量匯入的具體程式碼，供大家參考，具體內容如下

POI-Excel大資料量的寫入

POI-Excel大資料量的寫入 public class ExcelWriteTest { String PATH = \"C:\\\\Users\\\\Kven_J\\\\idea-workspace\\\\POI-EasyExcel\\\\chang-poi-\";

針對不同的地圖級別對大資料量的點進行聚合

package com.sb.service.impl; import java.text.SimpleDateFormat; import java.util.ArrayList; import java.util.Date;

C# 大資料量List＜T＞去重複方法效率比較

相關推薦