快速實現大量資料匹配來電號碼歸屬

阿新 • • 發佈：2019-01-11

問題分析

手機號碼又主要分兩種，018179700104和18179700104，即帶0開頭和不帶0開頭的。

郵編又分兩種三位數的郵編和四位的郵編，如北京010，深圳0755.

結果一個來電號碼要判斷是否滿足四種情況中的一種。Left join的haul就會產生巨大的資料量匹配，導致非常的緩慢。

：由於資料庫資料量大，且來電歸屬地的表資料量龐大，還需要同時匹配手機號碼和郵編。

首先我們來看一下，號碼歸屬地的表

以上三列分別是判斷歸屬地的手機號碼，區號和對應的城市。為了實現同時匹配郵編和電話號碼。我們需要將郵編和手機號碼，合併成一列，並將對應的城市生成一列。

Postgresql的語句如下：

SELECT DISTINCT phone,city from rd_attribution UNION ALL SELECT DISTINCT city_code,city from rd_attribution

我們發現執行這條sql語句非常慢，需要6秒左右，如果我們用大量資料去和這個臨時表left就會造成sql語句執行非常非常的緩慢。

所以我們可以建立一張表，專門用於儲存這兩個欄位。這樣我們就可以大大加快sql執行速度。

假設表名為city1

Sql語句如下：insert into city1(phone,city) SELECT DISTINCT phone,city from rd_attribution UNION ALL SELECT DISTINCT city_code,city from rd_attribution

生成表如下：

接下來我們就考慮，如何實現連線這張表時欄位一一對應，而不是判斷一個欄位可能滿足手機號碼，郵編其中的一種情況。

首先我們知道手機號碼是11位資料，且是1開頭。

當前面加0時，就是12位。

如果是座機的話，現在擴容後是8位。

如果區號是三位數，如010，加上八位座機號碼，便是11位

如果區號是4位數，如0755，加上八位座機號碼，便是12位

以上便有四種情況

	電話號碼長度	分析資料
0開頭	11位	座機，且郵編3位		substr(n.calling_pty,1,3)
	12位	1開頭	手機號碼	substr(n.calling_pty,2,7)
	12位	非1開頭	座機，4位郵編	substr(n.calling_pty,1,4)
1開頭	11位	正常手機號碼		substr(n.calling_pty,1,3)

以上判斷是為了讓我們擷取來電號碼，去跟歸屬地表中的資料去判斷，歸屬地。

我們在資料庫中用case when來實現。以下是完整的查詢歸屬地的語句。

select DISTINCT sd.*,s.city from  (
select DISTINCT t.num1,n.calling_pty,

      case when substr(n.calling_pty,1,1)='1' and length(n.calling_pty)=11 then substr(n.calling_pty,1,7)

      when substr(n.calling_pty,1,1)='0' and length(n.calling_pty)=11 then  substr(n.calling_pty,1,3)

            when substr(n.calling_pty,1,2)='01' and length(n.calling_pty)=12 then substr(n.calling_pty,2,7)

            when substr(n.calling_pty,1,1)='0' and length(n.calling_pty)=12 and substr(n.calling_pty,2,1)!='1'     then substr(n.calling_pty,1,4)

             else 'null'

            end  phones

from call_rec t left join call_rec n on t.callid=n.callid

where

t.num1>'2017-11-01 00:00:00'

and length(n.calling_pty)>7

)  sd

left join city1 s

on sd.phones=s.phone

至此完美實現可快速匹配歸屬地。重點在對來電號碼進行分析，處理。

快速實現大量資料匹配來電號碼歸屬

問題分析手機號碼又主要分兩種，018179700104和18179700104，即帶0開頭和不帶0開頭的。郵編又分兩種三位數的郵編和四位的郵編，如北京010，深圳0755. 結果一個來電號碼要判斷是否滿足四種情況中的一種。Left join的haul就會產生巨大的資料量匹配，導致非常

MySQL資料庫快速造大量資料

這段時間做效能測試,發現數據都是分庫寫進資料庫了,並且要構造大量資料,大概4000萬的資料量,用普通的方法,寫個MySQL函式,之前測試過,大概200萬資料也要跑一個多小時,太慢了. 後面研究發現有個很快的方法, 先寫個Java小工具(這樣比較靈活了, 可以根據自己的需要構造不同的測試資料), 按照分庫規則生

c# 快速將大量資料插入資料庫

快速插入資料主要思想是通過在客戶端把資料都快取在Table中，然後利用SqlBulkCopy一次性把Table中的資料插入到資料庫 public static void BulkToDB(DataTable dt) { SqlConnection s

react native 索引列表、展示大量資料的索引列表、磁吸索引列表、快速載入大量資料的列表

近期，在完成一個含有索引列表功能的專案。效果如圖所示：首先，我用的是react native 所提供的 ListView 這個元件（由於這個元件已經過期，而且此列表為分組列表，所以建議大家使用react native 官網所提供的 SectionList 元件，

資料庫壓力測試－－MySQL資料庫快速插入大量資料

一、前言應本次資料庫壓力測試的要求，測試資料記錄至少為千萬級，所以，問題來了，如何快速插入大量資料. 二、解決方法一第一種解決方法是在MySQL終端中實現的，具體方法如下. a.開啟MySQl資料庫; mysql -u root -p

SqlBulkCopy快速插入大量資料，缺點就是不能查重

相比常用insert語句，在需要插入數十萬百萬資料的時候，利用insert插入的速度相當慢，但其好處就是在可以在插入前進行查重，我們可以寫一個儲存過程，通過判斷插入的資料是否有重複，無則新增有則更新這些操作。但速度也是相當慢，而SqlBulkCopy的速度確實相當快，相比

GzipUtilities快速傳輸大量資料的例子!

//GzipUtilities傳輸資料下面是GzipUtilities能傳輸大量資料! import java.io.*;import java.util.zip.*;import javax.servlet.*;import javax.servlet.http.*;/*

MySQL 快速刪除大量資料（千萬級別）的幾種實踐方案

筆者最近工作中遇見一個性能瓶頸問題，MySQL表，每天大概新增776萬條記錄，儲存週期為7天，超過7天的資料需要在新增記錄前老化。連續執行9天以後，刪除一天的資料大概需要3個半小時（環境：128G, 32核，4T硬碟），而這是不能接受的。當然如果要整個表刪除，毋庸置疑用 TRUNCA

C#檢測座機來電號碼實現來電彈屏的實現方法

廣泛 pre options efault cal ive obj cli == 在我們的程序開發中，有些行業用到座機的來電彈屏，而C#作為微軟的一個重要開發工具，應用廣泛，本代碼實現了C#調用DLL實現來電彈屏（以中盛座機來電顯示盒為例，該盒子穩定可靠，編程簡單）。

Sphinx 實現海量資料的快速查詢

來源：https://blog.csdn.net/qq_28018283/article/details/72622003 說到 Sphinx，就會想到：站內搜尋，mysql優化，分詞等等有關搜尋海量資料的需求，本文介紹了 sphinx的基本概念

Mysql --學習：大量資料快速匯入匯出

宣告：此文供學習使用，原文：https://blog.csdn.net/xiaobaismiley/article/details/41015783 【實驗背景】專案中需要對資料庫中一張表進行重新設計，主要是之前未分割槽，考慮到資料量大了以後要設計成分割槽表，同時要對資料庫中其他表做好備份恢

SpringBoot通過WorkBook快速實現對Excel的匯入和匯出（包括資料校驗）

之前轉載過一篇對Excel基本操作相關的文章，這篇文章的瀏覽量迅速飆升，以至於在我部落格的熱門文章中排到了第三的位置，不過那篇轉載的文章實用性差並且講解不是很清晰，所以打算趁著今天休息，寫一篇關於SpringBoot通過WorkBook快速實現對Excel的匯入、匯出、資料校驗的文章，也是便於日後查

DRF中介面資料序列化及分頁、過濾、搜尋、排序的快速實現

在學習了一段時間DRF後，明顯感受到了在Web API搭建的過程中，DRF比Django靈活和迅速很多，DRF中提供了很多強大檢視和API，本篇通過一個商品頁的小案例記錄一下通過試用各種檢視及filter之後總結出的一套最簡化程式碼。 &

java實現oracle 快速解除安裝資料並ftp上傳資料給各個其他業務系統[從學習到工作（一）]

1.java解除安裝資料（ociuldr user=anysql/anysql query="select * from tab" field="|"）我們通常會採用jdbc操作資料庫然後用io寫入檔案，而在大資料的情況下用io寫入檔案是比較慢的，所以在工作中，我們會採用oracle

Android6.0來電號碼電話薄名稱匹配

本文將介紹系統接收到來電之後，如何在電話薄中進行匹配聯絡人的流程。分析將從另外一篇文章（基於Android6.0的RIL框架層模組分析）中提到的與本文內容相關的程式碼開始。 //packages/service/***/Call.java public void handleCr

資料結構——使用Java棧實現【括號匹配】

給定一個只包括 '('，')'，'{'，'}'，'['，']'的字串，判斷字串是否有效。有效字串需滿足：左括號必須用相同型別的右括號閉合。左括號必須以正確的順序閉合。注意空字串可被認為是有效字串。參考leetcode.com或leetcode-cn.com

如何使用預定義語義快速實現資料的多維分析

在《給一句 SQL 就能做多維分析》中我們介紹了潤乾報表可以基於一句 SQL 來做資料庫資料分析，今天我們來繼續說道說道，看看下面這個例子：這個分析資料集來自回款單，由回款單 ID，回款日期，金額，銷售 ID 四個欄位組成。對應的 sql 為：select 回款單 I

Oracle快速生成大量測試資料

最近有個小模組，是在災備機之間拷貝備份資料，同時把相關的資料表也拷貝到目標系統上。這裡涉及到一個問題：Oracle表空間達到上限之後怎麼處理？一般來說，將表空間設定為自增，不限制最大容量可以滿足大部分需求。但是，即便是表空間不設定上限，資料檔案的大小也是會有最大值的，

Mysql5.7 單表 500萬資料遷移到新表的快速實現方案

開發過程中需要把一個已有500萬條記錄的表資料同步到另一個新表中，剛好體驗下Mysql官方推薦的大資料遷移的方案：SELECT INTO OUTFILE，LOAD DATA INFILE Mysql

資料結構的應用——使用棧實現字串括號匹配檢查

假設表示式中允許包含兩種括號：圓括號和方括號，其巢狀順序隨意，及([]())或[([][])]等均為正確的格式，[(])或([())或(()]均為不正確的格式。匹配演算法的思想是：首先將第一個括號壓入棧，然後從第二個括號開始，如果與棧頂元素能匹配，能將棧頂元素彈出；如果不

快速實現大量資料匹配來電號碼歸屬

相關推薦