聚集因子 cluster factor

阿新 • • 發佈：2018-12-06

一：what

 1: 聚集因子 是索引資料順序和表順序的一致性程度
 2: 取值範圍為：最小資料塊數，最大為行數，值越小越好！

二：why

 1：聚集因子會影響sql的執行效率
 2：比如表結構，資料量，索引都一樣，生產和測試環境sql執行效率大不一致，
    這種情況下就可能是聚集因子不一致導致的

三：how

drop table t_test;
create table t_test(t_id number(20),t_num number(20));
insert into t_test 
select level,dbms_random.random from 
 dual connect by level <= 1000000;
create index t_test_idx on t_test(t_id);

drop table t_test2;
create table t_test2(t_id number(20),t_num number(20));
insert into t_test2 
select * from t_test order by dbms_random.random;
create index t_test2_idx on t_test2(t_id);

explain plan for select * from t_test where 
 t_id between 2000 and 9000;
select * from table(dbms_xplan.display);

PLAN_TABLE_OUTPUT
--------------------------------------------------------------------------------
Plan hash value: 1773029164
--------------------------------------------------------------------------------
| Id  | Operation                   | Name       | Rows  | Bytes | Cost (%CPU)|
-------------------------------------------------------------------------------- 

|   0 | SELECT STATEMENT            |            |  8315 |   211K|    48   (0)|
|   1 |  TABLE ACCESS BY INDEX ROWID| T_TEST     |  8315 |   211K|    48   (0)|
|*  2 |   INDEX RANGE SCAN          | T_TEST_IDX |  8315 |       |    24   (0)|
--------------------------------------------------------------------------------
Predicate Information (identified by operation id):
---------------------------------------------------
   2 - access("T_ID">=2000 AND "T_ID"<=9000)
Note
-----
   - dynamic sampling used for this statement (level=2)
18 rows selected


--執行計劃
explain plan for select * from t_test2 where t_id between 2000 and 9000;
select * from table(dbms_xplan.display);

PLAN_TABLE_OUTPUT
--------------------------------------------------------------------------------
Plan hash value: 1680898452
-----------------------------------------------------------------------------
| Id  | Operation         | Name    | Rows  | Bytes | Cost (%CPU)| Time     |
-----------------------------------------------------------------------------
|   0 | SELECT STATEMENT  |         |  6904 |   175K|   668   (3)| 00:00:09 |
|*  1 |  TABLE ACCESS FULL| T_TEST2 |  6904 |   175K|   668   (3)| 00:00:09 |
-----------------------------------------------------------------------------
Predicate Information (identified by operation id):
---------------------------------------------------
   1 - filter("T_ID">=2000 AND "T_ID"<=9000)
Note
-----
   - dynamic sampling used for this statement (level=2)
17 rows selected



--檢視聚集因子
SELECT index_name,table_name,blevel,leaf_blocks,clustering_factor,num_rows
  FROM user_indexes
 WHERE lower(table_name) LIKE 't_test%';

INDEX_NAME                     TABLE_NAME                         BLEVEL LEAF_BLOCKS CLUSTERING_FACTOR   NUM_ROWS
------------------------------ ------------------------------ ---------- ----------- ----------------- ----------
T_TEST_IDX                     T_TEST                                  2        2226              2401    1000000
T_TEST2_IDX                    T_TEST2                                 2        2226            999612    1000000

分析:
1：一個索引範圍掃描獲取資料，另一個全表掃描
2：cost 一個48，另外一個668，效能提升14倍！

聚集因子 cluster factor

一：what 1: 聚集因子是索引資料順序和表順序的一致性程度 2: 取值範圍為：最小資料塊數，最大為行數，值越小越好！二：why 1：聚集因子會影響sql的執行效率 2：比如表結構，資料量，索引都一樣，生產和測試環境sql執行效率大不一致，這種情況下就可

Kafka動態調整topic副本因子replication-factor

實際專案中我們可能在建立topic時沒有設定好正確的replication-factor，導致kafka叢集雖然是高可用的，但是該topic在有broker宕機時，可能發生無法使用的情況。topic一旦使用又不能輕易刪除重建，因此動態增加副本因子就成為最終的選擇。原因分析：假

因子分析(Factor Analysis Model)演算法推導

可以參考斯坦福大學Andrew Ng的學習視訊：http://open.163.com/movie/2008/1/L/3/M6SGF6VB4_M6SGKK6L3.html 關於演算法總結可以參考：https://www.cnblogs.com/jerrylead/archi

Factor Graph因子圖

cto ref net 就是 lds class n) lsb frame 參考鏈接1：參考鏈接2：參考ppt3： Factor Graph 是概率圖的一種，概率圖有很多種，最常見的就是Bayesian Network (貝葉斯網絡)和Markov Random Fie

R: factor & list 生成和操作因子、列表

shu p s 類型問題 rac 方便 left 函數 nba ################################################### 問題：生成、操作列表 & 因子 18.4.27 怎麽生成列表 list、因

因子分析（factor analysis)

因子分析（Factor Analysis) 首先從原理上說，主成分分析是試圖尋找原有自變數的一個線性組合。這個組合方差要大，那麼攜帶的資訊也就多，也就是相當於把原始資料的主要成分給拿了出來。而因子分析，是從假設出發，它是假設所有的自變數x出現的原因是因為背後存在一個潛變數f,即因

[LeetCode] Factor Combinations 因子組合

Numbers can be regarded as product of its factors. For example, 8 = 2 x 2 x 2; = 2 x 4. Write a function that takes an integer n and return all po

EFM (Explicit Factor Models)顯因子模型

SiGIR 2014在推薦系統方面收錄了三篇很有價值的論文，提出了新的演算法框架。在此介紹第一種演算法框架（來自論文：Explicit Factor Models for Explainable Re

【機器學習-斯坦福】因子分析（Factor Analysis）

1 問題之前我們考慮的訓練資料中樣例的個數m都遠遠大於其特徵個數n，這樣不管是進行迴歸、聚類等都沒有太大的問題。然而當訓練樣例個數m太小，甚至m<<n的時候，使用梯度下降法進行迴歸時，如果初值不同，得到的引數結果會有很大偏差（因為方程數小於引數個

(hdu step 2.1.3)Largest prime factor(求一個數的最大質因子的位置)

Everybody knows any number can be combined by the prime number.Now, your task is telling me what position of the largest prime factor.The position of prime

R語言之因子(factor)

變數可歸結為名義型、有序型或連續型變數。名義型變數是沒有順序之分的類別變數，如型別、種類;有序型變量表示一種順序關係，而非數量關係，如偏好、ID;連續型變數可以呈現為某個範圍內的任意值，並同時表示了順序和數量，如年齡、成績。類別（名義型）變

因子分析（Factor Analysis）

1 問題之前我們考慮的訓練資料中樣例的個數m都遠遠大於其特徵個數n，這樣不管是進行迴歸、聚類等都沒有太大的問題。然而當訓練樣例個數m太小，甚至m<<n的時候，使用梯度下降法

區域性異常因子演算法-Local Outlier Factor(LOF)演算法的PHP實現

這兩天在完善自己系統的過程中要實現一個查詢異常的功能，於是在朋友的指點下學習並實現了異常點查詢的一個基本演算法“區域性異常因子演算法-Local Outlier Factor(LOF)演算法”。首先，找相關說明看看這是個什麼東西吧。大致明白了lof演算法是在講什麼，我

設定佈局管理器中item的伸縮因子（stretch factor）

示例：之類加入要設定一個水平佈局管理器的兩個item的比例，1:5 水平比例顯示； QHBoxLayout * pQHBoxLayout = (QHBoxLayout *)pcentralWidg

Largest prime factor（最大素數因子）

Largest prime factor Time Limit: 5000/1000 MS (Java/Others) Memory Limit: 32768/32768 K (Java/Others

機器學習：Factor analysis因子分析

這部分內容還是挺奇怪的，學生的時候感覺不難啊，但是把覆盤的時候，總是各種難以明說的困惑，不知道是不是因為戒菸，注意力不夠專注，總之，學的不是很容易。說歸來因子分析，解決的是維度高，樣本不足的情況下，模型建立的問題。我們之前講的混合高斯模型裡都是維度數遠小於樣本

POJ3421 X-factor Chains【分解質因子+組合數學】

題意簡述：輸入正整數x，求x的因子組成的滿足任意前一項都能整除後一項的序列的最大長度，以及所有不同序列的個數。問題分析：首先要對x進行因子分解。這樣可以得到總的因子個數c，不同的因子為f1,f2,...,fn其次方數分別為e1,e2,...,en。那麼，不同序列的個數

因子分析法（Factor Analysis）是什麽分析

name 大量 tex 管理 ref 分析一個之間 ora 因子分析與因子分析法主成分分析通過線性組合將原變量綜合成幾個主成分，用較少的綜合指標來代替原來較多的指標（變量）。在多變量分析中，某些變量間往往存在相關性。是什麽原因使變量間有關聯呢？是否存在不能直接觀測到的

R語言中因子(factor)轉換成數值型(numeric)的問題

一直覺得只要是數字，不管是什麼型別的，都可以通過as.numeric()函式轉換為對應的numeric型別的數字，例如 x<-“123”，x為character型別，而as.numeric(x)則為numeric型別的123。但是因子(factor)型別

聚集因子 cluster factor

一：what

二：why

三：how

相關推薦