SQL 語句效率問題(如何寫出高效能的SQL語句)
1.關於SQL查詢效率,100w資料,查詢只要1秒,與您分享:
機器情況 p4: 2.4 記憶體: 1 G os: windows 2003 資料庫: ms sql server 2000 目的: 查詢效能測試,比較兩種查詢的效能
SQL查詢效率 step by step
-- setp 1. -- 建表 create table t_userinfo ( userid int identity(1,1) primary key nonclustered, nick varchar(50) not null default '', classid int not null default 0, writetime datetime not null default getdate() ) go
-- 建索引 create clustered index ix_userinfo_classid on t_userinfo(classid) go
-- step 2.
declare @i int declare @k int declare @nick varchar(10) set @i = 1 while @i<1000000 begin set @k = @i % 10 set @nick = convert(varchar,@i) insert into t_userinfo(nick,classid,writetime) values(@nick,@k,getdate()) set @i = @i + 1 end -- 耗時 08:27 ,需要耐心等待
-- step 3. select top 20 userid,nick,classid,writetime from t_userinfo where userid not in ( select top 900000 userid from t_userinfo order by userid asc )
-- 耗時 8 秒 ,夠長的
-- step 4. select a.userid,b.nick,b.classid,b.writetime from ( select top 20 a.userid from ( select top 900020 userid from t_userinfo order by userid asc ) a order by a.userid desc ) a inner join t_userinfo b on a.userid = b.userid order by a.userid asc
-- 耗時 1 秒,太快了吧,不可以思議
-- step 5 where 查詢 select top 20 userid,nick,classid,writetime from t_userinfo where classid = 1 and userid not in ( select top 90000 userid from t_userinfo where classid = 1 order by userid asc ) -- 耗時 2 秒
-- step 6 where 查詢 select a.userid,b.nick,b.classid,b.writetime from ( select top 20 a.userid from ( select top 90000 userid from t_userinfo where classid = 1 order by userid asc ) a order by a.userid desc ) a inner join t_userinfo b on a.userid = b.userid order by a.userid asc
-- 查詢分析器顯示不到 1 秒.
查詢效率分析: 子查詢為確保消除重複值,必須為外部查詢的每個結果都處理巢狀查詢。在這種情況下可以考慮用聯接查詢來取代。 如果要用子查詢,那就用EXISTS替代IN、用NOT EXISTS替代NOT IN。因為EXISTS引入的子查詢只是測試是否存在符合子查詢中指定條件的行,效率較高。無論在哪種情況下,NOT IN都是最低效的。因為它對子查詢中的表執行了一個全表遍歷。
建立合理的索引,避免掃描多餘資料,避免表掃描! 幾百萬條資料,照樣幾十毫秒完成查詢. 2. SQL提高查詢效率 2008-05-12 21:20 1.對查詢進行優化,應儘量避免全表掃描,首先應考慮在 where 及 order by 涉及的列上建立索引。
2.應儘量避免在 where 子句中對欄位進行 null 值判斷,否則將導致引擎放棄使用索引而進行全表掃描,如: select id from t where num is null 可以在num上設定預設值0,確保表中num列沒有null值,然後這樣查詢: select id from t where num=0
3.應儘量避免在 where 子句中使用!=或<>操作符,否則將引擎放棄使用索引而進行全表掃描。
4.應儘量避免在 where 子句中使用 or 來連線條件,否則將導致引擎放棄使用索引而進行全表掃描,如: select id from t where num=10 or num=20 可以這樣查詢: select id from t where num=10 union all select id from t where num=20
5.in 和 not in 也要慎用,否則會導致全表掃描,如: select id from t where num in(1,2,3) 對於連續的數值,能用 between 就不要用 in 了: select id from t where num between 1 and 3
6.下面的查詢也將導致全表掃描: select id from t where name like '�c%' 若要提高效率,可以考慮全文檢索。
7. 如果在 where 子句中使用引數,也會導致全表掃描。因為SQL只有在執行時才會解析區域性變數,但優化程式不能將訪問計劃的選擇推遲到執行時;它必須在編譯時進行選擇。然 而,如果在編譯時建立訪問計劃,變數的值還是未知的,因而無法作為索引選擇的輸入項。如下面語句將進行全表掃描: select id from t where [email protected] 可以改為強制查詢使用索引: select id from t with(index(索引名)) where [email protected]
8.應儘量避免在 where 子句中對欄位進行表示式操作,這將導致引擎放棄使用索引而進行全表掃描。如: select id from t where num/2=100 應改為: select id from t where num=100*2
9.應儘量避免在where子句中對欄位進行函式操作,這將導致引擎放棄使用索引而進行全表掃描。如: select id from t where substring(name,1,3)='abc'--name以abc開頭的id select id from t where datediff(day,createdate,'2005-11-30')=0--‘2005-11-30’生成的id 應改為: select id from t where name like 'abc%' select id from t where createdate>='2005-11-30' and createdate<'2005-12-1'
10.不要在 where 子句中的“=”左邊進行函式、算術運算或其他表示式運算,否則系統將可能無法正確使用索引。
11.在使用索引欄位作為條件時,如果該索引是複合索引,那麼必須使用到該索引中的第一個欄位作為條件時才能保證系統使用該索引,否則該索引將不會被使用,並且應儘可能的讓欄位順序與索引順序相一致。
12.不要寫一些沒有意義的查詢,如需要生成一個空表結構: select col1,col2 into #t from t where 1=0 這類程式碼不會返回任何結果集,但是會消耗系統資源的,應改成這樣: create table #t(...)
13.很多時候用 exists 代替 in 是一個好的選擇: select num from a where num in(select num from b) 用下面的語句替換: select num from a where exists(select 1 from b where num=a.num)
14.並不是所有索引對查詢都有效,SQL是根據表中資料來進行查詢優化的,當索引列有大量資料重複時,SQL查詢可能不會去利用索引,如一表中有欄位sex,male、female幾乎各一半,那麼即使在sex上建了索引也對查詢效率起不了作用。
15. 索引並不是越多越好,索引固然可以提高相應的 select 的效率,但同時也降低了 insert 及 update 的效率,因為 insert 或 update 時有可能會重建索引,所以怎樣建索引需要慎重考慮,視具體情況而定。一個表的索引數最好不要超過6個,若太多則應考慮一些不常使用到的列上建的索引是否有 必要。
16.應儘可能的避免更新 clustered 索引資料列,因為 clustered 索引資料列的順序就是表記錄的物理儲存順序,一旦該列值改變將導致整個表記錄的順序的調整,會耗費相當大的資源。若應用系統需要頻繁更新 clustered 索引資料列,那麼需要考慮是否應將該索引建為 clustered 索引。
17.儘量使用數字型欄位,若只含數值資訊的欄位儘量不要設計為字元型,這會降低查詢和連線的效能,並會增加儲存開銷。這是因為引擎在處理查詢和連線時會逐個比較字串中每一個字元,而對於數字型而言只需要比較一次就夠了。
18.儘可能的使用 varchar/nvarchar 代替 char/nchar ,因為首先變長欄位儲存空間小,可以節省儲存空間,其次對於查詢來說,在一個相對較小的欄位內搜尋效率顯然要高些。
19.任何地方都不要使用 select * from t ,用具體的欄位列表代替“*”,不要返回用不到的任何欄位。
20.儘量使用表變數來代替臨時表。如果表變數包含大量資料,請注意索引非常有限(只有主鍵索引)。
21.避免頻繁建立和刪除臨時表,以減少系統表資源的消耗。
22.臨時表並不是不可使用,適當地使用它們可以使某些例程更有效,例如,當需要重複引用大型表或常用表中的某個資料集時。但是,對於一次性事件,最好使用匯出表。
23.在新建臨時表時,如果一次性插入資料量很大,那麼可以使用 select into 代替 create table,避免造成大量 log ,以提高速度;如果資料量不大,為了緩和系統表的資源,應先create table,然後insert。
24.如果使用到了臨時表,在儲存過程的最後務必將所有的臨時表顯式刪除,先 truncate table ,然後 drop table ,這樣可以避免系統表的較長時間鎖定。
25.儘量避免使用遊標,因為遊標的效率較差,如果遊標操作的資料超過1萬行,那麼就應該考慮改寫。
26.使用基於遊標的方法或臨時表方法之前,應先尋找基於集的解決方案來解決問題,基於集的方法通常更有效。
27. 與臨時表一樣,遊標並不是不可使用。對小型資料集使用 FAST_FORWARD 遊標通常要優於其他逐行處理方法,尤其是在必須引用幾個表才能獲得所需的資料時。在結果集中包括“合計”的例程通常要比使用遊標執行的速度快。如果開發時 間允許,基於遊標的方法和基於集的方法都可以嘗試一下,看哪一種方法的效果更好。
28.在所有的儲存過程和觸發器的開始處設定 SET NOCOUNT ON ,在結束時設定 SET NOCOUNT OFF 。無需在執行儲存過程和觸發器的每個語句後向客戶端傳送 DONE_IN_PROC 訊息。
29.儘量避免大事務操作,提高系統併發能力。
30.儘量避免向客戶端返回大資料量,若資料量過大,應該考慮相應需求是否合理 1、避免將欄位設為“允許為空” 2、資料表設計要規範 3、深入分析資料操作所要對資料庫進行的操作 4、儘量不要使用臨時表 5、多多使用事務 6、儘量不要使用遊標 7、避免死鎖 8、要注意讀寫鎖的使用 9、不要開啟大的資料集 10、不要使用伺服器端遊標 11、在程式編碼時使用大資料量的資料庫 12、不要給“性別”列建立索引 13、注意超時問題 14、不要使用Select * 15、在細節表中插入紀錄時,不要在主表執行Select MAX(ID) 16、儘量不要使用TEXT資料型別 17、使用引數查詢 18、不要使用Insert匯入大批的資料 19、學會分析查詢 20、使用參照完整性 21、用INNER JOIN 和LEFT JOIN代替Where /////////////////////////////////////////////////////////////////////////////////////////// http://blog.sina.com.cn/s/blog_4b3d79a9010006gv.html 提高SQL查詢效率(要點與技巧): ? 技巧一: 問題型別:ACCESS資料庫欄位中含有日文片假名或其它不明字元時查詢會提示記憶體溢位。 解決方法:修改查詢語句 sql="select * from tablename where column like '%"&word&"%'" 改為 sql="select * from tablename" rs.filter = " column like '%"&word&"%'" =========================================================== 技巧二: 問題型別:如何用簡易的辦法實現類似百度的多關鍵詞查詢(多關鍵詞用空格或其它符號間隔)。 解決方法: '//用空格分割查詢字串 ck=split(word," ") '//得到分割後的數量 sck=UBound(ck) sql="select * tablename where" 在一個欄位中查詢 For i = 0 To sck SQL = SQL & tempJoinWord & "(" & _ "column like '"&ck(i)&"%')" tempJoinWord = " and " Next 在二個欄位中同時查詢 For i = 0 To sck SQL = SQL & tempJoinWord & "(" & _ "column like '"&ck(i)&"%' or " & _ "column1 like '"&ck(i)&"%')" tempJoinWord = " and " Next =========================================================== 技巧三:大大提高查詢效率的幾種技巧
1. 儘量不要使用 or,使用or會引起全表掃描,將大大降低查詢效率。 2. 經過實踐驗證,charindex()並不比前面加%的like更能提高查詢效率,並且charindex()會使索引失去作用(指sqlserver資料庫) 3. column like '%"&word&"%' 會使索引不起作用 column like '"&word&"%' 會使索引起作用(去掉前面的%符號) (指sqlserver資料庫) 4. '%"&word&"%' 與'"&word&"%' 在查詢時的區別: 比如你的欄位內容為 一個容易受傷的女人 '%"&word&"%' :會通配所有字串,不論查“受傷”還是查“一個”,都會顯示結果。 '"&word&"%' :只通配前面的字串,例如查“受傷”是沒有結果的,只有查“一個”,才會顯示結果。 5. 欄位提取要按照“需多少、提多少”的原則,避免“select *”,儘量使用“select 欄位1,欄位2,欄位3........”。實踐證明:每少提取一個欄位,資料的提取速度就會有相應的提升。提升的速度還要看您捨棄的欄位的大小來判斷。 6. order by按聚集索引列排序效率最高。一個sqlserver資料表只能建立一個聚集索引,一般預設為ID,也可以改為其它的欄位。 7. 為你的表建立適當的索引,建立索引可以使你的查詢速度提高几十幾百倍。(指sqlserver資料庫) ? 以下是建立索引與不建立索引的一個查詢效率分析: Sqlserver索引與查詢效率分析。 表 News 欄位 Id:自動編號 Title:文章標題 Author:作者 Content:內容 Star:優先順序 Addtime:時間 記錄:100萬條 測試機器:P4 2.8/1G記憶體/IDE硬碟 ======================================================= 方案1: 主鍵Id,預設為聚集索引,不建立其它非聚集索引 select * from News where Title like '%"&word&"%' or Author like '%"&word&"%' order by Id desc 從欄位Title和Author中模糊檢索,按Id排序 查詢時間:50秒 ======================================================= 方案2: 主鍵Id,預設為聚集索引 在Title、Author、Star上建立非聚集索引 select * from News where Title like '"&word&"%' or Author like '"&word&"%' order by Id desc 從欄位Title和Author中模糊檢索,按Id排序 查詢時間:2 - 2.5秒 ======================================================= 方案3: 主鍵Id,預設為聚集索引 在Title、Author、Star上建立非聚集索引 select * from News where Title like '"&word&"%' or Author like '"&word&"%' order by Star desc 從欄位Title和Author中模糊檢索,按Star排序 查詢時間:2 秒 ======================================================= 方案4: 主鍵Id,預設為聚集索引 在Title、Author、Star上建立非聚集索引 select * from News where Title like '"&word&"%' or Author like '"&word&"%' 從欄位Title和Author中模糊檢索,不排序 查詢時間:1.8 - 2 秒 ======================================================= 方案5: 主鍵Id,預設為聚集索引 在Title、Author、Star上建立非聚集索引 select * from News where Title like '"&word&"%' 或 select * from News where Author like '"&word&"%' 從欄位Title 或 Author中檢索,不排序 查詢時間:1秒 ? 如何提高SQL語言的查詢效率? 問:請問我如何才能提高SQL語言的查詢效率呢? 答:這得從頭說起: 由於SQL是面向結果而不是面向過程的查詢語言,所以一般支援SQL語言的大型關係型資料庫都使用一個基於查詢成本的優化器,為即時查詢提供一個最佳的執行策略。對於優化器,輸入是一條查詢語句,輸出是一個執行策略。 一條SQL查詢語句可以有多種執行策略,優化器將估計出全部執行方法中所需時間最少的所謂成本最低的那一種方法。所有優化都是基於用記所使用的查詢語句中的where子句,優化器對where子句中的優化主要用搜索引數(Serach Argument)。 搜尋引數的核心思想就是資料庫使用表中欄位的索引來查詢資料,而不必直接查詢記錄中的資料。 帶有 =、<、<=、>、>= 等操作符的條件語句可以直接使用索引,如下列是搜尋引數: emp_id = "10001" 或 salary > 3000 或 a =1 and c = 7 而下列則不是搜尋引數: salary = emp_salary 或 dep_id != 10 或 salary * 12 >= 3000 或 a=1 or c=7 應當儘可能提供一些冗餘的搜尋引數,使優化器有更多的選擇餘地。請看以下3種方法: 第一種方法: select employee.emp_name,department.dep_name from department,employee where (employee.dep_id = department.dep_id) and (department.dep_code="01") and (employee.dep_code="01"); 它的搜尋分析結果如下: Estimate 2 I/O operations Scan department using primary key for rows where dep_code equals "01" Estimate getting here 1 times Scan employee sequentially Estimate getting here 5 times 第二種方法: select employee.emp_name,department.dep_name from department,employee where (employee.dep_id = department.dep_id) and (department.dep_code="01"); 它的搜尋分析結果如下: Estimate 2 I/O operations Scan department using primary key for rows where dep_code equals "01" Estimate getting here 1 times Scan employee sequentially Estimate getting here 5 times 第一種方法與第二種執行效率相同,但第一種方法最好,因為它為優化器提供了更多的選擇機會。 第三種方法: select employee.emp_name,department.dep_name from department,employee where (employee.dep_id = department.dep_id) and (employee.dep_code="01"); 這種方法最不好,因為它無法使用索引,也就是無法優化…… 使用SQL語句時應注意以下幾點: 1、避免使用不相容的資料型別。例如,Float和Integer,Char和Varchar,Binary和Long Binary不相容的。資料型別的不相容可能使優化器無法執行一些本可以進行的優化操作。例如: select emp_name form employee where salary > 3000; 在此語句中若salary是Float型別的,則優化器很難對其進行優化,因為3000是個整數,我們應在程式設計時使用3000.0而不要等執行時讓DBMS進行轉化。 2、儘量不要使用表示式,因它在編繹時是無法得到的,所以SQL只能使用其平均密度來估計將要命中的記錄數。 3、避免對搜尋引數使用其他的數學操作符。如: select emp_name from employee where salary * 12 > 3000; 應改為: select emp_name from employee where salary > 250; 4、避免使用 != 或 <> 等這樣的操作符,因為它會使系統無法使用索引,而只能直接搜尋表中的資料。 ? ORACAL中的應用 一個1600萬資料表--簡訊上行表TBL_SMS_MO 結構: CREATE TABLE TBL_SMS_MO ( SMS_ID NUMBER, MO_ID VARCHAR2(50), MOBILE VARCHAR2(11), SPNUMBER VARCHAR2(20), MESSAGE VARCHAR2(150), TRADE_CODE VARCHAR2(20), LINK_ID VARCHAR2(50), GATEWAY_ID NUMBER, GATEWAY_PORT NUMBER, MO_TIME DATE DEFAULT SYSDATE ); CREATE INDEX IDX_MO_DATE ON TBL_SMS_MO (MO_TIME) PCTFREE 10 INITRANS 2 MAXTRANS 255 STORAGE ( INITIAL 1M NEXT 1M MINEXTENTS 1 MAXEXTENTS UNLIMITED PCTINCREASE 0 ); CREATE INDEX IDX_MO_MOBILE ON TBL_SMS_MO (MOBILE) PCTFREE 10 INITRANS 2 MAXTRANS 255 STORAGE ( INITIAL 64K NEXT 1M MINEXTENTS 1 MAXEXTENTS UNLIMITED PCTINCREASE 0 ); 問題:從表中查詢某時間段內某手機發送的短訊息,如下SQL語句: SELECT MOBILE,MESSAGE,TRADE_CODE,MO_TIME FROM TBL_SMS_MO WHERE MOBILE='130XXXXXXXX' AND MO_TIME BETWEEN TO_DATE('2006-04-01','YYYY-MM-DD HH24:MI:SS') AND TO_DATE('2006-04-07','YYYY-MM-DD HH24:MI:SS') ORDER BY MO_TIME DESC 返回結果大約需要10分鐘,應用於網頁查詢,簡直難以忍受。 分析: 在PL/SQL Developer,點選“Explain Plan”按鈕(或F5鍵),對SQL進行分析,發現預設使用的索引是IDX_MO_DATE。問題可能出在這裡,因為相對於總數量1600萬資料來說, 都mobile的資料是很少的,如果使用IDX_MO_MOBILE比較容易鎖定資料。 如下優化: SELECT MOBILE,MESSAGE,TRADE_CODE,MO_TIME FROM TBL_SMS_MO WHERE MOBILE='130XXXXXXXX' AND MO_TIME BETWEEN TO_DATE('2006-04-01','YYYY-MM-DD HH24:MI:SS') AND TO_DATE('2006-04-07','YYYY-MM-DD HH24:MI:SS') ORDER BY MO_TIME DESC 測試: 按F8執行這個SQL,哇~... ... 2.360s,這就是差別。 用索引提高SQL Server效能 特別說明 在微軟的SQL Server系統中通過有效的使用索引可以提高資料庫的查詢效能,但是效能的提高取決於資料庫的實現。在本文中將會告訴你如何實現索引並有效的提高資料庫的效能。 在關係型資料庫中使用索引能夠提高資料庫效能,這一點是非常明顯的。用的索引越多,從資料庫系統中得到資料的速度就越快。然而,需要注意的是,用的索引 越多,向資料庫系統中插入新資料所花費的時間就越多。在本文中,你將瞭解到微軟的SQL Server資料庫所支援的各種不同型別的索引,在這裡你將瞭解到如何使用不同的方法來實現索引,通過這些不同的實現方法,你在資料庫的讀效能方面得到的 遠比在資料庫的整體效能方面的損失要多得多。 索引的定義 索引是資料庫的工具,通過使用索引,在資料庫中獲取資料的時 候,就可以不用掃描資料庫中的所有資料記錄,這樣能夠提高系統獲取資料的效能。使用索引可以改變資料的組織方式,使得所有的資料都是按照相似的結構來組織 的,這樣就可以很容易地實現資料的檢索訪問。索引是按照列來建立的,這樣就可以根據索引列中的值來幫助資料庫找到相應的資料。 索引的型別 微軟的SQL Server 支援兩種型別的索引:clustered 索引和nonclustered索引。Clustered 索引在資料表中按照物理順序儲存資料。因為在表中只有一個物理順序,所以在每個表中只能有一個clustered索引。在查詢某個範圍內的資料 時,Clustered索引是一種非常有效的索引,因為這些資料在儲存的時候已經按照物理順序排好序了。 Nonclustered索引不會影響到下面的物理儲存,但是它是由資料行指標構成的。如果已經存在一個clustered索引,在 nonclustered中的索引指標將包含clustered索引的位置參考。這些索引比資料更緊促,而且對這些索引的掃描速度比對實際的資料表掃描要 快得多。 如何實現索引 資料庫可以自動建立某些索引。例如,微軟的SQL Server系統通過自動建立唯一索引來強制實現UNIQUE約束,這樣可以確保在資料庫中不會插入重複資料。也可以使用CREATE INDEX語句或者通過SQL Server Enterprise Manager來建立其他索引,SQL Server Enterprise Manager還有一個索引建立模板來指導你如何建立索引。 得到更好的效能 雖然索引可以帶來效能上的優勢,但是同時 也將帶來一定的代價。雖然SQL Server系統允許你在每個資料表中建立多達256個nonclustered索引,但是建議不要使用這麼多的索引。因為索引需要在記憶體和物理磁碟驅動 器上使用更多的儲存空間。在執行插入宣告的過程中可能會在一定程度上導致系統性能的下降,因為在插入資料的時候是需要根據索引的順序插入,而不是在第一個 可用的位置直接插入資料,這樣一來,存在的索引越多將導致插入或者更新宣告所需要的時間就越多。 在使用SQL Server系統建立索引的時候,建議參照下面的建立準則來實現: 正確的選擇資料型別 在索引中使用某些資料型別可以提高資料庫系統的效率,例如,Int,bigint, smallint,和tinyint等這些資料型別都非常適合於用在索引中,因為他們都佔用相同大小的空間並且可以很容易地實現比較操作。其他的資料型別 如char和varchar的效率都非常低,因為這些資料型別都不適合於執行數學操作,並且執行比較操作的時間都比上面提到資料型別要長。 確保在使用的過程中正確的利用索引值 在執行查詢操作時,可能所使用的列只是clustered的一部分,這時尤其要注意的是如何使用這些資料。當用這些資料列作為引數呼叫函式時,這些函式 可能會使現有的排序優勢失效。例如,使用日期值作為索引,而為了實現比較操作,可能需要將這個日期值轉換為字串,這樣將導致在查詢過程中無法用到這個日 期索引值。 在建立多列索引時,需要注意列的順序 資料庫將根據第一列索引的值來排列記錄,然後進一步根據第二列的值來排序,依次排序直到最後一個索引排序完畢。哪一列唯一資料值較少,哪一列就應該為第一個索引,這樣可以確保資料可以通過索引進一步交叉排序。 在clustered索引中限制列的數量 在clustered索引中用到的列越多,在nonclustered索引中包含的clustered索引參考位置就越多,需要儲存的資料也就越多。這樣將增加包含索引的資料表的大小,並且將增加基於索引的搜尋時間。 避免頻繁更新clustered索引資料列 由於nonclustered 索引依賴於clustered 索引,所以如果構成clustered 索引的資料列頻繁更新,將導致在nonclustered中儲存的行定位器也將隨之頻繁更新。對於所有與這些列相關的查詢來說,如果發生記錄被鎖定的情況 時,這將可能導致效能成本的增加。 分開操作(如果可能的話) 對於一個表來說,如果需要進行頻繁的執行插入、更新操作,同時還有大量讀操作的話,在可能的情況下嘗試將這個表分開操作。所有的插入和更新操作可以在一個沒有索引的表中操作,然後將其複製到另外一個表中,在這個表裡有大量的索引可以優化讀資料的能力。 適當的重建索引 Nonclustered索引包含clustered索引的指標,這樣一來Nonclustered索引將從屬於clustered 索引。當重建clustered索引時,首先是丟棄原來的索引,然後再使用CREATE INDEX 來建立索引,或者在使用CREATE INDEX 宣告的同時將DROP_EXISTING 子句作為重建索引的一部分。將丟棄和建立分為幾步將會導致多次重建nonclustered 索引,而不象使用DROP_EXISTING 子句那樣,只重建一次nonclustered 索引。 明智的使用填充因子 資料儲存在那些具有固定大小的連續記憶體頁面內。隨著新的記錄行的加入,資料記憶體頁將逐漸被填滿,系統就必須執行資料頁的拆分工作,通過這個拆分工作將部 分資料轉移到下一個新的頁面當中。這樣的拆分之後,將加重系統的負擔,並且會導致儲存的資料支離破碎。填充因子可以維護資料之間的缺口,一般在建立索引的 時候,該索引的填充因子就已經被設定好了。這樣一來,可以減少插入資料所引起的頁面分裂的次數。因為只是在建立索引的時候才維護空間的大小,在增加資料或 者更新資料時不會去維護空間的大小。因此,要想能夠充分的利用填充因子,就必須週期性的重建索引。由填充因子所造成的缺口將導致讀效能的下降,因為隨著數 據庫的擴張,越來越多的磁碟存取工作需要讀取資料。所以,在讀的次數超過寫的次數的時候,很重要的一點是考慮使用填充因子還是使用預設方式合適。 管理層的決策 通過有效的使用索引,可以在微軟的SQL Server系統中實現很好的查詢功能,但是使用索引的效率取決於幾種不同的實現決策。在索引的效能平衡方面,要做出正確的資料庫管理決策意味著需要在良 好的效能和困境中抉擇。在特定的情況下,本文給出的一些建議將有助於你做出正確的決策