Oracle SQL調優
在多數情況下,Oracle使用索引t來更快地遍歷表,優化器主要根據定義的索引來提高性能。
但是,如果在SQL語句的where子句中寫的SQL代碼不合理,就會造成優化器刪去索引而使用全表掃描,一般就這種SQL語句就是所謂的劣質SQL語句。
在編寫SQL語句時我們應清楚優化器根據何種原則來刪除索引,這有助於寫出高性能的SQL語句
1. IS NULL 與 IS NOT NULL
不能用null作索引,任何包含null值的列都將不會被包含在索引中。
即使索引有多列這樣的情況下,只要這些列中有一列含有null,該列就會從索引中排除。
也就是說如果某列存在空值,即使對該列建索引也不會提高性能。
任何在where子句中使用is null或is not null的語句優化器是不允許使用索引的
如果我們必須要用 is null,又需要提供查詢效率 可以用函數索引
實例如下
create table test_date (name varchar2(20),day date); insert into test_date(name ,day) values (‘lucy‘,null); insert into test_date(name ,day) values (‘jony‘,null); insert into test_date(name,day) values (‘james‘,sysdate); select * from test_date;
--創建decode函數索引來代替 create index finx_day on test_date(decode(day,null,‘N‘, ‘Y‘))
--使用decode判斷來代替is null判斷 select * from test_date a where decode(day,null,‘N‘,‘Y‘) = ‘N‘
2. 聯接列
對於有聯接的列,即使最後的聯接值為一個靜態值,優化器是不會使用索引的。
假定有一個職工表(employee),對於一個職工的姓和名分成兩列存放(FIRST_NAME和LAST_NAME),
現在要查詢一個叫比爾.克林頓(Bill Cliton)的職工。
下面是一個采用聯接查詢的SQL語句,
select * from employs where first_name||’ ’||last_name =‘Beill Cliton‘
上面這條語句完全可以查詢出是否有Bill Cliton這個員工,但是這裏需要註意,系統優化器對基於last_name創建的索引沒有使用。
當采用下面這種SQL語句的編寫,Oracle系統就可以采用基於last_name創建的索引。
Select * from employee where first_name =‘Beill‘ and last_name =‘Cliton‘
如果一個變量(name)中存放著Bill Cliton這個員工的姓名,對於這種情況我們又如何避免全程遍歷?
可以使用一個函數,將變量name中的姓和名分開就可以了,但是有一點需要註意,這個函數是不能作用在索引列上。‘
下面是SQL查詢腳本
select * from employee where first_name = SUBSTR(‘&&name‘,1,INSTR(‘&&name‘,‘ ‘)-1) and last_name = SUBSTR(‘&&name‘,INSTR(‘&&name’,‘ ‘)+1)
3. 帶通配符(%)的like語句
以如下SQL講解:
select * from employee where last_name like ‘%cliton%‘
這裏由於通配符(%)在搜尋詞首出現,所以Oracle系統不使用last_name的索引。
在很多情況下可能無法避免這種情況,但是一定要心中有底,通配符如此使用會降低查詢速度。
然而當通配符出現在字符串其他位置時,優化器就能利用索引。
在下面的查詢中索引得到了使用:
select * from employee where last_name like ‘c%‘
讀者註意:項目真實開發中,如果經常性的模糊查詢,可以采用solr或者elasticSearch或者直接Lucene也可以
4. Order by語句
ORDER BY語句決定了Oracle如何將返回的查詢結果排序。
Order by語句對要排序的列沒有什麽特別的限制,也可以將函數加入列中(聯接或者附加等)。
任何在Order by語句的非索引項或者有計算表達式都將降低查詢速度。
仔細檢查order by語句以找出非索引項或者表達式,它們會降低性能。
解決這個問題的辦法就是重寫order by語句以使用索引,也可以為所使用的列建立另外一個索引,同時應絕對避免在order by子句中使用表達式。
5. NOT 的理想替代方案
我們在查詢時經常在where子句使用一些邏輯表達式,如大於、小於、等於以及不等於等等,
也可以使用and(與)、or(或)以及not(非)。NOT可用來對任何邏輯運算符號取反。
下面是一個NOT子句的例子:
... where not (status =‘VALID‘)
如果要使用NOT,則應在取反的短語前面加上括號,並在短語前面加上NOT運算符。
NOT運算符包含在另外一個邏輯運算符中,這就是不等於(<>;)運算符。
換句話說,即使不在查詢where子句中顯式地加入NOT詞,NOT仍在運算符中,
見下例:
... where status <>‘INVALID‘
再看下面這個例子:
select * from employee where salary<>3000;
對這個查詢,可以改寫為不使用NOT:
select * from employee where salary<3000 or salary>3000;
雖然這兩種查詢的結果一樣,但是第二種查詢方案會比第一種查詢方案更快些。第二種查詢允許Oracle對salary列使用索引,而第一種查詢則不能使用索引。
6. IN和EXISTS(下面有個重復的)
有時候會將一列和一系列值相比較。最簡單的辦法就是在where子句中使用子查詢。在where子句中可以使用兩種格式的子查詢。
第一種格式是使用IN操作符:
... where column in(select * from ... where ...);
第二種格式是使用EXIST操作符:
... where exists (select ‘X‘ from ...where ...);
我相信絕大多數人會使用第一種格式,因為它比較容易編寫,而實際上第二種格式要遠比第一種格式的效率高。
在Oracle中可以幾乎將所有的IN操作符子查詢改寫為使用EXISTS的子查詢。
第二種格式中,子查詢以‘select ‘X‘開始。運用EXISTS子句不管子查詢從表中抽取什麽數據它只查看where子句。
這樣優化器就不必遍歷整個表而僅根據索引就可完成工作(這裏假定在where語句中使用的列存在索引)。
相對於IN子句來說,EXISTS使用相連子查詢,構造起來要比IN子查詢困難一些。
通過使用EXIST,Oracle系統會首先檢查主查詢,然後運行子查詢直到它找到第一個匹配項,這就節省了時間。
Oracle系統在執行IN子查詢時,首先執行子查詢,並將獲得的結果列表存放在在一個加了索引的臨時表中。
在執行子查詢之前,系統先將主查詢掛起,待子查詢執行完畢,存放在臨時表中以後再執行主查詢。這也就是使用EXISTS比使用IN通常查詢速度快的原因。
同時應盡可能使用NOT EXISTS來代替NOT IN,盡管二者都使用了NOT(不能使用索引而降低速度),NOT EXISTS要比NOT IN查詢效率更高
7、Select子句中避免使用 “ * ”:
當你想在select子句中列出所有的column時,使用動態SQL列引用 ‘*‘ 是一個方便的方法。
不幸的是,這是一個非常低效的方法。
實際上,ORACLE在解析的過程中,會將 ‘*‘ 依次轉換成所有的列名, 這個工作是通過查詢數據字典完成的, 這意味著將耗費更多的時間。
8、減少訪問數據庫的次數:
當執行每條SQL語句時,ORACLE在內部執行了許多工作:
解析SQL語句、估算索引的利用率、綁定變量、讀數據塊等等。
由此可見,減少訪問數據庫的次數,就能實際上減少ORACLE的工作量。
舉例:
題目——我要查找編號為0001、0002學生的信息。
(低效)
select name,age,gender,address from t_student where id = ‘0001‘; select name,age,gender,address from t_student where id = ‘0002‘;
(高效)
select a.name,a.age,a.gender,a.address,b.name,b.age,b.gender,b.address from t_student a,t_student b where a.id = ‘0001‘ and b.id = ‘0002‘;
9、使用Decode函數來減少處理時間:
使用DECODE函數可以避免重復掃描相同記錄或重復連接相同的表。
舉例:
(低效)
select count(*), sum(banace) from table1 where dept_id = ‘0001‘ and name like ‘anger%‘; select count(*), sum(banace) from table1 where dept_id = ‘0002‘ and name like ‘anger%‘;
(高效)
select count(decode(dept_id,‘0001‘,‘XYZ‘,null)) count_01,count(decode(dept_id,‘0002‘,‘XYZ‘,null)) count_02, sum(decode(dept_id,‘0001‘,dept_id,null)) sum_01,sum(decode(dept_id,‘0002‘,dept_id,null)) sum_02 from table1 where name like ‘anger%‘;
10、整合簡單,無關聯的數據庫訪問:
如果你有幾個簡單的數據庫查詢語句,你可以把它們整合到一個查詢中(即使它們之間沒有關系)
舉例:
(低效)
select name from table1 where id = ‘0001‘; select name from table2 where id = ‘0001‘; select name from table3 where id = ‘0001‘;
(高效)
select t1.name, t2.name, t3.name from table1 t1, table2 t2, table3 t3 where t1.id(+) = ‘0001‘ and t2.id(+) = ‘0001‘ and t3.id(+) = ‘0001‘
註:上面例子雖然高效,但是可讀性差,需要量情而定啊!
11、刪除重復記錄:
最高效的刪除重復記錄方法 ( 因為使用了ROWID)
舉例:
delete from table1 t1 where t1.rowid > (select min(t2.rowid) from table1 t2 where t1.id = t2.id);
12、盡量不要使用having子句,可以考慮用where替換:
having只會在檢索出所有記錄之後才對結果集進行過濾. 這個處理需要排序,總計等操作。
如果能通過where子句限制記錄的數目,那就能減少這方面的開銷。
13、盡量用表的別名:
當在SQL語句中連接多個表時,請使用表的別名並把別名前綴於每個Column上。
這樣一來,就可以減少解析的時間並減少那些由Column歧義引起的語法錯誤。
14、用exists替換distinct:
當提交一個包含一對多表信息的查詢時,避免在select子句中使用distinct. 一般可以考慮用exists替換
舉例:
(低效)
select distinct d.dept_no, d.dept_name from t_dept d, t_emp e where d.dept_no = e.dept_no;
(高效)
select d.dept_no, d.dept_name from t_dept d where exists (select 1 from t_emp where d.dept_no = e.dept_no);
exists使查詢更為迅速,因為RDBMS核心模塊將在子查詢的條件一旦滿足後,立刻返回結果.
15、用表連接替換exists:
通常來說,采用表連接的方式比exists更有效率。
舉例:
(低效)
select ename from emp e where exists (select 1 from dept where dept_no = e.dept_no and dept_cat = ‘W‘);
(高效)
select ename from dept d, emp e where e.dept_no = d.dept_no and dept_cat = ‘W‘;
Oracle SQL調優