hibernate 如何實現延遲載入
延遲載入機制是為了避免一些無謂的效能開銷而提出來的,所謂延遲載入就是當在真正需要資料的時候,才真正執行資料載入操作。在Hibernate中提供了對實體物件的延遲載入以及對集合的延遲載入,另外在Hibernate3中還提供了對屬性的延遲載入。下面我們就分別介紹這些種類的延遲載入的細節。
A、實體物件的延遲載入:
如果想對實體物件使用延遲載入,必須要在實體的對映配置檔案中進行相應的配置,如下所示:
<hibernate-mapping>
<class name=”net.ftng.entity.user” table=”user” lazy=”true”>
……
</class>
</hibernate-mapping>
通過將class的lazy屬性設定為true,來開啟實體的延遲載入特性。如果我們執行下面的程式碼:
User user=(User)session.load(User.class,”1”);(1)
System.out.println(user.getName());(2)
當執行到(1)處時,Hibernate並沒有發起對資料的查詢,如果我們此時通過一些除錯工具(比如JBuilder2005的Debug工具),觀察此時user物件的記憶體快照,我們會驚奇的發現,此時返回的可能是User$EnhancerByCGLIB$$bede8986型別的物件,而且其屬性為null,這是怎麼回事?還記得前面我曾講過session.load()方法,會返回實體物件的代理類物件,這裡所返回的物件型別就是User物件的代理類物件。在Hibernate中通過使用CGLIB,來實現動態構造一個目標物件的代理類物件,並且在代理類物件中包含目標物件的所有屬性和方法,而且所有屬性均被賦值為null。通過偵錯程式顯示的記憶體快照,我們可以看出此時真正的User物件,是包含在代理物件的CGLIB$CALBACK_0.target屬性中,當代碼執行到(2)處時,此時呼叫user.getName()方法,這時通過CGLIB賦予的回撥機制,實際上呼叫CGLIB$CALBACK_0.getName()方法,當呼叫該方法時,Hibernate會首先檢查CGLIB$CALBACK_0.target屬性是否為null,如果不為空,則呼叫目標物件的getName方法,如果為空,則會發起資料庫查詢,生成類似這樣的SQL語句:select * from user where id=’1’;來查詢資料,並構造目標物件,並且將它賦值到CGLIB$CALBACK_0.target屬性中。
這樣,通過一箇中間代理物件,Hibernate實現了實體的延遲載入,只有當用戶真正發起獲得實體物件屬性的動作時,才真正會發起資料庫查詢操作。所以實體的延遲載入是用通過中間代理類完成的,所以只有session.load()方法才會利用實體延遲載入,因為只有session.load()方法才會返回實體類的代理類物件。
B、 集合型別的延遲載入:
在Hibernate的延遲載入機制中,針對集合型別的應用,意義是最為重大的,因為這有可能使效能得到大幅度的提高,為此Hibernate進行了大量的努力,其中包括對JDK Collection的獨立實現,我們在一對多關聯中,定義的用來容納關聯物件的Set集合,並不是java.util.Set型別或其子型別,而是net.sf.hibernate.collection.Set型別,通過使用自定義集合類的實現,Hibernate實現了集合型別的延遲載入。為了對集合型別使用延遲載入,我們必須如下配置我們的實體類的關於關聯的部分:
<hibernate-mapping>
<class name=”net.ftng.entity.User” table=”user”>
…..
<set name=”addresses” table=”address” lazy=”true” inverse=”true”>
<key column=”user_id”/>
<one-to-many class=”net.ftng.entity.Arrderss”/>
</set>
</class>
</hibernate-mapping>
通過將<set>元素的lazy屬性設定為true來開啟集合型別的延遲載入特性。我們看下面的程式碼:
User user=(User)session.load(User.class,”1”);
Collection addset=user.getAddresses(); (1)
Iterator it=addset.iterator(); (2)
while(it.hasNext()){
Address address=(Address)it.next();
System.out.println(address.getAddress());
}
當程式執行到(1)處時,這時並不會發起對關聯資料的查詢來載入關聯資料,只有執行到(2)處時,真正的資料讀取操作才會開始,這時Hibernate會根據快取中符合條件的資料索引,來查詢符合條件的實體物件。
這裡我們引入了一個全新的概念——資料索引,下面我們首先將接一下什麼是資料索引。在Hibernate中對集合型別進行快取時,是分兩部分進行快取的,首先快取集合中所有實體的id列表,然後快取實體物件,這些實體物件的id列表,就是所謂的資料索引。當查詢資料索引時,如果沒有找到對應的資料索引,這時就會一條select SQL的執行,獲得符合條件的資料,並構造實體物件集合和資料索引,然後返回實體物件的集合,並且將實體物件和資料索引納入Hibernate的快取之中。另一方面,如果找到對應的資料索引,則從資料索引中取出id列表,然後根據id在快取中查詢對應的實體,如果找到就從快取中返回,如果沒有找到,在發起select SQL查詢。在這裡我們看出了另外一個問題,這個問題可能會對效能產生影響,這就是集合型別的快取策略。如果我們如下配置集合型別:
<hibernate-mapping>
<class name=”net.ftng.entity.User” table=”user”>
…..
<set name=”addresses” table=”address” lazy=”true” inverse=”true”>
<cache usage=”read-only”/>
<key column=”user_id”/>
<one-to-many class=”net.ftng.entity.Arrderss”/>
</set>
</class>
</hibernate-mapping>
這裡我們應用了<cache usage=”read-only”/>配置,如果採用這種策略來配置集合型別,Hibernate將只會對資料索引進行快取,而不會對集合中的實體物件進行快取。如上配置我們執行下面的程式碼:
User user=(User)session.load(User.class,”1”);
Collection addset=user.getAddresses();
Iterator it=addset.iterator();
while(it.hasNext()){
Address address=(Address)it.next();
System.out.println(address.getAddress());
}
System.out.println(“Second query……”);
User user2=(User)session.load(User.class,”1”);
Collection it2=user2.getAddresses();
while(it2.hasNext()){
Address address2=(Address)it2.next();
System.out.println(address2.getAddress());
}
執行這段程式碼,會得到類似下面的輸出:
Select * from user where id=’1’;
Select * from address where user_id=’1’;
Tianjin
Dalian
Second query……
Select * from address where id=’1’;
Select * from address where id=’2’;
Tianjin
Dalian
我們看到,當第二次執行查詢時,執行了兩條對address表的查詢操作,為什麼會這樣?這是因為當第一次載入實體後,根據集合型別快取策略的配置,只對集合資料索引進行了快取,而並沒有對集合中的實體物件進行快取,所以在第二次再次載入實體時,Hibernate找到了對應實體的資料索引,但是根據資料索引,卻無法在快取中找到對應的實體,所以Hibernate根據找到的資料索引發起了兩條select SQL的查詢操作,這裡造成了對效能的浪費,怎樣才能避免這種情況呢?我們必須對集合型別中的實體也指定快取策略,所以我們要如下對集合型別進行配置:
<hibernate-mapping>
<class name=”net.ftng.entity.User” table=”user”>
…..
<set name=”addresses” table=”address” lazy=”true” inverse=”true”>
<cache usage=”read-write”/>
<key column=”user_id”/>
<one-to-many class=”net.ftng.entity.Arrderss”/>
</set>
</class>
</hibernate-mapping>
此時Hibernate會對集合型別中的實體也進行快取,如果根據這個配置再次執行上面的程式碼,將會得到類似如下的輸出:
Select * from user where id=’1’;
Select * from address where user_id=’1’;
Tianjin
Dalian
Second query……
Tianjin
Dalian
這時將不會再有根據資料索引進行查詢的SQL語句,因為此時可以直接從快取中獲得集合型別中存放的實體物件。
C、 屬性延遲載入:
在Hibernate3中,引入了一種新的特性——屬性的延遲載入,這個機制又為獲取高效能查詢提供了有力的工具。在前面我們講大資料物件讀取時,在User物件中有一個resume欄位,該欄位是一個java.sql.Clob型別,包含了使用者的簡歷資訊,當我們載入該物件時,我們不得不每一次都要載入這個欄位,而不論我們是否真的需要它,而且這種大資料物件的讀取本身會帶來很大的效能開銷。在Hibernate2中,我們只有通過我們前面講過的面效能的粒度細分,來分解User類,來解決這個問題(請參照那一節的論述),但是在Hibernate3中,我們可以通過屬性延遲載入機制,來使我們獲得只有當我們真正需要操作這個欄位時,才去讀取這個欄位資料的能力,為此我們必須如下配置我們的實體類:
<hibernate-mapping>
<class name=”net.ftng.entity.User” table=”user”>
……
<property name=”resume” type=”java.sql.Clob” column=”resume” lazy=”true”/>
</class>
</hibernate-mapping>
通過對<property>元素的lazy屬性設定true來開啟屬性的延遲載入,在Hibernate3中為了實現屬性的延遲載入,使用了類增強器來對實體類的Class檔案進行強化處理,通過增強器的增強,將CGLIB的回撥機制邏輯,加入實體類,這裡我們可以看出屬性的延遲載入,還是通過CGLIB來實現的。CGLIB是Apache的一個開源工程,這個類庫可以操縱java類的位元組碼,根據位元組碼來動態構造符合要求的類物件。根據上面的配置我們執行下面的程式碼:
String sql=”from User user where user.name=’zx’ ”;
Query query=session.createQuery(sql); (1)
List list=query.list();
for(int i=0;i<list.size();i++){
User user=(User)list.get(i);
System.out.println(user.getName());
System.out.println(user.getResume()); (2)
}
當執行到(1)處時,會生成類似如下的SQL語句:
Select id,age,name from user where name=’zx’;
這時Hibernate會檢索User實體中所有非延遲載入屬性對應的欄位資料,當執行到(2)處時,會生成類似如下的SQL語句:
Select resume from user where id=’1’;
這時會發起對resume欄位資料真正的讀取操作。