1. 程式人生 > >Java解析html頁面,獲取想要的元素

Java解析html頁面,獲取想要的元素

parse tails src www 標準 pro 1.8 com 9.png

背景:通過接口訪問數據,獲取的內容是個標準的html格式,使用jsoup的方式獲取頁面元素值

先推薦比較好的博客:http://www.open-open.com/jsoup/、 單個案例比較不錯

http://blog.csdn.net/u010814849/article/details/52526582 整合內容很多

1.插件下載並安裝

官網安裝地址:http://jsoup.org/packages/jsoup-1.8.1.jar

2.使用(目前都是用的css方式定位元素)

1.獲取這個網頁的商品標題內容

技術分享

代碼說明:response為頁面的網頁元素,一個標準的html

Document doc = Jsoup.parse(resopnes); //
使用jsoup 進行語言轉換 String getTitle = doc.select("#goods_title").attr("value");// 商品標題 #使用css方式

技術分享

2. 獲取靜態頁面的標題,元素input

技術分享

可直接使用瀏覽器的css方式:#showtab0 > tbody > tr:nth-child(2) > td:nth-child(2) > input.input_style

Document doc = Jsoup.parse(resopnes); // 使用jsoup 進行語言轉換
String getProductName = doc.select("#showtab0 > tbody > tr:nth-child(2) > td:nth-child(2) > input.input_style").attr("value");
System.out.println("商品名稱:"+getProductName);

技術分享

3.獲取其他說明,元素為textarea

技術分享

String detail = doc.select("#goods_desc_en").text();// 詳細描述
System.out.println("詳細描述"+detail);

技術分享

Java解析html頁面,獲取想要的元素