java小作業(十八)
阿新 • • 發佈:2018-12-11
1.利用common-io和jsoup去爬鳳凰網 實現能夠將新聞的標題和內容寫入到D:\\zp\\xieru.txt中
package com.sj.homework; import java.io.File; import java.io.IOException; import org.apache.commons.io.FileUtils; import org.jsoup.Jsoup; import org.jsoup.nodes.Document; /** * @desc 利用common-io和jsoup去爬鳳凰網 實現能夠將新聞的標題和內容寫入到E:\\zp\\xieru.txt中 * @author ws * @time 8.15 */ public class Test { public static void main(String[] args) throws IOException { String urlPath = "http://news.ifeng.com/a/20180815/59831553_0.shtml";//html路徑 Document document = Jsoup.connect(urlPath).post();//獲取文件物件 String yc_tit_txt = document.getElementsByTag("h1").text();//獲取標題文字 String yc_con_txt = document.getElementById("yc_con_txt").text();//獲取內容文字 String filePath = "E:/zp/xieru.txt";//存放檔案路徑 String str = "標題:\n\t"+yc_tit_txt+"\n內容:\n\t"+yc_con_txt;//存放檔案的內容 File file = new File(filePath);//檔案新增到記憶體 FileUtils.write(file, str);//寫入檔案 System.out.println("寫入成功");//寫入結果輸出控制檯 } }
2.利用common-io實現對xieru.txt進行逐行讀取並將結果輸出在控制檯上
package com.sj.homework; import java.io.File; import java.io.IOException; import java.util.List; import org.apache.commons.io.FileUtils; /** * @desc 利用common-io實現對xieru.txt進行逐行讀取並將結果輸出在控制檯上 * @author ws * @time 8.15 */ public class Test2 { public static void main(String[] args) throws IOException { String path = "E:/zp/xieru.txt";//檔案路徑 File file = new File(path);//寫入記憶體 List<String> list = FileUtils.readLines(file, "UTF-8");//讀取每行,存入list for (String every : list) {//foreach逐個輸出在控制檯 System.out.println(every); } } }
3.利用common-io和jsoup去爬取該url=http://news.ifeng.com/a/20180814/59812253_0.shtml,計算一下當前網頁中出現了多少次抖音,並將結果輸出在控制檯上
package com.sj.homework; import java.io.IOException; import org.jsoup.Jsoup; import org.jsoup.nodes.Document; /** * @desc 利用common-io和jsoup去爬取該url=http://news.ifeng.com/a/20180814/59812253_0.shtml, * 計算一下當前網頁中出現了多少次抖音,並將結果輸出在控制檯上 * @author ws * @time 8.15 */ public class Test3 { public static void main(String[] args) throws IOException { String url = "http://news.ifeng.com/a/20180814/59812253_0.shtml";//html路徑 Document element = Jsoup.connect(url).post();//獲取文件 String str = element.text();//獲取字串型別的文件 int num = str.split("抖音").length-1;//分隔抖音字元,獲取出現次數 System.out.println("抖音出現的次數為:"+num);//結果輸出在控制檯 } }