1. 程式人生 > >java小作業(十八)

java小作業(十八)

1.利用common-io和jsoup去爬鳳凰網 實現能夠將新聞的標題和內容寫入到D:\\zp\\xieru.txt中

package com.sj.homework;

import java.io.File;
import java.io.IOException;

import org.apache.commons.io.FileUtils;
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;

/**
 * @desc	利用common-io和jsoup去爬鳳凰網 實現能夠將新聞的標題和內容寫入到E:\\zp\\xieru.txt中
 * @author 	ws
 * @time	8.15
 */
public class Test {
	public static void main(String[] args) throws IOException {
		String urlPath = "http://news.ifeng.com/a/20180815/59831553_0.shtml";//html路徑
		Document document = Jsoup.connect(urlPath).post();//獲取文件物件
		String yc_tit_txt = document.getElementsByTag("h1").text();//獲取標題文字
		
		String yc_con_txt = document.getElementById("yc_con_txt").text();//獲取內容文字
		
		String filePath = "E:/zp/xieru.txt";//存放檔案路徑
		String str = "標題:\n\t"+yc_tit_txt+"\n內容:\n\t"+yc_con_txt;//存放檔案的內容
		File file = new File(filePath);//檔案新增到記憶體
		FileUtils.write(file, str);//寫入檔案
		System.out.println("寫入成功");//寫入結果輸出控制檯
	}
}

2.利用common-io實現對xieru.txt進行逐行讀取並將結果輸出在控制檯上

package com.sj.homework;

import java.io.File;
import java.io.IOException;
import java.util.List;

import org.apache.commons.io.FileUtils;

/**
 * @desc	利用common-io實現對xieru.txt進行逐行讀取並將結果輸出在控制檯上
 * @author 	ws
 * @time	8.15
 */
public class Test2 {
	public static void main(String[] args) throws IOException {
		String path = "E:/zp/xieru.txt";//檔案路徑
		File file = new File(path);//寫入記憶體
		List<String> list = FileUtils.readLines(file, "UTF-8");//讀取每行,存入list
		for (String every : list) {//foreach逐個輸出在控制檯
			System.out.println(every);
		}
	}
}

3.利用common-io和jsoup去爬取該url=http://news.ifeng.com/a/20180814/59812253_0.shtml,計算一下當前網頁中出現了多少次抖音,並將結果輸出在控制檯上

package com.sj.homework;

import java.io.IOException;

import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;

/**
 * @desc	利用common-io和jsoup去爬取該url=http://news.ifeng.com/a/20180814/59812253_0.shtml,
 * 			計算一下當前網頁中出現了多少次抖音,並將結果輸出在控制檯上
 * @author 	ws
 * @time	8.15
 */
public class Test3 {
	public static void main(String[] args) throws IOException {
		String url = "http://news.ifeng.com/a/20180814/59812253_0.shtml";//html路徑
		Document element = Jsoup.connect(url).post();//獲取文件
		String str = element.text();//獲取字串型別的文件
		int num = str.split("抖音").length-1;//分隔抖音字元,獲取出現次數
		System.out.println("抖音出現的次數為:"+num);//結果輸出在控制檯
	}
}