HtmlAgilityPack抓取糗事百科內容
阿新 • • 發佈:2017-11-18
console lag node document 24小時 ner readline collect ldo
本文實例講述了C#使用HtmlAgilityPack抓取糗事百科內容的方法。分享給大家供大家參考。具體實現方法如下:
Console.WriteLine("*****************糗事百科24小時熱門*******************"); Console.WriteLine("請輸入頁碼,輸入0退出"); string page = Console.ReadLine(); while (page!="0") { HtmlWeb htmlWeb = new HtmlWeb(); HtmlDocument htmlDoc = htmlWeb.Load("http://www.qiushibaike.com/hot/page/"+page); HtmlNodeCollection qiuNodeList = htmlDoc.DocumentNode.SelectNodes("//*[@class=‘content‘]"); foreach (HtmlNode qiuCont in qiuNodeList) { Console.WriteLine(qiuCont.InnerHtml); Console.WriteLine("******************************************************************************"); } Console.WriteLine("請輸入頁碼,輸入0退出"); page = Console.ReadLine(); }
運行效果如下圖所示:
HtmlAgilityPack抓取糗事百科內容