1. 程式人生 > >Asp.net Core 使用AngleSharp 爬蟲圖片

Asp.net Core 使用AngleSharp 爬蟲圖片

發的 install 軟件包管理器 重用 展示 () 當前 效果展示 .text

AngleSharp 簡介

AngleSharp是基於.NET(C#)開發的專門解析HTML源碼的DLL組件。

整個DOM已傳輸到邏輯類結構中。這種結構的一部分可以如下圖所示解決。請註意,該圖片顯示了較舊的DOM模型。anglesharp的當前版本實現了最新的DOM模型,這是稍有不同。盡管如此,這幅圖仍然是有用的,以獲得正確的想法。

AngleSharp是一個.NET庫,使您能夠解析基於角度的超文本,如HTML,SVG和MathMLAngleSharp的一個重要方面是CSS也可以被解析。解析器是建立在官方的W3C規範之上的。

參考

http://www.cnblogs.com/pandait/p/AngleSharp.html

https://www.cnblogs.com/liguobao/p/6130121.html

通過NuGet獲取AngleSharp

將AngleSharp整合到您的項目中最簡單的方法是使用NuGet。您可以通過打開軟件包管理器控制臺(PM)並輸入以下語句來安裝AngleSharp:

Install-Package AngleSharp

您也可以使用圖形庫包管理器(“管理解決方案的NuGet包”)。在官方的NuGet在線源中搜索“AngleSharp”將會找到這個庫。

示例
//創建一個(可重用)解析器前端
 var parser = new HtmlParser();
//html DOM節點
var
source = "<h1>Some example source</h1><p>This is a paragraph element"; //解析源文件 var document = parser.Parse(source); //創建P標簽 var p = document.CreateElement("p"); p.TextContent = "This is another paragraph."; //添加到DOM document.Body.AppendChild(p); //返回完整html var html = document.DocumentElement.OuterHtml; ViewData[
"html"] = html;

效果展示

技術分享

Asp.net Core 使用AngleSharp 爬蟲圖片