C# HTML解析工具HtmlAgilityPack使用例項（二）--Web頁面

阿新 • • 發佈：2019-01-10

一、使用XPath精確解析指定的Dom節點

XPath字串的簡單獲取方法，是在瀏覽器開發者工具中指定節點右鍵》“Copy XPath”

如圖

//載入Web 的頁面並解析內容
string rowPath = "/html/body/div[2]/div[2]";
HtmlWeb web = new HtmlWeb();
HtmlDocument doc = web.Load("http://www.gongjuji.net");
//以document 為基準
HtmlNode row = doc.DocumentNode.SelectSingleNode(rowPath);
//建立row為基準
row = HtmlNode.CreateNode(row.OuterHtml);
HtmlNodeCollection titles = row.SelectNodes("//h3");
foreach (var item in titles)
{
    Console.WriteLine(item.InnerText);
}
HtmlNodeCollection links = doc.DocumentNode.SelectNodes("//a");
foreach (HtmlNode item in links)
{
    Console.WriteLine(item.Attributes["href"].Value);
}
Console.WriteLine("------->解析結束");

二、使用XPath的模糊查詢，基於document或者新建基點查詢

//載入Web 的頁面並解析內容
HtmlWeb web = new HtmlWeb();
HtmlDocument doc = web.Load("http://www.gongjuji.net");
HtmlNode row = doc.DocumentNode.SelectSingleNode("//div[@class='row']");
//以document為基準查詢
HtmlNodeCollection col = row.SelectNodes("//div[@class='thumbnail']");
foreach (HtmlNode item in col)
{
    //使用CreateNode（）來建立新的查詢基準
    HtmlNode thumbnail = HtmlNode.CreateNode(item.OuterHtml);
    HtmlNode title = thumbnail.SelectSingleNode("//h3");
    Console.Write("標題：" + title.InnerText);
    HtmlNode a = thumbnail.SelectSingleNode("//a");
    Console.WriteLine("\t連結：" + a.Attributes["href"].Value);
}
Console.WriteLine("------解析結束");

C# HTML解析工具HtmlAgilityPack使用例項（二）--Web頁面

一、使用XPath精確解析指定的Dom節點 XPath字串的簡單獲取方法，是在瀏覽器開發者工具中指定節點右鍵》“Copy XPath” 如圖 //載入Web 的頁面並解析內容 string rowP

C# HTML解析工具HtmlAgilityPack使用簡介

Html Agility Pack 不算一個很複雜的類庫，但它的功能確不弱，為解析DOM已經提供了足夠強大的功能支援，可以跟jQuery操作DOM媲美：） Html Agility Pack最常用的基礎類其實不多，對解析DOM來說，就只有HtmlDocument和Html

Python 命令列解析工具 Argparse介紹（二）

今天學習python的argparse模組。看到了這樣一篇文章，連結 http://www.cnblogs.com/jianboqi/archive/2013/01/10/2854726.html，題目是Python 命令列解析工具 Argparse介紹（一），翻譯自pyt

webpack構建工具學習總結（二）webpack.config.js配置檔案解析

1、新建webpack.config.js檔案配置webpack資訊，新建src資料夾存放原始檔，新建dist資料夾存放打包後的檔案 2、在開始配置之前需要理解四個核心概念：入口（entry）、輸出（output）、loader、外掛（plugins） 1.

ETL抽取工具informatica powercenter designer例項（二）

一、建立任務Task 1. 建立一個任務（session）.下圖命名有誤應該為S_ 而非WF_。點選“W”圖示，進入任務定義。任務中Sessions命名：S_分省標識_表名。任務中WorkFlows命名： WF_表格 9.1:建立

c語言數據類型（二）

nbsp tex 字符 pre 字符串輸入 mce 一個命令 char 類型 1.char 變量常量　　char c; 定義一個char變量　　c = ‘a’ ‘a‘字符常量　　char 的本質就是一個整數，只有一個字節大小的整數 2.printf 輸出ch

C++深度解析教程學習筆記（3）函數的擴展

插入分享技術 lsp 預處理器 _for 返回忽略結合 1.內聯函數 1.1.常量與宏的回顧 (1)C++中的 const 常量可以替代宏常數定義,如: const int A = 3; //等價於 #define A 3 (2)C++中是否有解決方案,可以用來

C語言老司機學Python （二）

append 設計 sta one list 老板 com oob als 標準數據類型：共6種：Number（數字），String（字符串），List（列表），Tuple（元組），Sets（集合），Dictionary（字典）本次學習主要是和數據類型混個臉熟，

.net從網絡接口地址獲取json，然後解析成對象（二）

ESS 代碼 ring amp type .get div cep quest 整理代碼，這是第二種方法來讀取json，然後反序列化成對象的，代碼如下： 1 public static Order GetOrderInfo(string _tid, string _or

HTML常用元素和屬性（二）

類型語言 javascrip load height mail rip bubuko name 4：使用a元素添加超鏈接和錨點 <href>指定超鏈接連接到另外一個資源 <hreflang>指定超鏈接所連接的文檔所使用的語言 <target&

C# 設置Excel條件格式（二）

result pbo 調試運行註意 sin 兩個 collect raw gree 上一篇文章中介紹了關於設置Excel條件格式，包括基於單元格值、自定義公式等應用條件格式、應用數據條條件類型格式、刪除條件格式等內容。在本篇文章中將繼續介紹C# 設置條件格式的方法。要點

mybatis源碼-解析配置文件（二）之解析的流程

close ria 操作 exp 記得 resource build reset sed 1. 簡介在之前的文章《mybatis 初步使用（IDEA的Maven項目, 超詳細）》中，講解了mybatis的初步使用，並總結了以下mybatis的執行流程：通過 Re

C++多線程同步技巧（二）--- 事件

create include 解鎖 signed 選擇參數 bre tdi 人工簡介 Windows在線程同步方面提供了多種信號處理機制，其中一種便是使用 CreateEvent() 函數創建事件，然後使用信號控制同步。其中將事件變為有信號可使用 SetEvent()

開發工具之Git（二）

一次別名拉取官網 wan img log 方法用戶目錄四、Git安裝與配置（一）安裝（二）配置（三）創建倉庫五、Git基本命令六、Git分支上一篇講了Git的基本原理，建議沒看過的同學先看看，然後這次我們來講Git的具體操作和指令。四、G

網路程式設計基礎【day08】：簡單socket例項（二）

本節內容 1、概述 2、socket例項 3、總結一、概述　　之前我們只是介紹了soket的概念和一些邏輯圖表，下面我們來看看，socket的客戶端和服務端到底是怎麼用的？二、socket例項 2.1 客戶端 2.1.1 客戶端程式碼邏輯圖 2.1.2 客戶端程式碼

C# VS2012下的3D顯示（二）

下載dll，也就是執行庫。 http://www.codeproject.com/KB/openGL/sharpgl/Core.zip 網速慢，反正下載解壓後是這樣：然後就相對簡單了，找了一份攻略，http://crazylove.blog.51cto.com/855385/

【C++】Vector的陣列用法（二）

1.定義 vector<vector<int>>a; 2.初始化 a.resize(row,vector<int>(column)); a.resize(row);for (int i = 0; i < row;

《面向物件程式設計——C++語言描述》學習筆記（二）

第二章從C到C++ 2.1main函式 1.C++中需要寫int main（）不能只是main（） 2.main()函式裡面最後有一個return 0； 3.main（）被啟動程式碼呼叫，而啟動程式碼是編譯器新增到程式中的，是程式和作業系統的橋樑。 4.C++中main（）中

C#微信公眾號開發 -- （二）驗證成為開發者

接下來就是驗證成為開發者了。先來看一下驗證的介面及需要填寫的資訊在介面配置資訊中填寫需要處理驗證資訊的頁面或者一般性處理檔案，這裡以aspx頁面為例 URl中的格式為：http://XXX.com/wxapi.aspx ，其中XXX.com也即是上文提到的需要有一個外網可以訪問的域名，wxapi.a

【前端基礎筆記】——關於HTML標簽小知識（二）

nbsp 更新點擊 name屬性 style con 最好 tex ble http-server 是一個簡單的零配置命令行HTTP服務器, 基於 nodeJs. 安裝-$ npm install http-server -g 開啟 http-server服務，終端進入目

C# HTML解析工具HtmlAgilityPack使用例項（二）--Web頁面

一、使用XPath精確解析指定的Dom節點

二、使用XPath的模糊查詢，基於document或者新建基點查詢

相關推薦