php使用自帶dom擴充套件進行元素匹配的原理解析

阿新 • • 發佈：2020-05-30

DOMDocument

php提供了非常好用的解析html和xml文件的擴充套件庫DOM，使用這個庫可以非常高效的進行html和xml文件的解析，它的原理就是通過尋找首尾匹配對來進行文件的解析。

從上面的分析可以看出，如果首位不匹配，可能就會導致一些錯誤的出現，因此，這個時候我們需要設定

libxml_use_internal_errors(true);

來進行錯誤的遮蔽，讓它可以解析整個文件。

解析html基本用法

$dom = new \DOMDocument;
$content = htmlspecialchars_decode($content);
libxml_use_internal_errors(true);
$content = mb_convert_encoding($content,'HTML-ENTITIES','UTF-8');
$dom->loadHTML($content);

$content是要解析的html字串，其中我們對它進行了轉義，因為可能含有實體集，然後我們有進行了編碼的轉換，因為可能文件不是utf-8格式的，會導致日文，法文等文字亂碼。

獲取元素

$a = $dom->getElementsByTagName('a');
$p = $dom->getElementsByTagName('p');

遍歷元素

$elements = $dom->getElementsByTagName('a');
foreach ($elements as $element) {
  $element->textContent = '替換成其它的文字';
}

通過上面的迴圈，可以將全部a標籤的文字替換掉。

元素巢狀

有些時候，html會巢狀很多層，比如

<div>
<p>
<a href="xxx" rel="external nofollow" >我是文字</a>
</p>
<p>
內容替換
</p>
</div>

如果我們想要對p標籤文字進行替換的化，並且不想要替換含有子元素的內容，就是這裡的a標籤不想替換，下面的語句不能夠解決我們的問題：

$elements = $dom->getElementsByTagName('p');
foreach ($elements as $element) {
  if($element->hasChildNodes()){
    $element->textContent = 'p標籤內容替換';
  }
}

上面的代會將a標籤的內容也替換掉，這不是我們想要的結果，因為hasChildNodes()這個函式表示的含有內容，無論它是標籤還是文字，它都是返回true的，除非它是空標籤，例如

它才會返回false.

所以我們需要自己封裝一個函式進行檢查是否含有巢狀標籤。

function hasChild($element,$tags)
{
  foreach($tags as $v){
  $elements = $element->getElementsByTagName($v);

  if($elements->length){
  return true;
  }

  }
  return false;
}
$tags = array('title','h1','h2','h3','h4','h5','a','p','dd','img');  

$elements = $dom->getElementsByTagName('p');
foreach ($elements as $element) {
  if(hasChild($element,$tags)){
    $element->textContent = 'p標籤內容替換';
  }
}

通過我們自己封裝的函式，就可以判斷出$dom的node節點是否含有子標籤。

總結

到此這篇關於php使用自帶dom擴充套件進行元素匹配的文章就介紹到這了,更多相關php元素匹配內容請搜尋我們以前的文章或繼續瀏覽下面的相關文章希望大家以後多多支援我們！

php使用自帶dom擴充套件進行元素匹配的原理解析

DOMDocument php提供了非常好用的解析html和xml文件的擴充套件庫DOM，使用這個庫可以非常高效的進行html和xml文件的解析，它的原理就是通過尋找首尾匹配對來進行文件的解析。

win10用自帶安全軟體進行病毒掃描的詳細步驟

電腦執行時間久了，難免會遇到一些故障問題，windows10系統自帶有windows Defender安全中心，如果你覺得電腦廣告非常煩人，可以試著用自帶windows Defender安全中心來去除，操作簡單，不需要下載任何第三方軟體。那麼

用 PHP 自帶函式 fputcsv 和 fgetcsv 來匯出和匯入csv

PHP 自帶函式 fputcsv 可以實現列印報表（Excel）功能。如果你的對報表格式要求不是很高，那麼 fputcsv 是很好的選擇。它執行效率高，不需要第三方庫，用起來很方便。

Python帶引數的裝飾器執行原理解析

關於裝飾器的理解，特別像《盜夢空間》中的進入夢境和從夢境出來的過程，一層一層的深入夢境，然後又一層一層的返回，被帶入夢境的是被裝飾的函式，裝飾器就是使人入夢的工具。

Python logging模組進行封裝實現原理解析

1. 簡介追蹤某些軟體執行時所發生事件的方法,可以在程式碼中呼叫日誌中某些方法來記錄發生的事情

django 解決擴充套件自帶User表遇到的問題

首先要擴充套件自帶的auth_user表我就放個圖吧，同時setting中應該設定： # 此處過載是為了使UserProfile生效

win10怎麼進行磁碟分割槽？老司機教你用win10自帶軟體進行磁碟分割槽

電腦重灌win10系統發現磁碟只有一個C盤，管理和儲存檔案都很方便，於是想要進行磁碟分割槽。網上雖然有很多磁碟分割槽軟體，但是下載後總會捆綁很多流氓軟體，有什麼辦法能不用下載軟體就可以進行磁碟分割槽的，方法

PHP Socket程式設計之 PHP的自帶的三個壓縮相關的函式：gzcompress、gzencode、gzdeflate

PHP的自帶的函式中，有三個壓縮相關的函式：gzcompress、gzencode、gzdeflate，下面我們通過一段程式，來比較一下這三個函式的壓縮比。程式碼：$string=\"8aeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeer8aaaaaaaaaaaaa

使用sklearn自帶的糖尿病資料集，進行迴歸分析

需求：對糖尿病資料集進行迴歸分析，以便對未知資料進行預測。資料集Diabetes：1.包含442個患者的10個生理特徵

如何利用ppt自帶的圖片處理功能進行圖片“扣圖”

如何利用ppt自帶的圖片處理功能進行圖片“扣圖” 2010-09-26 12:53:11 　標籤：功能 ppt 扣圖利用　　　 [推送到技術圈]

將php連線wampserver自帶的MySQL資料庫所遇到各種問題解決辦法

將php連線到MySQL資料庫的方法有很多，在這裡我使用的是mysqli_connect方法，先講一下軟體配置過程所遇到的問題在配置wampserver的時候，因為此軟體自帶有三個服務，只有將這三個服務都啟動，軟體才算可以正常使用，

python自帶快取lru_cache用法及擴充套件(詳細)

本篇部落格將結合python官方文件和原始碼詳細講述lru_cache快取方法是怎麼實現，它與redis快取的區別是什麼，在使用時碰上functiontools.wrap裝飾器時會發生怎樣的變化，以及瞭解它給我們提供了哪些功能然後在其

【PHP】使用PHP原生自帶的觀察者模式

整理自：https://www.cnblogs.com/itbsl/p/13407489.html 搬運貼，如果有侵權請聯絡刪除需求背景

PHP CURL請求帶上Cookie進行GET請求！

$urls = \"\";//URL地址填這裡 $cookies = \"\";//cookie填這裡 //下面是允許請求跨域，跨域刪除

雷蛇釋出筆記本支架幻彩版 V2：自帶 USB-C 擴充套件塢功能

2 月 5 日訊息根據雷蛇官方的訊息，雷蛇筆記本支架幻彩版 V2 現已釋出，自帶 USB Type-C 擴充套件塢功能，支援 RGB 燈效。

string子串匹配（用string自帶函式，不涉及char陣列轉換）

using namespace std; #include <iostream> #include<string> //第1種，用string自帶的s.subdtr()擷取任意子串，再用s.compare()確定是否與待求子串相等，時間複雜度O（len1*len2）

蘋果 macOS 12 Monterey 已移除自帶的 PHP

6 月 20 日訊息蘋果於 WWDC21 釋出了 macOS 12 Monterey 系統更新，添加了快捷指令、Mac /iPad 通用控制等特性，並去掉了一些功能。

parquet列儲存本身自帶壓縮配合snappy或者lzo等可以進行二次壓縮

上傳txt檔案到hdfs，txt檔案大小是74左右。這裡提醒一下，是不是說parquet加lzo可以把資料壓縮到這個地步，因為我的測試資料存在大量重複。所以下面使用parquet和lzo的壓縮效果特別好。

黑客大神用什麼防毒：Windows 自帶的就夠，只是進行了“一點”強化

這年頭 Windows 電腦還需要防毒軟體嗎？現在搜尋這個問題，會發現很多建議都是“裸奔就行”。也就是說對於普通人，只用微軟出廠自帶的免費 Windows Defender 足夠了。那麼非普通人，比如網路安全工程師、黑客們自己用

禁用Firefox自帶的元素檢視工具

對於web前端工程師來說，用Firefox+Firebug進行CSS和JavaScript的除錯已經是非常熟悉和習慣了。如今，新版本的Firefox中又內嵌了一個元素檢視工具（圖1），類似Firebug，但是初步體驗下來，功能遠不如Firebug（圖2）

php使用自帶dom擴充套件進行元素匹配的原理解析

相關推薦