使用phpQuery 抓取HTML 頁面內容
阿新 • • 發佈:2018-12-31
phpQuery
使用phpQuery 可以對HTML 頁面進行類似於JQuery 一樣的操作。目的是進行HTML 資料的抓取,以及對HTML 檔案內容的補充等操作,完全就類似於jQuery 一樣的操作。
<?php
require_once "../phpQuery/phpQuery.php";
$url = "http://kuailiyu.cyzone.cn/";
$html = file_get_contents($url);
phpQuery::newDocumentHtml($html);
$items = pq("div.content-item.clearfix div.item-info.fr" );
$ret = [];
foreach ($items as $item) {
$item = pq($item);
$obja = $item->find("h2.item-tit a");
$objdig = $item->find("p.item-intro");
$title = pq($obja)->text();
$url = pq($obja)->attr('href');
$digest = pq($objdig)->text();
$ret [] = ['title' => $title, 'url' => $url, 'digest' => $digest];
}
print_r($ret);
在使用中需要注意的是,通過 pq() 方法獲取的才是 phpQuery 物件,在這種情況才能夠得到 text(), attr() 之類的方法。如果只是一些 DocumentElement,那麼久需要使用 pq() 進行物件轉換,然後再使用。