1. 程式人生 > >使用phpQuery 抓取HTML 頁面內容

使用phpQuery 抓取HTML 頁面內容

phpQuery

使用phpQuery 可以對HTML 頁面進行類似於JQuery 一樣的操作。目的是進行HTML 資料的抓取,以及對HTML 檔案內容的補充等操作,完全就類似於jQuery 一樣的操作。

<?php
require_once "../phpQuery/phpQuery.php";

$url = "http://kuailiyu.cyzone.cn/"; 
$html = file_get_contents($url);
phpQuery::newDocumentHtml($html);

$items = pq("div.content-item.clearfix div.item-info.fr"
); $ret = []; foreach ($items as $item) { $item = pq($item); $obja = $item->find("h2.item-tit a"); $objdig = $item->find("p.item-intro"); $title = pq($obja)->text(); $url = pq($obja)->attr('href'); $digest = pq($objdig)->text(); $ret
[] = ['title' => $title, 'url' => $url, 'digest' => $digest]; } print_r($ret);

在使用中需要注意的是,通過 pq() 方法獲取的才是 phpQuery 物件,在這種情況才能夠得到 text(), attr() 之類的方法。如果只是一些 DocumentElement,那麼久需要使用 pq() 進行物件轉換,然後再使用。