PHP抓取頁面內容
阿新 • • 發佈:2018-12-29
什麼叫抓取?
通過PHP程式碼來實現,把其它網頁的內容抓取到本地,抓取的時候需要聯網才可以
1.通過file_get_contents()函式實現抓取。
前提:在php.ini中設定允許開啟一個網路的url地址。
程式碼如下:
<?php |
echo file_get_contents('http://www.baidu.com'); |
?> |
有的網站抓取過來是亂碼狀態如下:
��S�OA��W�{�eiiY�P��=h�'��N� ������|�-c Q�(��wf�'�߲P�AM<�μ�o��1o/\�~��ÂA-s�g0�`ƪ!%��C��.T�$��0U[�p^���O8����4/&ը[���N-|���]�z9� |
解決方案如下:
<?php
$url="http://www.sohu.com/";
echo file_get_contents("compress.zlib://".$url);
?>