外貿建站之數據采集常用PHP代碼分享
阿新 • • 發佈:2019-02-24
all pre 新網站 arr fun 圖片 一起學 rim color
相信很多人有過網站升級的經驗,那就一定會想到怎樣將舊網站數據搬遷采集到新網站。也有很多搞外貿建站站群推廣的,也會有數據采集的需要。
不同網站系統中的數據只能通過采集才能獲得了,除非編程搞一個數據接口,兩個站數據可以相互交換。
這裏分享一下我們開發中用到的代碼:
function get_pic($cont,$path){ $pattern_src = ‘/<[img|IMG].*?src=[\‘|\"](.*?(?:[\.gif|\.jpg|\.png]))[\‘|\"].*?[\/]?>/‘; $num = preg_match_all($pattern_src, $cont, $match_src); $pic_arr = $match_src[1]; //獲得圖片數組 $spider = new Spider(); foreach ($pic_arr as $pic_item) { //循環取出每幅圖的地址 $pic_item=ltrim($pic_item," "); if(is_int(strpos($pic_item, ‘http‘))){ $arcurl = $pic_item; } else { $arcurl = "http://www.chinaobd2.com".$pic_item; } $saveimgfile=$spider->downloadImage($arcurl,$path); $saveimgfile="/upload/".$saveimgfile; $cont=str_replace($pic_item,$saveimgfile,$cont); } $cont=ereg_replace("<a [^>]*>|<\/a>","",$cont); return $cont; }
這段代碼可以從采集的內容裏面批量提取圖片,然後保存到服務器上。非常實用,以上代碼是愛的外貿建站親測,可用。
Function replace_chinaobd2_com_script($cont){ $preg = "/<script[\s\S]*?<\/script>/i"; $newstr = preg_replace($preg,"",$cont,-1); //第四個參數中-1 是全部替換,如果是3,則表示替換3次 return $newstr; }
這段代碼可以過濾掉采集內容部分的腳本代碼
以上代碼進愛的外貿建站程序員親測,如有問題,歡迎留言。會持續分享有用采集代碼給大家,共大家一起學習進步
外貿建站之數據采集常用PHP代碼分享