黑帽例項分享-站群式的網站映象與克隆
其實這種手法在幾年前就已經開始,操作者一般是先通過購買大量低價域名,然後有針對性的挑選網站來施行映象或者所謂的克隆。這裡的映象不是通過軟體下載整套目標模板和採集目標內容,指的是利用nginx或者appache等web伺服器實現一種叫反向代理的技術。
實際是怎樣執行的
只要有訪問者打開了映象站,那麼映象站的程式碼就會讓伺服器訪問一次被克隆的網站,並獲取原始碼,作一系列的修改處理後,就會輸出到訪問者的頁面。
我們繼續往下看
例項分析:
我在360站長社群找到這個例子,開啟原網站與第一個映象站。
映象站如下:
通過滾動到下面看到了原網站的模板
我們再檢視映象站的原始碼,近乎與原網站程式碼一模一樣,連名字都不改!
但映象站如何載入了那個賭博站,通過對比原始碼,我看到了其在Head頭部加入了一段自己的gobay.js,將內容通過URL解碼後可以看到這個JS檔案主要作用是往頁面輸出了一個iframe的標籤,指向的地址就是頁面上的賭博站。
這個做法很聰明,一是百度對JS程式碼的解析能力低,二是就算解析出但對iframe裡的內容不進行抓取。這樣做的話就會降低會克隆站排名的影響,也會實現導流的效果。
js原始碼:
document.write(unescape("%3Ciframe%20width%3D%27100%25%27%20src%3D%27http%3A//www.wangtouxxz.pw/%27%20height%3D%275200px%27%20frameborder%3D%270%27%20scrolling%3D%27no%27%3E%3C/iframe%3E"));
解碼後:
document.write(unescape(""));
這種手法還有用嗎?
我查詢了一下百度的收錄量,多達3000+,查看了收錄頁最新快照時間為2017年06月16日,說明即便克隆站也是能有春天,而這收錄量是多少站長還沒達到的。360那邊搜尋發現已經不存在收錄了,這裡態度顯然優勝。
總結:
目前這種手法有兩種
第一種 土豪式是以仿照域名再註冊的新域名,一般做出排名高於原網站,那訪問者就傻傻分不清了,這種情況在百度站長社群經常看到。
第二種 是和專案一文章類似,成本較低,有資源的操作者會使用老域名+優質主站輔助二級域名做映象站群,在百度官方文件上雖然認為二級站如同新站是獨立分開的 ,但仍然會根據質量從主站上傳遞一部分權重,這樣的話就知道為什麼會被映象站超越了。
你以為這樣就完了?下面還有例項分享呢
現在來進行實戰,我對phpstudy2016情有獨鍾,所以基本是用它來搭建便捷的環境,其中使用的是Appache
我們需要先對httpd.conf進行配置,開啟轉發模組,如下圖所示,找到兩個紅色框框然後去除最前面的#符號,或者索性把所有帶proxy的這些模組都去除吧,此外還需要開啟rewrite模組,去除httpd.conf檔案中”#LoadModule rewrite_module modules/mod_rewrite.so”前面的”#”號,因為phpstudy裡已經預設開啟,所以我們跳過。
然後在根目錄建立.htaccess檔案,內容如下:
一般站長用到這個檔案是做偽靜態的處理,但做映象站就是為了將所有使用者訪問的網址通過URL重寫到我們的核心檔案hehe.php裡,別忘了[P],作用就是我們剛開啟的模組,用來隱性轉發,整個檔案作用也就是當你訪問xxx.com/a.html的時候,實際上是訪問了xxx.com/hehe.php?good=a.html,但我們的URL位址列是仍然是a.html而不是hehe.php
核心檔案
接下來是對核心檔案hehe.php的編寫,這裡是不會發出來的,畢竟是一種黑帽手法,涉及少數人的利益,大家可以進交流群(群號需要關注訂閱號就會知道咯,嘻嘻)我會在群裡分享,說說檔案的大概內容:
1.我們通過URL轉發,可以接收到傳遞過來的引數,然後通過curl或者file_get_contents的方式配合目標地址+傳遞引數,可以遠端獲取到原始碼,要是亂碼就需要進行重新編碼。
2.獲取到原始碼後,要分情況修改標籤的地址,如a標籤,img標籤,js程式碼,css程式碼,這些會影響到頁面的模仿度,上文的映象站和下圖我的程式碼舉例的就是處理了這些。
3.針對引流或者SEO甚至針對性的防映象處理在原始碼裡修改,比如 加入JS程式碼,修改TDK等內容。
4.輸出頁面給使用者唄
那怎樣對付這些映象站呢?
1.有些站長說補全路徑就可破,其實在上圖的程式碼我就已經針對絕對路徑的方法做了簡單處理,所以呵呵….
2.最簡單有效的就是封禁IP,一般情況下站長可以直接查出映象站的伺服器IP或者根據日誌裡的記錄,在伺服器裡或者控制面板裡禁止該IP的訪問。
3.要是加入了CDN而隱藏了IP 又或者PHP偽造IP,可以根據映象站的程式碼檢視是否有如上文舉例的多餘JS檔案,在自己的網站上也建立相同JS檔案,而JS檔案可以多種處理,比如說輸出一個空白頁又或者給頁面加一些非法內容或者關鍵詞堆砌,舉報讓搜尋引擎處理等等
4.上面這2種方法是可行的,但遇到不是做站群的而是同行惡意映象,他們可以有多種辦法突破你的限制。一般這些時候我建議非常時期用非常手段。