網(wǎng)站被鏡像了怎么辦?(什么是惡意鏡像網(wǎng)站)

      2023-11-02 未知 黑帽SEO
      網(wǎng)站被鏡像了怎么辦?(什么是惡意鏡像網(wǎng)站)

      在常見負(fù)面SEO帖子里提到過,我這個(gè)小博客有幾十個(gè)域名鏡像我。有讀者問我,怎么知道自己被鏡像了,網(wǎng)站被鏡像又改怎么處理。今天寫個(gè)帖子聊一下。

      什么是惡意鏡像網(wǎng)站?

      鏡像網(wǎng)站指的是和你的網(wǎng)站基本一樣、并且實(shí)時(shí)同步的其它網(wǎng)站。就像照鏡子一樣,所以名為鏡像。

      有的鏡像網(wǎng)站是沒有惡意的,很可能是你自己設(shè)置的,為了方便用戶能從多個(gè)域名訪問網(wǎng)站,被封了一個(gè),還有其它的域名。比如著名的草榴社區(qū),好像就有很多鏡像可以訪問。

      有的鏡像,也就是這里討論的鏡像,是不懷好意的,通常是別人設(shè)置的,要么為了負(fù)面SEO你的網(wǎng)站,要么為了利用你的內(nèi)容獲得排名,然后把用戶轉(zhuǎn)向到敏感、非法內(nèi)容網(wǎng)站上去。

      網(wǎng)上有的文章把采集和鏡像混在一起。雖然表現(xiàn)形式差不多,但嚴(yán)格來(lái)說,采集和鏡像實(shí)現(xiàn)方法、表現(xiàn)形式是有區(qū)別的。

      采集的網(wǎng)站一般是提前抓取別人網(wǎng)站的內(nèi)容,放入自己數(shù)據(jù)庫(kù),再用程序調(diào)用到頁(yè)面上。被采集網(wǎng)站有新內(nèi)容時(shí),采集網(wǎng)站并不能實(shí)時(shí)同步更新,要再采集之后才能出現(xiàn)。一旦被采集,內(nèi)容已經(jīng)在對(duì)方數(shù)據(jù)庫(kù)里了,從技術(shù)上是無(wú)法阻止采集網(wǎng)站顯示這些內(nèi)容的。這篇帖子說的不是這種。

      鏡像網(wǎng)站并不事先抓取內(nèi)容,而是有人訪問網(wǎng)站時(shí),實(shí)時(shí)從被鏡像的網(wǎng)站調(diào)取內(nèi)容,做些處理(替換URL、文字,加文字、加JS等),然后實(shí)時(shí)顯示。被鏡像的網(wǎng)站有任何更新,鏡像網(wǎng)站是實(shí)時(shí)同步的。

      網(wǎng)上有賣用于鏡像網(wǎng)站的小偷程序的。小偷程序通常也可以用來(lái)做采集。為了不給他們做宣傳,就不提名字了。從他們的官網(wǎng)摘取幾條程序功能,有助于理解后面的內(nèi)容:

      • 全自動(dòng)分析,內(nèi)外鏈接自動(dòng)轉(zhuǎn)換、圖片地址、css、js,自動(dòng)分析CSS內(nèi)的圖片
      • 內(nèi)置強(qiáng)大替換和過濾功能,標(biāo)簽過濾、站內(nèi)外過濾、字符串替換、等等
      • 偽原創(chuàng),近義詞替換有利于seo
      • 增加URL路由,實(shí)現(xiàn)全站URL變換,個(gè)性化本站URL地址
      • 超級(jí)模板增加移動(dòng)模板、自定義欄目功能
      • 增加自動(dòng)獲取301、302重定向的采集,解決跳WWW,跳https采集
      • 代理IP、偽造IP、隨機(jī)IP、偽造user-agent、偽造referer來(lái)路、自定義cookie,以便應(yīng)對(duì)防采集措施

      其實(shí)我是挺迷惑,網(wǎng)信辦為什么不責(zé)令關(guān)閉賣小偷程序的網(wǎng)站,這種網(wǎng)站才是真正該關(guān)的,而不是另外一些網(wǎng)站。

      被鏡像有什么危險(xiǎn)

      從SEO角度看,權(quán)重不高的小站、新站,被鏡像意味著有其它網(wǎng)站和你的網(wǎng)站內(nèi)容基本一樣,搜索引擎有可能認(rèn)為你的網(wǎng)站不是原版,鏡像網(wǎng)站才是,所以把排名、流量給了鏡像網(wǎng)站。

      對(duì)有一定歷史、權(quán)重的網(wǎng)站,鏡像網(wǎng)站取代原版網(wǎng)站的可能性微乎其微。但從心情角度考慮,被別人鏡像,內(nèi)容被別人偷走,即使沒有其它明顯后果,也還是挺煩人的一件事。

      另一個(gè)煩人的事是,鏡像網(wǎng)站一般來(lái)說并不是要和你提供同樣的產(chǎn)品或服務(wù),而是把用戶轉(zhuǎn)到賭博、色情等服務(wù)上去。有的是通過JS把賭博、色情內(nèi)容顯示給用戶,有的直接把用戶轉(zhuǎn)向到另外的網(wǎng)站上去。

      怎樣發(fā)現(xiàn)自己網(wǎng)站被鏡像了

      有時(shí)候注意到被鏡像了是因?yàn)樽约壕W(wǎng)站排名下降,懷疑有人負(fù)面SEO。有時(shí)候是搜索品牌名稱,看到鏡像網(wǎng)站。已經(jīng)知道自己被鏡像了好辦,直接看下面怎么處理部分。

      很多站長(zhǎng)則完全不知道自己網(wǎng)站是否被鏡像了。有幾個(gè)我常用的檢查方法。

      一是百度統(tǒng)計(jì)后臺(tái):

      受訪域名部分列出了使用相同百度統(tǒng)計(jì)代碼的域名。其中出現(xiàn)快照、百度/谷歌翻譯等是正常的,但出現(xiàn)一些奇奇怪怪的域名就要查看一下了,比如上圖里的第5、7、8個(gè),訪問一下就知道都是鏡像SEO每天一帖,引誘用戶賭博的網(wǎng)站,然后站長(zhǎng)把SEO每天一帖的統(tǒng)計(jì)代碼也照抄過去了。

      看看上面列出的小偷出現(xiàn)功能就知道,其實(shí)統(tǒng)計(jì)代碼很容易替換或刪除的。所以在受訪域名只能看到一小部分鏡像網(wǎng)站。

      第二是搜索網(wǎng)站的特征句子。最容易想到的是網(wǎng)站品牌名稱、首頁(yè)標(biāo)題等,確實(shí)可以發(fā)現(xiàn)一些鏡像網(wǎng)站。但如前所述,品牌名絕大多數(shù)是會(huì)被替換的,所以我更喜歡搜索一些頁(yè)面上的特征句子,比如本博客最上面的副標(biāo)題:Zac的SEO博客,堅(jiān)持12年,優(yōu)化成為生活。搜索一下就會(huì)看到:

      看來(lái)我的博客很容易吸引菠菜啊。

      一般我不搜索帖子里的句子,因?yàn)槟菚?huì)返回大量轉(zhuǎn)載、抄襲的頁(yè)面,不是鏡像的。

      從上圖可以看到,鏡像網(wǎng)站自動(dòng)把title及正文中的品牌詞或指定關(guān)鍵詞替換了,訪問這類網(wǎng)站效果常常是這樣的:

      上圖鏡像網(wǎng)站沒有轉(zhuǎn)向,也沒有用JS顯示大量菠菜內(nèi)容,而是直接在正文中插入菠菜內(nèi)容和鏈接。有的鏡像網(wǎng)站用JS在頁(yè)面上半部分顯示大量?jī)?nèi)容,就像在典型賭博網(wǎng)站看到的一樣,拉到下面才能看到鏡像的內(nèi)容。

      為了搜得更全,還經(jīng)常需要多搜索其它地方的特征文字。比如搜索頁(yè)腳的聲明中的一句:“明明很久一貼,為什么號(hào)稱“看到另一些鏡像網(wǎng)站:

      為什么搜索句子的一半,不是搜索“明明很久一貼,為什么號(hào)稱SEO每天一帖“呢?還是因?yàn)槠放圃~或特征關(guān)鍵詞經(jīng)常是會(huì)被替換的,比如這樣:

      一般我是用Google做這種搜索,因?yàn)镚oogle什么亂七八糟的都收錄。

      網(wǎng)站被鏡像了怎么辦?

      首先,一些網(wǎng)上提到的解決辦法并沒有什么用。

      比如有的說頁(yè)面上的鏈接用絕對(duì)地址有幫助,其實(shí)小偷程序都會(huì)自動(dòng)替換網(wǎng)址,用相對(duì)地址還是絕對(duì)地址沒什么差別。

      還有的說頁(yè)面上加上網(wǎng)站鏈接、網(wǎng)站名稱、版權(quán)聲明之類的,搜索引擎會(huì)識(shí)別哪個(gè)是正版。但鏡像小偷程序連鏈接帶文字都可以全部自動(dòng)替換,這么做并沒有用。

      發(fā)現(xiàn)鏡像網(wǎng)站后的處理原則就是讓鏡像網(wǎng)站不能在鏡像域名上顯示你的內(nèi)容??紤]到鏡像網(wǎng)站是要實(shí)時(shí)訪問和調(diào)用被鏡像的頁(yè)面的,所以可以考慮幾個(gè)方法。

      比如用JS檢測(cè)一下正在被打開的頁(yè)面是不是在自己的域名上,是的話正常顯示,不是的話(域名是鏡像網(wǎng)站時(shí))強(qiáng)迫轉(zhuǎn)向到自己域名:

      if (window.location.hostname !== ‘www.yetiskinlerchat.com’){
      window.top.location.href = ‘http://www.yetiskinlerchat.com/’;
      }

      (聲明:我對(duì)程序不熟,代碼只是簡(jiǎn)單舉例,具體怎么寫,請(qǐng)問你的程序員。)

      不過這種方法只對(duì)用戶有效,搜索引擎不執(zhí)行JS,還是會(huì)抓取到鏡像內(nèi)容。也可以用PHP寫腳本判斷和轉(zhuǎn)向。

      有時(shí)候由于種種原因,程序不起作用。另一個(gè)直接的方法是屏蔽鏡像網(wǎng)站來(lái)訪問的IP地址。先查一下鏡像網(wǎng)站服務(wù)器IP:

      把對(duì)方主機(jī)IP先屏蔽了。不過鏡像網(wǎng)站來(lái)實(shí)時(shí)抓取用的IP大部分情況下不是域名主機(jī)IP,可能是CDN,可能是偽造IP,也可能是多IP的服務(wù)器。要發(fā)現(xiàn)必須屏蔽的IP,需要查看網(wǎng)站原始日志。我的一個(gè)小竅門是,訪問鏡像網(wǎng)站上一個(gè)很少人會(huì)訪問的頁(yè)面,比如翻頁(yè)第70頁(yè),然后馬上查看日志,這個(gè)頁(yè)面被訪問的IP就是應(yīng)該屏蔽的IP:

      屏蔽了這個(gè)IP,再訪問鏡像網(wǎng)站就變成403錯(cuò)誤了:

      不知道頁(yè)腳的友情鏈接是鏡像網(wǎng)站自己加的?還是賣程序的人強(qiáng)制加的?

      鏡像網(wǎng)站經(jīng)常是會(huì)偽造或?qū)崟r(shí)輪換IP地址的,如果屏蔽一個(gè)IP網(wǎng)站還能訪問,就再訪問翻頁(yè)69頁(yè)、68頁(yè)等等,找到更多IP。屏蔽也可以屏蔽IP段。我的經(jīng)驗(yàn)是,通常鏡像網(wǎng)站不會(huì)使用超過10個(gè)IP地址。

      當(dāng)然也可以寫個(gè)簡(jiǎn)單的腳本放自己網(wǎng)站上,比如www.yetiskinlerchat.com/mirror.php:

      <?php
      echo $_SERVER[‘REMOTE_ADDR’];
      ?>

      腳本唯一功能就是顯示訪問的IP,然后自己訪問一下小偷鏡像網(wǎng)站的腳本網(wǎng)址,也就是www.bloody-thief.com/mirror.php,頁(yè)面上就直接顯示鏡像網(wǎng)站訪問你服務(wù)器時(shí)的IP了。如果鏡像網(wǎng)站替換了URL,這個(gè)方法就不好用了。無(wú)論怎樣,日志中是一定有的。

      另外,發(fā)現(xiàn)鏡像網(wǎng)站,可以向百度、域名注冊(cè)商、主機(jī)服務(wù)商投訴,要求關(guān)閉網(wǎng)站或刪除頁(yè)面。投訴是否管用就是另一回事了,還是先做好IP屏蔽和URL檢測(cè)。

      責(zé)任編輯:網(wǎng)站被鏡像了怎么辦?(什么是惡意鏡像網(wǎng)站)

      相關(guān)文章

      樂天SEO培訓(xùn)中心

      主站蜘蛛池模板: 国产精品一区在线麻豆| 一区二区三区国产精品| 国产另类TS人妖一区二区| 亚洲日本一区二区一本一道| 国模精品视频一区二区三区| 国产女人乱人伦精品一区二区| 一级特黄性色生活片一区二区| 久久99久久无码毛片一区二区 | 无码国产精品一区二区免费I6| 免费精品一区二区三区在线观看 | 国产精久久一区二区三区| 国精无码欧精品亚洲一区| 国产日韩一区二区三区| 一区二区三区在线| 在线中文字幕一区| 一区二区国产精品| 亚洲一区动漫卡通在线播放| 国产主播福利精品一区二区| 久久99国产精品一区二区| 午夜视频一区二区| 日本成人一区二区| 国产三级一区二区三区| 亚洲不卡av不卡一区二区| 国产精品一区二区电影| 亚洲国产精品一区第二页| 国产一区高清视频| 亚洲熟妇AV一区二区三区浪潮| 亚洲一区日韩高清中文字幕亚洲| 亚洲一区二区三区免费观看| 亚洲美女高清一区二区三区| 无码人妻一区二区三区免费手机| 精品一区二区三区高清免费观看| 乱码人妻一区二区三区| 美女福利视频一区| 亚洲av成人一区二区三区在线观看| 99在线精品一区二区三区| 中文人妻av高清一区二区| 一本色道久久综合一区| 国产精品视频免费一区二区| 亚洲电影国产一区| 国产免费无码一区二区|