【黑帽SEO科普】泛內頁、泛目錄是什么意思?

回歸黑帽SEO科普系列。
你到源碼站去搜,發現一堆“泛XX”的代碼,其中以“泛內頁、泛目錄”居多,那這是個什么東西?
看各種程序的介紹,非常niubility的樣子。但站在小白的視角看來,依舊搞不懂是什么東西。
正常的網站,一個URL都對應唯一的關鍵詞,比如我建立一個網站,設置2個url格式,一個列表頁,一個詳情頁:
https://www.test1.com/{cid}/
https://www.test1.com/{cid}/{pid}.html
這個url結構,至少得創建兩個數據表:
一個是cid--cname,存放“分類id和分類名稱”的映射關系
一個是pid-cid,存放“某個文章和對應分類”的映射關系
cid是分類的id,pid是文章的id,每個pid對應唯一的title。哪個pid歸屬于哪個cid的映射關系,是寫死在數據表里的。
只要你不改這個映射關系,每個pid詳情頁對應的title,永遠是不變的。
而泛內頁,是沒有這個映射關系的。pid這個變量,你在瀏覽器隨便寫,都能正常訪問,title一般是隨機匹配的。
舉幾個栗子:
1)url不變,每次刷新,模板和title都變。模板和title與pid之間沒有任何映射關系,隨機匹配的。
2)但這樣每次都變,對搜索引擎不友好。加上緩存,在一段時間內,讓模板與title和pid綁定
如設置緩存86400秒,依舊url不變,N次刷新,模板和title不變
3)有些另類的url后綴是不能訪問的,如.txt,.pdf,.xlxs.....
同理,通過創建新的url路由,來實現正常訪問
4)任意url隨機匹配關鍵詞
同理,列表頁這個cid,也沒有映射關鍵詞,url中的cid也可以隨便輸入,都能正常訪問
簡而言之,“泛XX”就是你隨便輸入url,都能正常訪問。頁面上出現的鏈接,都是程序隨機生成的,隨機就意味著無限大,baiduspider能發現無限大的未爬取的url,這樣就有可能帶來源源不斷的抓取。
至于怎么隨機,看程序的設置,可以“有范圍的”隨機,比如url必須符合某個格式,或者隨機的id,必須是在某個列表內的才能訪問等
有時候賣程序也會換個說法,叫“XX繁殖”,比如內頁繁殖啥的,意思都差不多。
最近有小白看了一些程序的介紹,表示內心很激動,其實大可不必,SEO領域內,大多數情況下,程序都是次要的,即便再怎么“泛XX”,只是解決內容量的問題,但解決不了收錄。
從功能的實現來講,不難,基本上工作1、2年的php,把邏輯告訴他,都能實現一個差不多的程序。