基于PageRank算法對(duì)SEO結(jié)果排序影響分析!
SEO結(jié)果排序影響分析!.jpg)
鏈接分析排序的思想起源于文獻(xiàn)引文索引機(jī)制,即誰(shuí)的論文被引用次數(shù)多、引用它的論文的質(zhì)量高,誰(shuí)就被認(rèn)為是權(quán)威,論文就是好論文。這個(gè)思路移植到網(wǎng)上就是誰(shuí)的網(wǎng)頁(yè)被鏈接次數(shù)多、鏈接它的網(wǎng)頁(yè)質(zhì)量高,那個(gè)網(wǎng)頁(yè)就被認(rèn)為是質(zhì)量高、人氣旺,是用戶所需要的。鏈接分析算法大體可以分為3類,基于隨機(jī)漫游模型的,比如pagerank,Repution算法;基于Hub和Authority相互增強(qiáng)模型的,如HITS及其變種;基于概率模型的,如SALSA;百度的超鏈分析和谷歌的PageRank都屬于鏈接分析排序技術(shù)。在兩者搜索引擎之間,算法都是有異曲同工之妙之處,本文重點(diǎn)講解分析PageRank算法。
PageRank利用了互聯(lián)網(wǎng)獨(dú)特的民主特性及其巨大的鏈接結(jié)構(gòu)。實(shí)質(zhì)上,當(dāng)從網(wǎng)頁(yè)A鏈接到網(wǎng)頁(yè)B時(shí),PageRank就認(rèn)為“網(wǎng)頁(yè)A投了網(wǎng)頁(yè)B一票”。可根據(jù)網(wǎng)頁(yè)的得票數(shù)評(píng)定其重要性。然而,除了考慮網(wǎng)頁(yè)得票數(shù)(即鏈接)的純數(shù)量之外,還要分析為其投票的網(wǎng)頁(yè)。“重要”網(wǎng)頁(yè)所投之票自然份量較重,有助于增強(qiáng)其他網(wǎng)頁(yè)的“重要性”。這樣,重要的、高質(zhì)量的網(wǎng)頁(yè)可獲得較高的網(wǎng)頁(yè)級(jí)別,從而在搜索結(jié)果中可獲較高的排位。
PageRank最初的基本算法公式:PR(A)=(1-d)+d(PR(T1)/C(T1))+...+PR(TN)/C(Tn))
公式備注:
R(A):網(wǎng)頁(yè)A頁(yè)的PageRank值;
PR(Ti):鏈接到A頁(yè)的網(wǎng)頁(yè)Ti的PageRank值;
C(Ti):網(wǎng)頁(yè)Ti的出站鏈接數(shù)量;
d:阻尼系數(shù),O<d<1。
可見(jiàn),PageRank并不是將整個(gè)網(wǎng)站排等級(jí),而是以單個(gè)頁(yè)面計(jì)算的。頁(yè)面A的PageRank值取決于那些鏈接到A的頁(yè)面的PageRank的遞歸值。PR(Ti)值并不是均等影響頁(yè)面PR(A)的。在PageRank的計(jì)算公式里,T對(duì)于A的影響還受T的出站鏈接數(shù)C(T)的影響。這就是說(shuō),T的出站鏈接越多,A受T的這個(gè)連接的影響就越少。PR(A)是所有PR(Ti)之和。所以,對(duì)于A來(lái)說(shuō),每多增加一個(gè)人站鏈接都會(huì)增加PR(A)。
并且所有PR(Ti)之和乘以一個(gè)阻尼系數(shù)d,它的值在O到1之間,一般設(shè)置為0.85。因此,阻尼系數(shù)的使用,減少了其它頁(yè)面對(duì)當(dāng)前頁(yè)面A的排序貢獻(xiàn)。事實(shí)上,計(jì)算某個(gè)頁(yè)面的PageRank得分需要大量繁復(fù)計(jì)算。例如若計(jì)算A頁(yè)的PageRank得分則首先要知道所有鏈至A頁(yè)的網(wǎng)頁(yè)(導(dǎo)人鏈接)的PageRank得分。要想知道這些外部鏈接頁(yè)的PageRank得分,又需要先知道這些頁(yè)面的外部鏈接的PageRank得分等等。
A頁(yè)的外部鏈接B能夠帶給A的PageRank得分與B的導(dǎo)出鏈接數(shù)量成反比,即隨著B(niǎo)上導(dǎo)出鏈接數(shù)的增加,帶給A的PageRank得分亦隨之降低。這同樣表明了一個(gè)網(wǎng)頁(yè)的PageRank得分是該網(wǎng)頁(yè)對(duì)其它頁(yè)面投票的一個(gè)基本的度量形式。一個(gè)網(wǎng)頁(yè)可以投票給一個(gè)或多個(gè)導(dǎo)出鏈接,但其總投票權(quán)一定,并被平均分配給所有的導(dǎo)出鏈接。假設(shè)B的PageRank得分是5,且B上只有一條指向A的鏈接,那么A將獲得B全部的PageRank得分(B沒(méi)有損失任何東西,而A贏得了B的PageRank得分)。但如果B上有N個(gè)鏈接,則A只能得到B的PageRank得分的N分之一。
簡(jiǎn)單說(shuō)來(lái),搜索引擎通過(guò)下述幾個(gè)步驟來(lái)實(shí)現(xiàn)網(wǎng)頁(yè)在其搜索結(jié)果頁(yè)中的排名:
1、找到所有與搜索關(guān)鍵詞匹配的網(wǎng)頁(yè)。
2、根據(jù)頁(yè)面因素如標(biāo)題,關(guān)鍵詞密度等排列等級(jí)。
3、計(jì)算導(dǎo)人鏈接的錨文本中的關(guān)鍵詞。
4、通過(guò)PageRank得分調(diào)整網(wǎng)站排名結(jié)果。
事實(shí)上,真正的網(wǎng)站排名過(guò)程并不是這么簡(jiǎn)單,據(jù)百度等搜索引擎介紹,搜索引擎除了用PageRank算法衡量網(wǎng)頁(yè)的重要程度以外,還有其它上百種因素來(lái)參與排序。其它搜索引擎也是如此,不可能只按照某一種規(guī)則來(lái)進(jìn)行搜索結(jié)果的排序。要想做好SEO排名,了解算法原理本身,通過(guò)從本質(zhì)出發(fā),搜索引擎結(jié)果排序其實(shí)會(huì)越做越簡(jiǎn)單。