Direct Hit算法-快速排名算法原理

今天在網上找文獻的時候無意中發現了Direct Hit算法,本以為是一種沒見過的新算法,結果研究過后原來是點擊排名算法!關于點擊排名算法已經寫了好幾篇文章進行敘述了,但也只是知道有這個算法,沒有任何的依據。Direct Hit算法的出現也算是告訴我之前想的都是正確的!我們先來看看Direct Hit算法的介紹來來研究如何使用吧!
Direct Hit算法是Ask jeeves公司的一種注重信息質量和用戶行為反饋的排序算法
1、算法原理
在用戶輸入檢索詞提交給搜索引擎后,搜索引擎將查詢到的相關信息,最后以Web頁面形式返回給用戶時。搜索引擎在返回結果中通常給網頁的摘要信息,方便用戶的瀏覽選擇。用戶瀏覽返回的結果,查找自己需要的信息。這實際上是一個過濾無用信息、進行二次檢索的過程。用戶在二次檢索中得到的結果應該是相關性較高的結果,排名應該靠前。
Direct Hit算法就是一種按照上述用戶的反饋結果進行排序的技術。他的基本思想是:
用戶輸入檢索詞條T后,搜索引擎將查詢的結果返回給用戶,Direct Hit開始工作,跟蹤用戶在該搜索引擎結果的點擊情況。如果用戶在瀏覽搜索引擎提供的N條結果記錄中第i條記錄時,停留時間越長,則說明記錄i與關鍵詞t相關程度越大,那么該網頁的受歡迎程度就高,系統將增加該網頁的相關度;反之,如果瀏覽時間較短,用戶又重新返回搜索引擎點擊其他的檢索結果,則說明記錄i與關鍵詞t相關度較小,系統將降低該網頁的相關性。
可見網頁排序結果是由被點擊次數和瀏覽的時間長度兩部分共同決定的。因為相關度不停的變化,對于同一個詞在不同的時間進行檢索,得到結果集合的排序也就有可能不同,所以Direct Hit排序是一種動態排序。
很顯然,用戶點擊反饋越多則該算法的準確度越高。因此Direct Hit與一些搜索引擎建立了伙伴關系,即這些搜索引擎使用Direct Hit技術進行排序,而用戶在使用這些搜索引擎查詢后,點擊的結果將反饋給Direct Hit,Direct Hit收集這些結果再計算相關度。
2、算法評價
Direct Hit算法建立在用戶點擊的基礎上的,因此該算法又被稱為受歡迎程度算法。在排序時候利用了用戶的反饋信息,充分滿足了“用戶保障原則”,同時也考慮了網頁信息的質量。經過大量的統計得出,Direct Hit技術尤其適用于檢索時檢索詞較少的排序。
盡管算法意圖是從用戶的反饋信息中挖掘有用的信息指導排序,但是用戶行為比較可隨意,很難保證排序結果的準確性。雖然搜索引擎返回的檢索結果很多,并通過分頁提供給用戶,但是只有不到7%的用戶瀏覽結果中第三頁以后的信息。這樣,對于一些排名較后或者新登錄的網站很難有機會獲得點擊,從而一直無法提高自己的排名。另外,有些網站為了提高自己的排名,多次從Direct Hit的伙伴中點擊自己的網站,來騙取好的排名結果。對此,Direct Hit也采用相關的技術來屏蔽一些重復的點擊,保證排名的相對準確!
3、算法應用
關于Direct Hit算法的應用不想說太多,因為畢竟我也搞SEO培訓。如果說的太多誰還會為此付費呢?但我還是想為一些朋友點上一句:這個算法是那些訪問量、點擊量大的頁面都是受歡迎的優秀頁面。那你要做的工作不就很明顯了嗎?找到一個方法認真測試一段時間,你就知道這個算法應該如何使用了!