HillTop算法原理与排名关系

HillTop算法原理与排名关系

    hilltop算法及其原理,这个东西比较早了,况且google对他的使用已经有些年头了,HillTop算法: HillTop同样是一项搜索引擎结果排序的专利,是Google的一个工程师Bharat在2001年获得的专利。Google的排序规则经常在变化,但变化最大的一次也就是基于HillTop算法进行了优化。HillTop究竟原理如何,值得Google如此青睐?

    Google最早利用HillTop算法去定义相关网站:一个网站与另一个网站的相关性,实际上,HillTop算法在Google也中作为一个识别跨站点的链接交换干扰(spam)与识别相似链接的技术。HillTop算法要求:如果有两个以上相关主题的网站链接到你的网站,那么你的网站在搜索结果中出现的机会会更大,如果HillTop算法不查找到最少两个相关性的网站,那么搜索返回的结果的机会绝对是0。


    运行Hilltop算法需要大量的计算机处理能力,因而我们猜测Hilltop算法(可能)是每个月对收集到的全部高频率(热门)查询词运行一次批处理。由于Google算法将40%重心转移至Hilltop,且Hilltop算法运行后的得分会保持至下一次批处理,因而在此期间搜索结果很可能不会有太大变动。此外,由于“专家”网页的投票方式往往不会有太大变动,因而在某段时期内我们可能只会看到一些“陈旧”的搜索结果。这一点悖离了搜索引擎的“提供最新、最好”的查询结果的宗旨。除了“权威网页”,用户同样希望看到一些新鲜的内容,然而对“新”Google而言,用户只有寄望于那些查询频率不太高,从而未被纳入Hilltop系统的查询词语上看到“新鲜”的查询结果了。

    与PageRank结合HillTop算法确定网页与搜索关键词的匹配程度的基本排序过程取代了过分依靠PageRank的值去寻找那些权威页面的方法。这对于两个具有同样主题而且PR相近的网页排序过程中:HillTop算法就显得非常的重要了。


    之前我对hilltop的算法并不了解,按我们平时说的通俗讲法为糊里糊涂的做来做去,对网页的相关性并不是太注意,即使是友情链接只是考虑对方PR,而很少在意对方是否同自己的页面相关度如何!这次学习了!希望大家也多了解一下hilltop!


[本日志由 admin 于 2009-03-27 10:53 AM 编辑]
文章来自: 本站原创
引用通告: 查看所有引用 | 我要引用此文章
Tags: HillTop算法原理与排名关系
评论: 0 | 引用: 0 | 查看次数: -
发表评论
昵 称:
密 码: 游客发言不需要密码.
内 容:
验证码: 验证码
选 项:
虽然发表评论不用注册,但是为了保护您的发言权,建议您注册帐号.