tel:17340208223 QQ:229119353 微信:cdseo-seo 登陆 注册

什么是PR?详解PR算法

日期: 2019-04-12 09:45:00 点击:2653 栏目:常见问题
 PR值全称为PageRank(网页等级),2001年9月被授予美国专利,专利人是Google创始人之一拉里·佩奇(Larry Page)。因而,PageRank里的p...
 PR值全称为PageRank(网页等级),2001年9月被授予美国专利,专利人是Google创始人之一拉里·佩奇(Larry Page)。因而,PageRank里的page不是指网页,而是指佩奇,即这个等级方法是以佩奇的姓名来命名的。它是Google排名运算法则(排名公式)的一部分,是Google用于用来标识网页的等级、重要性的一种方法,是Google用来衡量一个网站的好坏的重要规范之一。在揉合了诸如Title标识和Keywords标识等一切其它要素之后,Google经过PageRank来调整成果,使那些更具“等级/重要性”的网页在查找成果中令网站排名取得进步,然后进步查找成果的相关性和质量。  等级从0到10,10级为满分。PR值越高说明该网页越受欢迎(越重要)。例如:一个PR值为1的网站标明这个网站不太具有盛行度,而PR值为7到10则标明这个网站十分受欢迎(或者说极其重要)。一般PR值达到4,就算是一个不错的网站了。Google把自己的网站的PR值定到9,这说明Google这个网站是十分受欢迎的,也能够说这个网站十分重要  PR也有真假之分。假PR即PR绑架。许多站长为了短时期内取得高PR,他们将自己的网站做301跳转到一个高PR的网站。留意google在更新PR的时候,会赋予这个网站与跳转后的网站相同的PR值。但是这样的PR是假的,没有任何用处。假如站长撤销301后,PR会从头评估,回到最初的PR值。而且绑架过来的PR不会给友情链接带来PR分值的。所以Anzone说,我们换友情链接的时候,不要和PR绑架的网站交流链接。  PageRank  基本思想:假如网页T存在一个指向网页A的衔接,则标明T的一切者以为A比较重要,然后把T的一部分重要性得分赋予A。这个重要性得分值为:PR(T)/C(T)  其中PR(T)为T的PageRank值,C(T)为T的出链数,则A的PageRank值为一系列类似于T的页面重要性得分值的累加。  PR(A)=(1-d)+d(PR(t1)/C(t1)+…+PR(tn)/C(tn))  A代表页面A  PR(A)则代表页面A的PR值  d为阻尼指数。通常以为d=0.85  t1…tn 代表链接向页面A的页面t1到tn  C代表页面上的外链接数目。C(t1)即为页面t1上的外链接数目  从核算公式能够看到,核算PR值必须使用迭代核算才能得到。  长处:是一个与查询无关的静态算法,一切网页的PageRank值经过离线核算取得;有效削减在线查询时的核算量,极大下降了查询响应时间。  缺乏:人们的查询具有主题特征,PageRank疏忽了主题相关性,导致成果的相关性和主题性下降;另外,PageRank有很严重的对新网页的轻视。  Topic-Sensitive  (主题敏感的PageRank)  基本思想:针对PageRank对主题的疏忽而提出。中心思想:经过离线核算出一个PageRank向量调集,该调集中的每一个向量与某一主题相关,即核算某个页面关于不同主题的得分。首要分为两个阶段:主题相关的PageRank向量调集的核算和在线查询时主题的确认。  长处:依据用户的查询请求和相关上下文判断用户查询相关的主题(用户的兴趣)返回查询成果精确性高。  缺乏:没有利用主题的相关性来进步链接得分的精确性。  Hilltop  基本思想:与PageRank的不同之处:仅考虑专家页面的链接。首要包括两个过程:专家页面查找和目标页面排序。 长处:相关性强,成果精确。 缺乏:专家页面的查找和确认对算法起关键作用,专家页面的质量决议了算法的精确性,而专家页面的质量和公平性难以保证;疏忽了大量非专家页面的影响,不能反映整个Internet的民意;当没有满足的专家页面存在时,返回空,所以Hilltop合适对于查询排序进行求精。