什么是网页等级?PageRank是什么意思?详解PageRank算法和提升方法
一、什么是网页等级
网页等级又叫页面等级或者网页权重(英文:PageRank,简称PR),是Goolgle用来评估一个页面相对于其他页面的重要性的一个算法规则,是Google用来衡量一个网站的好坏的重要标准之一。网页等级着重考察网站的权威性,即越有权威的网站越容易被其他网站主动链接。被链接越多,就意味着被别的网站投票越多。
网页等级是Google在20世纪90年代后期在搜索引擎领域提出的一个重要概念。2001年9月Google被授予美国专利。这个概念引自学术中一篇论文的被引述的频度,即被引述的次数越多,这篇论文的权威性越高。最基本的意思就是说,如果A页面有一个链接指向B页面,那就可以看作是A页面对B页面的一种信任或推荐。所以,如果一个页面的反向链接越多,再根据这些链接的价值加权越高,那搜索引擎就会判断这样的页面更为重要,页面等级(PageRank)也就越高。
"网页等级"评价一个网页用0~10的数字来显示, 10级为满分。PR值越高说明该网页越受欢迎(越重要)。例如:一个PR值为1的网站表明这个网站不太具有流行度,而PR值为7到10则表明这个网站非常受欢迎(或者说极其重要)。一般PR值达到4,就算是一个不错的网站了。Google把自己的网站的PR值定到9,这说明Google这个网站是非常受欢迎的,也可以说这个网站非常重要。
二、PageRank算法详解
PageRank让链接来"投票",一个页面的"得票数"由所有链向它的页面的重要性来决定,到一个页面的超链接相当于对该页投一票。一个页面的PageRank是由所有链向它的页面("链入页面")的重要性经过递归算法得到的。一个有较多链入的页面会有较高的等级,相反如果一个页面没有任何链入页面,那么它没有等级。
2005年初,Google为网页链接推出一项新属性nofollow,使得网站管理员和网站作者可以做出一些Google不计票的链接,也就是说这些链接不算作"投票"。nofollow的设置可以抵制评论垃圾。
假设一个由4个页面组成的小团体:A,B,C和D。如果所有页面都链向A,那么A的PR(PageRank)值将是B,C及D的Pagerank总和。
继续假设B也有链接到C,并且D也有链接到包括A的3个页面。一个页面不能投票2次。所以B给每个页面半票。以同样的逻辑,D投出的票只有三分之一算到了A的PageRank上。
换句话说,根据链出总数平分一个页面的PR值。
最后,所有这些被换算为一个百分比再乘上一个系数。由于"没有向外链接的页面"传递出去的PageRank会是0,所以,Google通过数学系统给了每个页面一个最小值:
说明:在Sergey Brin和Lawrence Page的1998年原文中给每一个页面设定的最小值是1-d,而不是这里的
(1-d)/N。 所以一个页面的PageRank是由其他页面的PageRank计算得到。Google不断的重复计算每个页面的PageRank。如果给每个页面一个随机PageRank值(非0),那么经过不断的重复计算,这些页面的PR值会趋向于稳定,也就是收敛的状态。这就是搜索引擎使用它的原因。
PageRank的优点:是一个与查询无关的静态算法,所有网页的PageRank值通过离线计算获得;有效减少在线查询时的计算量,极大降低了查询响应时间。
PageRank的不足:人们的查询具有主题特征,PageRank忽略了主题相关性,导致结果的相关性和主题性降低;另外,PageRank有很严重的对新网页的歧视。
三、其他链接相关的排名算法
1、Topic-Sensitive(主题敏感的PageRank)
基本思想:针对PageRank对主题的忽略而提出。核心思想:通过离线计算出一个PageRank向量集合,该集合中的每一个向量与某一主题相关,即计算某个页面关于不同主题的得分。主要分为两个阶段:主题相关的PageRank向量集合的计算和在线查询时主题的确定。
优点:根据用户的查询请求和相关上下文判断用户查询相关的主题(用户的兴趣)返回查询结果准确性高。
不足:没有利用主题的相关性来提高链接得分的准确性。
2、Hilltop
基本思想:与PageRank的不同之处:仅考虑专家页面的链接。主要包括两个步骤:专家页面搜索和目标页面排序。
优点:相关性强,结果准确。
不足:专家页面的搜索和确定对算法起关键作用,专家页面的质量决定了算法的准确性,而专家页面的质量和公平性难以保证;忽略了大量非专家页面的影响,不能反映整个Internet的民意;当没有足够的专家页面存在时,返回空,所以Hilltop适合对于查询排序进行求精。
四、PageRank网页等级提升方法
1、网站内部优化提升
a、内部程序结构
网站的内部结构对于搜索引擎的抓取有着很重要的意义,同样对于网站的PR值计算也是有着一定的影响。这里我们鼓励大家使用常见的建站系统进行搭建,相比较其他而言,这样的系统无论从系统安全性还是搜索引擎的认知度上都是比较不错的。
b、稳定更新
网站的稳定更新是搜索引擎判断一个网站是否经营良好的标准之一,保持网站内容的稳定更新,可以帮助搜索引擎判断你网站的活跃程度,活跃程度越高的网站自然他的PR值也就会越高。
c、文章内容新颖度
网站中我们需要稳定更新的就是网站内部的文章,网站文章如果是原创内容会为你的网站加分,如果再有其他的网站对你网站内容的转载,那么你的网站文章的权威性就更加得到了认可。对于这样提供高质量的网站内容的网站,PR值自然不会低。
2、网站外部优化提升
a、友情链接
友情链接应该算是提升网站PR值的一大法宝了。从Google公布的PR值计算方法中我们百科之家工程师发现,PR值的计算是网站间权重的相互传递。也就是说,通过权重的叠加,可以使网站的PR值得到提升。这就是为什么老站的PR值一般要高于新站的原因了。
b、外链数量
外链数量可以具体体现出一个网站在整个网络环境中的受欢迎程度。网站的外链越多,在搜索引擎看来,这个网站的受欢迎度就越高,搜索引擎也就自然而然有理由为这样受欢迎的网站提升PR值了。
c、高权重外链
高权重外链是指搜索引擎认识中的权威网站,比如重点的新闻源网站、行业权威或领先的网站。另外我们百科资源还要提醒大家一种高质量外链资源,那就是我们熟知的百度百科。百度百科在搜索中的排名结果就可以看出他的权重了。作为百度旗下的产品,百度百科的权威性也毋庸置疑。在百科词条中添加链接的种种好处可以表明,百科外链是一种难得的外链资源。
五、PageRank是否还有用
Google 最后一次更新 PR 是 2013 年 12 月 6 日,并且谷歌官方也已经宣布将停止 PR 值的更新,于2016 年谷歌正式取消对 Toolbar Pagerank 的支持。
有些 SEO 人员将 PageRank 视为一种过时且不相关的指标,并在现在的 SEO 中没有立足之地,从优化猩优seo实操经验来看,PageRank 仍然是他们算法的一部分,只是公开的分数(即工具栏的 PageRank)不再存在。
即PageRank在Google所有算法中依然是至关重要的,仍然具有一定的参考价值,Google搜索引擎比最初复杂、完善了许多。在学术界,这个算法被公认为是文献检索中最大的贡献之一,并且被很多大学列为信息检索课程( Information Retrieval)的内容。佩奇也因为这个算法在30岁时当选为美国工程院院士,是继乔布斯和盖茨之后又一位当选院士的辍学生。
六、PageRank 网页权重与网站权重的区别
PR值只是衡量一个站点或页面的链接质量的指标,它只是从侧面表达了一个网站权重的可能性,我们知道影响网站搜索排名的因素,除了链接的数量,还包括链接的相关性,内容质量,页面加载速度,用户访问行为指标,社会影响力等诸多因素。
因此,一个网站的PR值高,并不代表排名就会高,相反一个站点的PR值低,也不代表它的排名就一定会低。
七、PageRank 网页等级的作用
1、影响网页在搜索引擎的自然排名。网页等级越高,在搜索引擎获得排名的机会就更多,反之就更少。
2、网站收录深度和网页页面数。搜索引擎搜索引擎蜘蛛爬取時间及数据库查询的范围也是比较有限的。对大中小型网站而言,主页PR值是推动网站收录的关键因素之一。
3、内容更新频率。PR值越高的网站,搜索引擎蜘蛛 浏览得就越频繁,网站上出現Html页面或旧网页上 页面內容更新,都能迅速被收录。
4、重复內容判断。当Google在不一样网站上发觉完全一致的內容时,会挑选出一个做为原创,别的做为转发或剽窃。
5、排名原始子集的挑选。原始子集的挑选显而易见与关键字相关性不相干,而只有从网页页面的关键水平下手,PR值便是与关键字不相干的关键度指标值。
最后总结
对于搜索引擎而言,PageRank算法最终目的是找出高质量的网页提供给搜索用户,所以站长首先要做的是提升网页的内容质量,网页内容简单易懂、可读性高、解决用户需求,这时候再配合外链会事半功倍。
想了解更多SEO百科的内容,请访问:SEO百科