PageRank知识普及
|
源代码网整理以下 大家知道,PageRank是Google用于评测一个网页“重要性”的一种方法。在糅合了诸如Title标识和Keywords标识等所有其他因素之后,Google通过PageRank来调整结果,使那些更具“重要性”的网页在搜索结果中的排名获得提升,从而提高搜索结果的相关性和质量。 源代码网整理以下 PageRank是基于“从许多优质的网页链接过来的网页,必定还是优质网页”的回归关系来判定所有网页的重要性。其计算公式是: 源代码网整理以下 R(i) = ( 1 - d ) + d·∑ j∈B(i) R(j)/N(j) 源代码网整理以下 式中: 源代码网整理以下 R(i)——表示网页i的权威度; 源代码网整理以下 B(i)——指向网页i的网页集; 源代码网整理以下 N(j)——网页j中指向其他网页的超链接数; 源代码网整理以下 d——衰减因子,0 源代码网整理以下 从式中可以发现以下事实: 源代码网整理以下 1 指向网页i的链接数越多,网页i的网页级别越高; 源代码网整理以下 2 网页i的网页级别与施链网页的网页级别有关(或权威度有关),即来自权威网页的链接将比来自非权威网页的更有利于提高网页i的网页级别; 源代码网整理以下 3 网页i的网页级别与施链网页的链出数有关,当一个施链网页的链出数(出度)较少时,更能说明施链网页对网页i的肯定程度; 源代码网整理以下 4 对所有采集到的网页计算它们的PageRank值,是一个大型的多元一次方程,为了节省时间,Google不采取通常的高斯消元法,而是采用递归方式来逼近最优解。 源代码网整理以下 显然,PageRank可以作为网页评价的权威性或影响力的指标。 源代码网整理以下 我的小站:www.llxxw.com.cn希望可以和大家多交流 源代码网供稿. |
