PageRank es un algoritmo de análisis de enlaces que asigna una «puntuación de importancia» a cada página web. Esta puntuación se basa en la cantidad y calidad de los enlaces que apuntan a la página. La idea es que las páginas importantes son las que reciben muchos enlaces entrantes, especialmente de otras páginas que también son importantes.
El PageRank, desarrollado por Sergey Brin y Lawrence Page en su trabajo seminal «The Anatomy of a Large-Scale Hypertextual Web Search Engine» en 1998, es una piedra angular en la tecnología de motores de búsqueda, particularmente en Google. Este algoritmo revoluciona la forma en que los motores de búsqueda clasifican y presentan resultados al aprovechar la estructura de hipervínculos de la web.
Cálculo del PageRank
Fórmula Básica del PageRank
[ PR(A) = (1-d) + d(PR(T1)/C(T1) + … + PR(Tn)/C(Tn)) ]
Donde:
- PR(A) es el PageRank de la página A.
- PR(T1), PR(T2), …, PR(Tn) son los PageRanks de las páginas T1, T2, …, Tn que enlazan a A.
- C(T1), C(T2), …, C(Tn) son los números de enlaces salientes de las páginas T1, T2, …, Tn.
- d es el factor de amortiguación, generalmente ajustado en 0.85.
Justificación Intuitiva
El modelo del «navegador aleatorio» es una forma intuitiva de entender el PageRank. Se puede pensar que hay un usuario que navega aleatoriamente por la web, y la probabilidad de que este usuario llegue a una página específica se convierte en la puntuación de PageRank de esa página. El factor de amortiguación d refleja la probabilidad de que el usuario se aburra y comience a navegar desde una página nueva al azar.
PageRank Simulador
Implementación de PageRank en Google
Uso de la Estructura de Hipervínculos
Google utiliza la estructura de hipervínculos como un recurso valioso para calcular el PageRank. Esto implica la creación de «mapas de citaciones» que contienen información sobre millones de hipervínculos de la web. Estos mapas permiten un cálculo rápido y eficiente del PageRank para priorizar los resultados de búsqueda.
Proceso Técnico
Algoritmo Iterativo
El cálculo del PageRank se realiza mediante un algoritmo iterativo que actualiza las puntuaciones de PageRank de las páginas en cada ciclo hasta que los valores convergen a un punto de equilibrio.
Aplicación de PageRank en Consultas de Búsqueda
El PageRank se usa para priorizar los resultados de búsqueda al asignar mayor peso a los resultados con una mayor puntuación de PageRank. Esto se aplica tanto en búsquedas de texto completo como en búsquedas de coincidencia de título.
Beneficios del PageRank
Altamente Relevante
El PageRank proporciona una medida objetiva de la «importancia» de una página que tiende a corresponder bien con la percepción subjetiva de los usuarios.
Difícil de Manipular
Debido a la forma en que se ajustan las puntuaciones de PageRank, es difícil para los desarrolladores web intentar manipular el algoritmo mediante tácticas de SEO poco éticas, como la creación de granjas de enlaces.
Casos de Uso y Extensiones
Personalización y Variaiones
Una variación relevante es personalizar el PageRank mediante el aumento del peso de las páginas iniciales del usuario o sus marcadores, lo cual ofrece resultados más relevantes y personalizados.
Propagación de Texto Ancla
Además del PageRank, Google utiliza el texto de los enlaces (conocido como texto ancla) para proporcionar mejores descripciones de las páginas web, lo que a su vez mejora la calidad de los resultados de búsqueda.
¿Qué ha pasado con el Page Rank a lo largo de los años?
En los inicios de este algoritmo de Page Rank, el buscador más utilizado del mundo incluyó una extensión con el que podías ver la puntuación de relevancia de un sitio web en una escala de 0 a 10 y esto pues era completamente manipulable, dado que antes los SEOs podíamos posicionar cualquier contenido a base de cumplir con los criterios básicos y un buen chorreo de enlaces desde sitios web más relevantes que el nuestro.
Google esta extensión la retiró con el tiempo y sus constantes actualizaciones como sabrás.
Según lo que se conoce a partir de la filtración masiva del algoritmo de Google, el PageRank hoy es un dato más entre cientos y cientos de parámetros que se tienen en cuenta a la hora de clasificar y posicionar un sitio web en las SERPs.
Referencias
Anatomía de un motor de búsqueda: http://infolab.stanford.edu/~backrub/google.html
