El funcionamiento de Google, simplificado

Toda persona que emplee la World Wide Web (el internet, vamos) conoce el buscador de Google. Hay otros más (como DuckDuckGo, Ecosia...) que se ofrecen como alternativas a este buscador (especialmente interesantes desde que las búsquedas de Google han quedado manchadas por su interés en priorizar ciertas páginas por los beneficios económicos que le suponen, enlace), pero Google sigue siendo a día de hoy el buscador más empleado en el mundo.

Su funcionamiento está basado en matemáticas.Y pueden parecer complejas, pero vamos a tratar de explicarlas. Vamos a ponernos en el año 2000 e ignorar los resultados que da últimamente (si quieren saber por qué, la razón la he enlazado más arriba). Buscamos algo en su barra de buscador y vemos que nos ofrece diversos resultados. ¿Cómo ha elegido cuál mostrar primero? Bien, vayamos por partes.

Fuente: pixabay

Imaginemos que tenemos una red con varias direcciones (digamos que tenemos 4 direcciones web, por ejemplo). Cada una de ellas puede o no llevar a una de las otras tres. Supongamos que una de ellas lleva a tres y a su vez dos de ellas también redireccionan a la primera, una de esas dos también se redirecciona a la otra (pero no al revés) y la última no redirecciona a ninguna parte. De entre esas, la que más es visitada será entonces la primera que hemos mencionado y la que menos, será la última. Además, tenemos que tener en cuenta que en cualquier momento vamos a emplear la barra de direcciones para llegar a cualquiera de ellas. Si representáramos estas páginas web en el espacio como si fueran puntos, generaríamos un “grafo dirigido”, en el que veríamos mediante flechas cómo se relacionan unas páginas con otras y podríamos ver la cantidad de flechas que “parten de” y se “dirigen a” cada una de estas páginas, con lo que sería simple ver qué página tiene más “tráfico”. Pero esto lo hace un algoritmo que tiene que procesar esta información. ¿Cómo lo hace?

Lo que tenemos que hacer es tener en cuenta que una página tiene más “peso” para Google cuanto más tráfico genere. Es decir, cuanto más se visite o redireccione a otras páginas. Para ello, se tiene en cuenta no sólo el “peso” por esta cantidad de visitias, también asignamos un “peso” menor a aquellas que tienen menos tráfico. Tenemos que tener en cuenta en este proceso que las páginas con menor tráfico aún generan cierta cantidad del mismo. Es decir, cualquiera puede entrar en una página web si conoce su dirección aunque no haya ninguna otra que te redireccione a la misma.

Con todo esto, se genera una matriz de la que se extrae lo que voy a llamar un “valor de prioridad”. Ese valor viene a decir “esta página tiene más peso, porque mucha gente emplea sus redirecciones y/o porque recibe muchas redirecciones de otras páginas” o “esta página tiene menos peso, porque muy poca gente emplea sus redirecciones y/o porque recibe muy pocas redirecciones de otras páginas”. De esta forma y en función de ese “valor de prioridad” se mostrarán en tu búsqueda unas páginas antes que otras. Esto debe hacerse con una cantidad absurda de páginas web y todas las conexiones que tienen entre sí, lo cual es una locura para una persona, pero una tarea relativamente sencilla para un programa. Por lo general, si nos situamos en el año 2000 lo más probable es que te priorice la Wikipedia, por el simple hecho de que esta página es visitada con mucha frecuencia, tiene muchos enlaces que parten de ella y muchas páginas tienen enlaces que la redireccionan a ella. Hoy en día tienes que saltarte varios resultados publicitarios antes de llegar a la misma.

De todas formas, mi explicación ha intentado evitar los tecnicismos y la profundidad en sus descripciones. Si quieren mayor, mejor y más detallada información, os dejo el siguiente enlace: enlace.

Comentarios

Entradas populares de este blog

Cultura Científica en base a tres definiciones

Límites al Algoritmo A* (A-Estrella)

"No mires arriba", el análisis del análisis