.




5.3.13

Funcionamiento de la búsqueda de Google


Hoy me levante con una inquietud (además de flojera) , ¿Cómo funciona la búsqueda de Google?
Todos hemos escuchado que es a base de algoritmos, una legión de ninjas bien entrenados y un poco de magia negra, pero a ciencia cierta nadie sabe qué es lo que permite que los resultados te regresen cosas útiles.
Hace unos días Google publicó una página web llamada "How Search Works", que por casualidad se enfoca a la pregunta que hice al principio.

El sitio web cuenta con diferentes secciones, desde la versión gráfica y simple, para conocer la historia y el funcionamiento del buscador, hasta una parte más especifica, que explica el rastreo, la manera de realizar el indice y los algoritmos que se ocupan. Pasando por otro sección a lo referente a políticas, y la manera en la que se combate el Spam.

Empecemos la explicación:

Crawling & Indexing (que sería algo así como rastreo e indexación)
Todo empieza en el momento que ponemos nuestros parámetros de búsqueda, de ahí en adelante tenemos que tomar en cuenta que existen 30 trillones de páginas individuales (1018, o lo que sería un millón de billones), que aumentan a cada momento. Google rastrea página a página posibles links de interés, ordenándolas en base a contenido y otros criterios establecidos. Esta búsqueda se realiza por encima de 100 millones de gb de información, formando de esta manera un índice.

Algorithms (Algoritmos)
A través del desarrollo de programas y fórmulas, Google consigue brindarte los mejores resultados posibles, ocupando los algoritmos como pistas para entender mejor lo que estás buscando. Para esto, se basan en distintas reglas y herramientas, entre las que podemos encontrar: verificación de ortografía, sinónimos, auto-completar, Google Instant y métodos de búsqueda, todo esto con el fin de tener más claro el concepto que necesitas.
Basados en estas pistas, se toman las más relevantes, mandándolas a la primera parte (Crawling & Indexing), para que se pueda formar el indice.
Después de esto se hace un ranking de las páginas, tomando en cuenta tu elección y otros 200 factores, en los que se encuentran: la calidad de la página, lo reciente del contenido, el contexto de la búsqueda, idioma (y de ser el caso su traducción), entre otros. Pudiendo presentar la información de distinta manera (versión web, tablet y/o smartphone).

Fighting Spam (Combatiendo el Spam)
Google no cuenta con descanso para esto, ya que las búsquedas se realizan 24/7, por lo que siempre deben estar prevenidos para brindarte los resultados más relevantes.
La mayoría del Spam es eliminado de manera automática, mientras que el resto se examina minuciosamente, para decidir si son resultados posibles o no.
En caso de no serlo, se toman medidas al respecto. Primero se realizan intentos para comunicarse con el dueño del sitio web, dándole la oportunidad de corregir su página y avisar cuando esté lista. De no ser posible la comunicación se remueve de los resultados.

Como pueden ver les explique la búsqueda de una manera sencilla sin meterme muy a fondo con los términos, pero si quieren verlo a detalle, den click en la imagen del post y los llevará directamente a la página, para que puedan informarse un poco más.

No hay comentarios: