9 de diciembre de 2008

LOS MOTORES DE BÚSQUEDA

(Realizado por David Izquierdo y Ana Fdez).

Los utilizamos a diario para ampliar nuestro conocimiento sobre diversas materias: ciencia, política, actualidad, cultura... Pero con frecuencia confundimos unos con otros y, como resultado, perdemos mucho tiempo en navegar por todos los sitios web que se nos ponen a tiro pudiendo dar por finalizada nuestra búsqueda en un solo click. Por ello, este artículo tiene como objetivo aclarar las funciones de cada motor de búsqueda para hacernos la vida un poquito más fácil.


¿Cómo podríamos definir 'motor de búsqueda'?

Los motores de busqueda (search engines, SE) son bases de datos gigantescas que contienen información sobre el contenido de los sitios webs que integran la web. Las búsquedas se hacen con palabras clave o con árboles jerárquicos por temas; el resultado de la búsqueda es un listado de direcciones web en los que se mencionan temas relacionados con las palabras clave buscadas. Se pueden clasificar en dos tipos:
  • Índices temáticos: Son sistemas de búsquedas por temas o categorías jerarquizados (aunque también suelen incluir sistemas de exploración por palabras clave). Se trata de bases de datos de direcciones webs elaboradas manualmente, es decir, hay personas que se encargan de asignar cada página web a una categoría o tema determinado.
  • Motor de búsqueda: Son sistemas de búsquedas por palabras claves. Son bases de datos que incorporan automáticamente páginas web mediante robots de búsqueda en la red. Estos programas a su vez se dividen en: Buscadores jerárquicos (spiders o arañas), directorio, buscador mixto, metabuscador, FFA (free for all o enlaces gratuitos para todos, buscador de portal y buscador vertical. Que a continuación explicamos.

¿Qué es un spider?

Los spiders (arañas) son grandes buscadores internacionales que requieren de muchos recursos para su funcionamiento. Reúnen información sobre la mayoría de las páginas web. En el momento de realizar una búsqueda, dicho buscador recurre a su propia base de datos y ordena todas las páginas web que se vinculan a la búsqueda por su relevancia, la cual está en función del número de hipervínculos que cada una de las páginas contiene. Además hay otros factores que intervienen como por ejemplo el tráfico, el tipo de web y la información que ésta contiene. Otro factor importante consiste en el pago al motor de búsqueda por parte de la entidad que se anuncia en Internet. Es decir, imaginemos una empresa como Telefónica que paga a Google (al spider) para que cuando el usuario busque asuntos relacionados con la telefonía, la primera entrada sea las ofertas de Telefónica, en el caso de que dicha empresa sea la que más dinero ha invertido para aparecer en primera posición. Si, por el contrario es ONO la que más ha pagado, será ésta la que ocupe ese lugar. Sin embargo, debemos tener en cuenta que el usuario también debe elegir la opción que más se ajuste a sus necesidades.

Se suelen dividir en tres partes. La primera está formada por los programas que exploran la red, que son los denominados propiamente spiders. La segunda parte se encarga de construir la base de datos. Por último, hay una tercera parte destinada al usuario, que es el programa que explora la base de datos.

Para restringir la búsqueda aún más, hay buscadores como Google que ofrecen la opción de realizar una "Búsqueda avanzada" en la que se puede elegir que se muestren solamente resultados que contengan la frase exacta, todas las palabras o incluso la fecha o los dominios de la búsqueda en cuestión, entre otras sugerencias.

A continuación se muestra una slide con los logos de los spiders mas importantes:




¿Cómo distinguimos un directorio de un spider?

La diferencia fundamental entre un buscador (spider) y un directorio es que los directorios están estructurados por temas. Para encontrar los sitios web que están incluidos en el directorio de Yahoo, por ejemplo, hay que pinchar en las diferentes categorías y ver los sitios incluidos en las mismas, navegando por las subcategorías temáticas organizadas por los catalogadores de Yahoo.

Por ejemplo, si lo que se está buscando es información acerca de las elecciones norteamericanas en el directorio de Yahoo, habría que dirigirse a la categoría de "Estados Unidos de Norteamérica", después a la subcategoría de "Política" y después hacer click en el link que más se ajuste a la búsqueda.

En el directorio de Yahoo también se pueden realizar búsquedas mediante palabras claves. Si, a colación del ejemplo anterior, se quiere ir a algo más concreto, se puede teclear en la barra de búsqueda "Elecciones EEUU". Se realice como se realice la búsqueda, el resultado será una lista completa de los todos los sitios clasificados temáticamente.

La gestión del directorio se lleva a cabo por los catalogadores que son operadores humanos que no incluyen todas las páginas del sitio web, sino su página principal en la categoría apropiada. Es decir, la Universidad Autónoma de Madrid está en la categoría de Universidades de la Comunidad de Madrid y su Facultad de Derecho está catalogada dentro de la "Universidad Autónoma de Madrid".

Los buscadores, sin embargo, suelen utilizar programas automatizados (robots) que rastrean el contenido de Internet, página por página, guardando toda la información que van encontrando. Al realizar la búsqueda, los resultados obtenidos son un índice de páginas que contienen la palabra clave introducida.

Según su uso, también se encuentran diferencias entre ambos motores de búsqueda. Para buscar un sitio en concreto y si se sabe su nombre, lo más recomendable es la utilización de un directorio. Si se busca una lista completa de sitios con la misma temática, el directorio también es lo más eficiente, asimismo.

En cambio, si lo que se está buscando es una página específica dentro de un sitio, es preferible el uso de un buscador.

Corrigiendo la idea equivocada que tiene la mayor parte de la población española sobre que google es el mejor programa para buscar información en la web, podemos decir, que no hay un motor de búsqueda mejor que otro, ya que esto depende del tipo de información que necesita hallar cada persona, por ejemplo, si queremos encontrar información concreta en páginas de una web como la frase: humor sobre políticos, aunque la temática de la página no sea de humor, el mejor explorador sería el que utiliza la mayor parte de la población mundial, google (mejor spider), pero sin embargo estuvieramos buscando una web de una determinada temática como por ejemplo humor, el mejor programa sería yahoo (considerando que sea el mejor directorio).


¿Qué es un buscador mixto?

Son una mezcla entre spider y directorio, que además de tener características de buscadores, presentan las webs registrdas en catálogos sobre contenidos (informática, cultura, sociedad, deporte). Que a su vez se dividen en subsecciones.

Son ejemplos de este tipo de programa: Excite, Voila, Infoseek y altavista. Éste último paso de ser un spider a un buscador mixto.



Hace poco surgió Yagoohoogle un buscador mixto entre Google y Yahoo, que reune la información que proporciona el mejor directorio actual (Yahoo) y el mejor spider del momento (Google), presentandote la información de respuesta de la búsqueda de Google a un lado y la de Yahoo al otro.


¿Qué es un metabuscador?

Es una clase de buscador que
carece de base de datos propia y, en su lugar, usa la de otros buscadores y muestra una combinación de las mejores páginas que ha devuelto cada buscador. Se define metabuscador como buscador de otros buscadores.

Dichos sistemas de búsqueda presentan beneficios con los otros programas, pero también aspectos negativos:


  • Ventajas: Amplían de forma notoria el ámbito de las búsquedas que realizamos, proporcoonando mayor cantidad de resultados. La forma de combinar los resultados depende del metabuscador empleado. Cada empresa utiliza su propia estrategia a la hora de recoger información de una página y a la hora de ordenar los resultados de las búsquedas. Debido a la subjetividad no todos los metabuscadores tienen en común las páginas que consideran importantes. Lo citado con anterioridad es positivo ya que se presentan puntos de vista distintos.

  • Inconvenientes: Al tener que buscar en varias fuentes las búsquedas suelen tardar mas que con buscadores normales. Cada buscador dispone de su propia sintaxis de búsqueda y en el metabuscador no se puede hacer distinción entre las diferentes sintaxis de cada buscador.
A continuación se muestra una slide con los logos de los diferentes metabuscadores:




¿Qué es un buscador de portal?

Son los buscadores específicos de sitio, los que buscan información solo en su portal o en su sitio web. Se consideran un directorio.

El mas conocido es Visual Finder que ofrece una serie de ventajas frente a los buscadores de portal tradicionales:


  • Disminuye los clicks necesarios, hasta 8 veces menos.

  • Las búsquedas se hacen sencillas sin la necesaria utulización de traducciones Booleanas.

  • Evita la navegación ciega.

  • Incrementa la relevancia natural en los buscadores.


¿Qué es un buscador vertical?











Un buscador vertical, es un buscador especializado en un sector o nicho concreto, lo que le permite analizar la información con mayor profundidad que un buscador genérico, disponer de resultados más actualizados y ofrecer al usuario herramientas de búsqueda avanzadas.

Aunque su mayor uso es reciente, en realidad hace ya mucho que existen.

Los buscadores verticales envian sus robots a un número limitado de páginas web sobre un tema concreto, lo que permite que tanto la obtención de la información como la creación del índice sean más especializados en el sector del que se trata. Al tratarse de un número de fuentes más reducido que un buscador genérico los buscadores verticales pueden también actualizar su información con mayor frecuencia. Adicionalmente, un buscador vertical ofrece a los usuarios mecanismos de búsqueda avanzada específicamente diseñados para el sector.

Los buscadores verticales suponen una nueva generación después de los modelos de búsqueda horizontal como google o yahoo. La revista Business week ha clasificado los buscadores verticales como parte de un "renacimiento tecnológico".


¿Qué es un FFA?

Un FFA o Enlace gratuito (en inglés Free For All) es una página de enlece gratuito para todos. Cualquiera puede inscribir su página durante un tiempo limitado en estos pequeños directorios.

A continuación se muestra un video de como añadir a firefox nuestro motor de búsqueda:

2 comentarios:

VÍCTOR dijo...

- Excelente y clarificadora introducción.
- Uso correcto del lenguaje.
- Usar herramientas como Slide sube puntos.
- Es conveniente, por razones puramente estéticas, evitar los distintos tipos de letra.
- Además de dar los nombres hubiera sido interesante hipervincularlos y así los lectores de vuestro artículo accederían directamente a los buscadores que mencionáis.
- Metódico y trabajado artículo.

Pablo dijo...

Muy completo, ademas aclara todos los terminos que aparecen, lo que ayuda sobremanera a la compresión del artículo