Exhaustividad en Recuperación de Información o Recall

{Medidas de Evaluación en Recuperación de Información}


Contenido de la página:

La Exhaustividad o Recall

Medidas Complementarias para la Exhaustividad

Relación entre Precisión y Exhaustividad

Enlaces y Bibliografía

Noticias Relacionadas

Información y Contacto


La Exhaustividad o Recall


La exhaustividad, al igual que la precisión, es uno de los conceptos más utilizados en la evaluación de los Sistemas de Recuperación.

Muchos autores, por influencia del término inglés la denominan "recall" (rellamada). Se trata de la proporción de material relevante recuperado, es decir, del total de los documentos que son relevantes en la base de datos, independientemente de si se recuperan o no. Medida inversamente proporcional a la precisión, fue formulada, por Kent, con el nombre de Factor de Exhaustividad. Años más tarde, Swet, la llamó probabilidad condicional de un ítem, y por último, Goffman y Newil, la denominaron sensibilidad.

Salton, propuso la siguiente ecuación:

Exhaustividad = Documentos Relevantes Recuperados / Documentos Relevantes

Tendremos la exhaustividad máxima si el resultado de este cálculo tiene como valor 1, ya que habremos encontrado todo lo relevante que había en la base de datos, sin ruido ni silencio, por lo tanto la recuperación será perfecta. Para lograrlo es necesario utilizar como índice, términos generales de alta frecuencia.

A pesar de lo ideal que sería una precisión y exhaustividad alta en la recuperación de información, lo que Cooper denominó Utilidad Teórica, es un hecho prácticamente imposible.

Podemos representar la Exhaustividad gráficamente, distribuyendo en el eje x, el número de documentos, y en el y, el valor de la exhaustividad calculada para cada uno de ellos. A medida que se eleva el número de documentos recuperados, la exhaustividad aumenta, un comportamiento normal. Teniendo en cuenta esto, los sistemas serán más exhaustivos cuando alcancen al inicio valores altos (próximos a 1), y vayan disminuyendo después.

Aquí vemos un ejemplo:

Korfhage señala las principales objeciones de los sistemas basados en la Exhaustividad y la Precisión:

  • No podemos determinar la precisión de la Exhaustividad sin contar previamente con el número de documentos relevantes, para lo que emplearemos el polling.
  • La Exhaustividad y la Precisión son igualmente significativas para los usuarios. Mientras que unos prefieren una precisión mayor, otros prefieren una exhaustividad más alta, o viceversa, dependiendo del tipo de necesidad informativa.
  • Volver al inicio


    Medidas Complementarias para la Exhaustividad


    Existen otra serie de medidas complementarias para la Exhaustividad, en menor medida utilizadas. Veremos un ejemplo:

    Complemento del Ratio de Exhaustividad

    El primero en formularlo fue Swets en 1963, con el nombre de Probabilidad Condicional de una Pérdida. En 1964, Fairthorne lo denominó Ratio del Esnobismo. Se calcula de la siguiente manera:

    Complemento del Ratio de Precisión = Documentos no Relevantes Recuperados / Documentos Recuperados

    Volver al inicio


    Relación entre Precisión y Exhaustividad


    Para comprobar la compensación entre Precisión y Exhaustividad, es necesario llevar a cabo una serie de cáculos como:

  • Precisión Exhaustividad Interpolada: cálculo de la Exhaustividad de un conjunto de documentos para cada uno de los valores de Precisión.
  • No interpolada: cálculo de la Exhaustividad por tramos de los documentos recuperados.
  • Una vez realizados los cálculos, distribuimos en el eje x los valores correspondientes a la Exhaustividad y en el y, los valores de Precisión que correspondan. Uniendo todos los puntos obtenemos la curva que nos informa del grado de relación existente entre estas dos medidas.

    En 1983, Salton y MacGill, elaboraron un nuevo método de evaluación consistente en dar las salidas ordenadas de los documentos en las respuestas. Así, Precisión y Exhaustividad dependían del valor de corte o punto de futilidad (Blair), es decir, del valor a partir del cual los documentos dejaban de interesar al usuario.

    Volver al inicio


    Enlaces y Bibliografía


    Enlaces relacionados:

    Información sobre accesibilidad web para invidentes

    Robots de búsqueda

    Introducción al Posicionamiento

    Guía XML

    Precisión: Medida de Recuperación de Información

    Tesauros

    Lenguajes de Marcado SGML

    Cloaking

    LAS CLAVES DEL DTD

    Quaero buscador


    Bibliografía:

    La perspectiva de los usuarios: recuperación de información y usabilidad - Zambrano Silva, Salvador - http://www.um.es/fccd/anales/ad10/ad1026.pdf

    Implementación de un sistema de monitorización del posicionamiento en buscadores web - Vicent del Nogal, Javier - 2007

    Yahoo! Research Barcelona: Recuperación de Información y Minería Web - Novática: Revista de la Asociación de Técnicos de Informática, Nº. 185 (2006), p. 49-50

    Recuperación de información con adversario en la Web - Baeza-Yates, Ricardo - Novática: Revista de la Asociación de Técnicos de Informática, Nº. 185 (2006), p. 29-35

    La organización del conocimiento en Internet - Lara Navarra, Pablo - UOC, 2006

    Volver al inicio


    Noticias Relacionadas


    Sólo hay tres tipos de búsqueda en internet

    Fuente: 20MINUTOS.ES. 10.04.2008 - 21:58h

    Cada día millones de personas teclean la dirección de internet de algún buscador e introducen en su caja de búsquedas una o varias palabras. Cada uno desea encontrar cosas diferentes, pero según investigadores estadounidenses todas esas preguntas pueden clasificarse en tres tipos. Los responsables de esta afirmación son Jim Jansen y Danielle Booth, investigadores de la facultad de Ciencias de la Información y la Tecnología de la Universidad de Pensilvania (EE UU). Por primera vez, aseguran, se ha construido un sistema informático que intenta clasificar en diferentes categorías, búsquedas reales realizadas por los internautas. Pueden encuadrarse en tres tipos: búsquedas informacionales, de navegación o transaccionales. La búsqueda informacional implica la necesidad de encontrar datos sobre un hecho o tema concreto, la de navegación persigue hallar un sitio de internet específico, y la transaccional realizar algún tipo de compra o transacción. "Nuestros resultados tienen grandes implicaciones para los buscadores y el comercio electrónico", afirman, pues "podrían clasificar las intenciones del usuario en tiempo real".


    La red social desafía al medio tradicional

    Fuente: 20MINUTOS.ES. 10.04.2008 - 21:58h

    Los servicios sociales de internet, como blogs, podcast, portales sociales de noticias o redes sociales, viven una explosión en número de usuarios que amenaza el dominio de los medios tradicionales, según un estudio realizado por Universal McCann. Este informe asegura que el 70% de los internautas españoles leen blogs al menos una vez al mes, aunque sólo el 41,4% han escrito en uno. El 44,6% están dados de alta en una red social, y el 64% de ellos las usan al menos una vez a la semana. El 35,4% comparten sus fotos al menos una vez al mes, y el 24,9% usan servicios de video con esa misma frecuencia. Estos datos se desprenden del estudio Social Media Tracker en el que la consultora toma el pulso del consumo de estas herramientas digitales en mercados tan diversos como EE UU, Brasil y Pakistán. Para realizarlo se han realizado 17.000 encuestas. Y confirman que los medios sociales desafían a los medios tradicionales en todo el mundo. En Corea del Sur, por ejemplo, el 77% de los usuarios de internet lee blogs semanalmente mientras que sólo el 58% lee los principales medios tradicionales. En China, el 70% de los internautas escribe en un blog, en Filipinas, un 66% y en México, un 60%. Los mercados que lideran las redes sociales son Filipinas, con 83% de los internautas usándolas, y Hungría y Polonia, con un 76% respectivamente. Según los datos de Universal McCann el 55% de los usuarios de redes sociales comparte fotos, el 22% ha publicado videos y el 31% ha puesto en marcha un blog. La televisión también está afrontando una competencia similar a la de periódicos y revistas, ya que el 83% de los internautas ha visto un videoclip y el 59% lo hace al menos una vez por semana.

    Volver al inicio


    Información y Contacto


    Esta página ha sido creada con el objetivo de superar la asignatura Sistemas Avanzados de Recuperación de Información (SARI) del 2º curso de la Licenciatura en Documentación en la Universidad Carlos III de Madrid.

    Luna Rojas Sosa, Diplomada en Biblioteconomía y Documentación por la Universidad Carlos III de Madrid.

    100053055@alumnos.uc3m.es

    Volver al inicio