Contenido de la página:
Medidas Complementarias para la Exhaustividad
Relación entre Precisión y Exhaustividad
La exhaustividad, al igual que la precisión, es uno de los conceptos más utilizados en la evaluación de los Sistemas de Recuperación.
Muchos autores, por influencia del término inglés la denominan "recall" (rellamada). Se trata de la proporción de material relevante recuperado, es decir, del total de los documentos que son relevantes en la base de datos, independientemente de si se recuperan o no. Medida inversamente proporcional a la precisión, fue formulada, por Kent, con el nombre de Factor de Exhaustividad. Años más tarde, Swet, la llamó probabilidad condicional de un ítem, y por último, Goffman y Newil, la denominaron sensibilidad.
Salton, propuso la siguiente ecuación:
Exhaustividad = Documentos Relevantes Recuperados / Documentos Relevantes
Tendremos la exhaustividad máxima si el resultado de este cálculo tiene como valor 1, ya que habremos encontrado todo lo relevante que había en la base de datos, sin ruido ni silencio, por lo tanto la recuperación será perfecta. Para lograrlo es necesario utilizar como índice, términos generales de alta frecuencia.
A pesar de lo ideal que sería una precisión y exhaustividad alta en la recuperación de información, lo que Cooper denominó Utilidad Teórica, es un hecho prácticamente imposible.
Podemos representar la Exhaustividad gráficamente, distribuyendo en el eje x, el número de documentos, y en el y, el valor de la exhaustividad calculada para cada uno de ellos. A medida que se eleva el número de documentos recuperados, la exhaustividad aumenta, un comportamiento normal. Teniendo en cuenta esto, los sistemas serán más exhaustivos cuando alcancen al inicio valores altos (próximos a 1), y vayan disminuyendo después.
Aquí vemos un ejemplo:
Korfhage señala las principales objeciones de los sistemas basados en la Exhaustividad y la Precisión:
Existen otra serie de medidas complementarias para la Exhaustividad, en menor medida utilizadas. Veremos un ejemplo:
Complemento del Ratio de Exhaustividad
El primero en formularlo fue Swets en 1963, con el nombre de Probabilidad Condicional de una Pérdida. En 1964, Fairthorne lo denominó Ratio del Esnobismo. Se calcula de la siguiente manera:
Complemento del Ratio de Precisión = Documentos no Relevantes Recuperados / Documentos Recuperados
Para comprobar la compensación entre Precisión y Exhaustividad, es necesario llevar a cabo una serie de cáculos como:
Una vez realizados los cálculos, distribuimos en el eje x los valores correspondientes a la Exhaustividad y en el y, los valores de Precisión que correspondan. Uniendo todos los puntos obtenemos la curva que nos informa del grado de relación existente entre estas dos medidas.
En 1983, Salton y MacGill, elaboraron un nuevo método de evaluación consistente en dar las salidas ordenadas de los documentos en las respuestas. Así, Precisión y Exhaustividad dependían del valor de corte o punto de futilidad (Blair), es decir, del valor a partir del cual los documentos dejaban de interesar al usuario.
Información sobre accesibilidad web para invidentes
Introducción al Posicionamiento
Precisión: Medida de Recuperación de Información
La perspectiva de los usuarios: recuperación de información y usabilidad - Zambrano Silva, Salvador - http://www.um.es/fccd/anales/ad10/ad1026.pdf
Implementación de un sistema de monitorización del posicionamiento en buscadores web - Vicent del Nogal, Javier - 2007
Yahoo! Research Barcelona: Recuperación de Información y Minería Web - Novática: Revista de la Asociación de Técnicos de Informática, Nº. 185 (2006), p. 49-50
Recuperación de información con adversario en la Web - Baeza-Yates, Ricardo - Novática: Revista de la Asociación de Técnicos de Informática, Nº. 185 (2006), p. 29-35
La organización del conocimiento en Internet - Lara Navarra, Pablo - UOC, 2006
Fuente: 20MINUTOS.ES. 10.04.2008 - 21:58h
Cada día millones de personas teclean la dirección de internet de algún buscador e introducen en su caja de búsquedas una o varias palabras. Cada uno desea encontrar cosas diferentes, pero según investigadores estadounidenses todas esas preguntas pueden clasificarse en tres tipos. Los responsables de esta afirmación son Jim Jansen y Danielle Booth, investigadores de la facultad de Ciencias de la Información y la Tecnología de la Universidad de Pensilvania (EE UU). Por primera vez, aseguran, se ha construido un sistema informático que intenta clasificar en diferentes categorías, búsquedas reales realizadas por los internautas. Pueden encuadrarse en tres tipos: búsquedas informacionales, de navegación o transaccionales. La búsqueda informacional implica la necesidad de encontrar datos sobre un hecho o tema concreto, la de navegación persigue hallar un sitio de internet específico, y la transaccional realizar algún tipo de compra o transacción. "Nuestros resultados tienen grandes implicaciones para los buscadores y el comercio electrónico", afirman, pues "podrían clasificar las intenciones del usuario en tiempo real".
Fuente: 20MINUTOS.ES. 10.04.2008 - 21:58h
Los servicios sociales de internet, como blogs, podcast, portales sociales de noticias o redes sociales, viven una explosión en número de usuarios que amenaza el dominio de los medios tradicionales, según un estudio realizado por Universal McCann. Este informe asegura que el 70% de los internautas españoles leen blogs al menos una vez al mes, aunque sólo el 41,4% han escrito en uno. El 44,6% están dados de alta en una red social, y el 64% de ellos las usan al menos una vez a la semana. El 35,4% comparten sus fotos al menos una vez al mes, y el 24,9% usan servicios de video con esa misma frecuencia. Estos datos se desprenden del estudio Social Media Tracker en el que la consultora toma el pulso del consumo de estas herramientas digitales en mercados tan diversos como EE UU, Brasil y Pakistán. Para realizarlo se han realizado 17.000 encuestas. Y confirman que los medios sociales desafían a los medios tradicionales en todo el mundo. En Corea del Sur, por ejemplo, el 77% de los usuarios de internet lee blogs semanalmente mientras que sólo el 58% lee los principales medios tradicionales. En China, el 70% de los internautas escribe en un blog, en Filipinas, un 66% y en México, un 60%. Los mercados que lideran las redes sociales son Filipinas, con 83% de los internautas usándolas, y Hungría y Polonia, con un 76% respectivamente. Según los datos de Universal McCann el 55% de los usuarios de redes sociales comparte fotos, el 22% ha publicado videos y el 31% ha puesto en marcha un blog. La televisión también está afrontando una competencia similar a la de periódicos y revistas, ya que el 83% de los internautas ha visto un videoclip y el 59% lo hace al menos una vez por semana.
Esta página ha sido creada con el objetivo de superar la asignatura Sistemas Avanzados de Recuperación de Información (SARI) del 2º curso de la Licenciatura en Documentación en la Universidad Carlos III de Madrid.
Luna Rojas Sosa, Diplomada en Biblioteconomía y Documentación por la Universidad Carlos III de Madrid.