Buscar este blog

jueves, 20 de mayo de 2010

INDEXACION

El proceso de recuperación de información consiste esencialmente en extraer de unacolección de documentos aquellos que se ajustan a las especificaciones de un peticióndeterminada. Se trata pues de una comparación sistemática entre los documentos o susrepresentaciones y la petición o demanda de información. Podemos descomponer el procesoen tres fases:* Traducción del documento en un lenguaje de indexación. La expresión queresulta de este proceso se llama modelo de búsqueda del documento. Se tratade representar el documento por una serie de descriptores que lo determinen lomás directamente posible para su posterior indexacion búsqueda.* Expresión de la petición de información en el mismo lenguaje del modelo debúsqueda. Se obtiene el denominado perfil de búsqueda.* Comparación sistemática de los modelos de búsqueda de los documentos con elperfil de búsqueda, a fin de seleccionar los que se ajusten a este.La operación resultaría relativamente sencilla si los lenguajes de indexación y debúsqueda coincidieran exactamente. Ello, sin embargo, no es así en la mayoría de los casos,ya que los productores de bases de datos y repertorios bibliográficos suelen indexar enlenguaje libre o semilibre, lo que resulta mucho más fácil y económico para sus fines. Por tanto,al seleccionar los descriptores para la búsqueda, habrá que tener en cuenta todas lasposibles formas de expresión de un concepto en la indexación de los documentos (sinónimos,conceptos más generales y más específicos, etc.) ya que de otro modo podrían perdersecantidades importantes de información. Por otra parte, si la selección es demasiado amplia, seobtendrán documentos carentes de interés. De ahí la importancia de preparar adecuadamenteel perfil de búsqueda, operación que resulta así la mas importante en el proceso de indexacion recuperación de información.

No hay comentarios:

Publicar un comentario