vicente.lopez
upf.edu
Plan de Investigación:
Actualmente la Web es el repositorio de información más grande y a la vez
más dinámico del mundo. Por lo tanto es un desafío importante mejorar y desarrollar técnicas de recuperación
y extracción de información de la Web. Esto implica distintos tipos de datos: texto, semi-estructurado, imágenes, audio, etc;
y también aprovechar la estructura hipertextual de la Web y el comportamiento de las personas que queda registrado en las bitácoras
de los servidores Web y de aplicaciones Web específicas como los buscadores.
Por lo tanto el ámbito de actividad incluye cualquier problema que permita entender mejor la Web, como aprovechar la información
que contiene y facilitar el acceso a ella.