Se presentan en este apartado algunas de las líneas en las que estamos trabajando actualmente y que por su grado de ocupación están generando algún producto que será publicado a corto/medio plazo:
- Comparación de textos de diferentes tamaños con las técnicas "centroide" y "Fold-in"
Se trata de poner a prueba la resistencia de ambas técnicas comparando pseudodocumentos de un tamaño variable bajo el supuesto de que al aumentar el tamaño de los pseudocumentos las comparaciones basadas en el coseno aumentarán de una manera más acusada en centroide que en "Fold-in". Además, se analiza
la intervención de la primera dimensión en dicho efecto. Cotejar la validez de este tipo de técnicas es de suma utilidad dada la diferencia en consumo de recursos computacionales entre ambas.
- Distintos parámetros en la creación de autotutores LSA
a) Alumnos de universidad (facultad Psicología): Se emplean corpus específicos de dominio de tamaños pequeños y medianos formados por textos extremadamente estructurados o poco estructurados o la suma de ambos. Sobre estos corpus se ponen a prueba diferentes espacios semánticos formados bajo distintos parámetros. Estos parámetros comprenden la forma de preproceso (purgas y medidas de importancia de los términos), la reducción de dimensiones en porcentaje, la forma de construir pseudodocumetos (centroide y Fold-in) y las medidas de similitud de los textos (cosenos o distancias euclideas). Los alumnos evaluados componen dos grupos, uno de expertos y otro de no-expertos. Ambos grupos contestan a una pregunta abierta que será evaluada por el sistema LSA bajo todos y cada uno de los espacios y también por un grupo de evaluadores humanos. Por medio de un ANOVA se evalúan que parámetros de los espacios aportan más correlación al criterio humano.
b) Alumnos de
Primaria, ESO y Universidad: resúmenes realizados por alumnos de diferentes cursos académicos. Se buscan también qué parámetros mejoran la evaluación de los resúmenes comparándose las evaluaciones del LSA con otras hechas por jueces expertos. Ver primeros resultados en [PDF] .
- Discriminación entre distintos tonos emocionales.
Segmentos de texto con un estilo emocional optimista, y segmentos de texto con un estilo emocional depresivo son puestos a prueba bajo diferentes técnicas entre ellas LSA y Conglomerados (clusters).