Glosario
•
•
•
156
•
•
•
L
lematización
lista de palabras
irrelevantes
P
palabra irrelevante
perfil
Proceso de extracción de la raíz morfológica de una palabra.
En los idiomas, algunas palabras tienen una raíz
morfológica común. Autonomy proporciona algoritmos de
lematización que reducen las palabras a su raíz. Esto es útil
porque permite que los conceptos se ajusten
independientemente del uso gramatical de las palabras. En
inglés, por ejemplo, las palabras "help", "helpful", "helping" y
"helped" pueden implificarse a "help" sin que haya una
pérdida importante de significado.
Autonomy proporciona de serie un conjunto de algoritmos
de lematización para los idiomas más comúnmente
utilizados. la lematización se aplica después de haber
descartado las palabras irrelevantes tanto en el tiempo de
indexación (cuando el contenido se almacena en IDOL
server) como en el tiempo de consulta (el texto de consulta
se detiene y se lematiza antes de que se establezca la
coincidencia).
(También denominada lista de irrelevancias). Lista
(ubicada en el directorio langfiles del servidor) que contiene
palabras comunes (palabras irrelevantes) que IDOL server
no almacena. Palabras como "el" o "a" se usan con
demasiada frecuencia sin carga de significado y IDOL
server no las necesita para comprender el concepto del
texto.
Palabra que aparece en la lista de palabras irrelevantes.
Información sobre un usuario basada en los conceptos de
documentos que el usuario lee. Cada vez que un usuario
obre un documento su perfil se actualiza. Esta característica
le permite alertar a los usuarios de los nuevos documentos
que les interesan (según sus perfiles).
IDOL Guía de inicio